Naklon regresijske premice in korelacijski koeficient
Emely / Getty Images
Velikokrat v študijistatistikapomembno je vzpostaviti povezave med različnimi temami. Videli bomo primer tega, v katerem je naklon regresijske črte neposredno povezan z korelacijski koeficient . Ker oba pojma vključujeta ravne črte, je povsem naravno, da si zastavimo vprašanje: »Kako sta korelacijski koeficient in premica najmanjšega kvadrata povezano?'
Najprej si bomo ogledali nekaj ozadja v zvezi z obema temama.
Podrobnosti o korelaciji
Pomembno si je zapomniti podrobnosti v zvezi s korelacijskim koeficientom, ki je označen z r . Ta statistika se uporabi, ko se seznanimoseznanjeni podatki, lahko iščemo trende v splošni porazdelitvi podatkov. Nekateri seznanjeni podatki kažejo linearni ali ravni črtni vzorec. Toda v praksi podatki nikoli ne padejo natančno vzdolž ravne črte.
Več ljudi gleda isto graf raztrosa seznanjenih podatkov se ne bi strinjali glede tega, kako blizu je bilo prikazu splošnega linearnega trenda. Navsezadnje so lahko naša merila za to nekoliko subjektivna. Lestvica, ki jo uporabljamo, lahko vpliva tudi na naše dojemanje podatkov. Zaradi teh in drugih razlogov potrebujemo nekakšno objektivno merilo, da ugotovimo, kako blizu so naši seznanjeni podatki linearnosti. To nam doseže korelacijski koeficient.
Nekaj osnovnih dejstev o r vključujejo:
- Vrednost r se giblje med poljubnim realnim številom od -1 do 1.
- Vrednote r blizu 0 pomeni, da med podatki ni linearne povezave le malo ali nič.
- Vrednote r blizu 1 pomeni, da obstaja pozitivna linearna povezava med podatki. To pomeni, da kot x to poveča Y se tudi poveča.
- Vrednote r blizu -1 pomeni, da med podatki obstaja negativno linearno razmerje. To pomeni, da kot x to poveča Y zmanjša.
Naklon črte najmanjših kvadratov
Zadnja dva elementa na zgornjem seznamu nas usmerita proti naklonu premice najmanjših kvadratov, ki se najbolje prilega. Spomnimo se, da je naklon črte merilo, za koliko enot gre navzgor ali navzdol za vsako enoto, ki jo premaknemo v desno. Včasih je to navedeno kot dvig črte, deljen s tekom, ali sprememba Y vrednosti, deljene s spremembo v x vrednote.
Na splošno imajo ravne črte naklone, ki so pozitivni, negativni ali nič. Če bi pregledali naše regresijske črte najmanjšega kvadrata in primerjali ustrezne vrednosti r , bi opazili, da vsakič, ko imajo naši podatki a negativni korelacijski koeficient , je naklon regresijske črte negativen. Podobno je vsakič, ko imamo pozitiven korelacijski koeficient, naklon regresijske črte pozitiven.
Iz tega opazovanja bi moralo biti razvidno, da zagotovo obstaja povezava med predznakom korelacijskega koeficienta in naklonom črte najmanjših kvadratov. Treba je še pojasniti, zakaj je to res.
Formula za naklon
Razlog za povezavo med vrednostjo r in naklon črte najmanjših kvadratov je povezan s formulo, ki nam poda naklon te črte. Za seznanjene podatke ( x,y ) označujemo standardni odklon od x podatki po sx in standardno deviacijo Y podatki po sY .
Formula za naklon a regresijske črte je:
- a = r(sY/sx)
Izračun standardnega odklona vključuje vzetje pozitivnega kvadratnega korena nenegativnega števila. Posledično morata biti oba standardna odklona v formuli za naklon nenegativni. Če predpostavimo, da je v naših podatkih nekaj variacij, bomo lahko zanemarili možnost, da je kateri koli od teh standardnih odklonov enak nič. Zato bo predznak korelacijskega koeficienta enak predznaku naklona regresijske črte.