coeficientul de corelatie pearson
DESCRIPTION
pearsonTRANSCRIPT
Coeficientul de corelatie Coeficientul de corelatie PearsonPearson
IntroducereIntroducere Notele Z fac posibila analiza legaturii Notele Z fac posibila analiza legaturii
dintre doua variabiledintre doua variabile Corelatia indica existenta unei legaturi Corelatia indica existenta unei legaturi
intre variabile, legatura care poate fi:intre variabile, legatura care poate fi: Pozitiva: Pozitiva:
Scoruri mari -> Scoruri mariScoruri mari -> Scoruri mari Scoruri medii -> Scoruri mediiScoruri medii -> Scoruri medii Scoruri mici -> Scoruri miciScoruri mici -> Scoruri mici
NegativaNegativa Scoruri mari -> Scoruri miciScoruri mari -> Scoruri mici Scoruri medii -> Scoruri mediiScoruri medii -> Scoruri medii Scoruri mici -> Scoruri mariScoruri mici -> Scoruri mari
Poate sa nu apara nicio legaturaPoate sa nu apara nicio legatura
IntroducereIntroducere
Coeficientul de corelatie = rCoeficientul de corelatie = r si si indica gradul in care apare patternul indica gradul in care apare patternul unei relatii intre cele doua variabile;unei relatii intre cele doua variabile; r r ϵϵ [-1; +1] [-1; +1] Corelatie pozitiva r Corelatie pozitiva r ϵϵ (0; +1] (0; +1] Corelatie negativa r Corelatie negativa r ϵϵ [-1; 0) [-1; 0) Lipsa corelatie r = 0Lipsa corelatie r = 0
Painea este periculoasaPainea este periculoasa Avertisment important pentru consumatorii de paineAvertisment important pentru consumatorii de paine
1. Mai mult de 98% dintre detinutii condamnati sunt consumatori 1. Mai mult de 98% dintre detinutii condamnati sunt consumatori de paine.de paine.
2. Aproape JUMATATE dintre copiii care cresc in gospodarii unde se 2. Aproape JUMATATE dintre copiii care cresc in gospodarii unde se consuma paine au scoruri sub medie la testele standardizate.consuma paine au scoruri sub medie la testele standardizate.
3. In secolul 18, cand aproape toata painea se cocea acasa, 3. In secolul 18, cand aproape toata painea se cocea acasa, speranta medie de viata era de 50 de ani; ratele de moarte speranta medie de viata era de 50 de ani; ratele de moarte spontana erau inacceptabil de mari; numeroase femei mureau la spontana erau inacceptabil de mari; numeroase femei mureau la nastere; si boli precum febra tifoida, febra galbena si gripa faceau nastere; si boli precum febra tifoida, febra galbena si gripa faceau ravagii in intreaga populatie. ravagii in intreaga populatie.
4. Mai mult de 90% dintre crimele violente sunt comise la mai 4. Mai mult de 90% dintre crimele violente sunt comise la mai putin de 24 de ore de la consumul de paine. putin de 24 de ore de la consumul de paine.
5. Painea este realizata dintr-o substanta numita aluat. S-a dovedit 5. Painea este realizata dintr-o substanta numita aluat. S-a dovedit ca 500 de grame de aluat sunt suficiente pentru a sufoca un ca 500 de grame de aluat sunt suficiente pentru a sufoca un soarece. Romanul mediu consuma mai mult decat aceasta soarece. Romanul mediu consuma mai mult decat aceasta cantitate intr-o luna. cantitate intr-o luna.
Painea este periculoasaPainea este periculoasa 6. Triburile primitive care nu consumau paine prezinta o 6. Triburile primitive care nu consumau paine prezinta o
incidenta scazuta a cancerului, boala Alzheimer, Parkinson si incidenta scazuta a cancerului, boala Alzheimer, Parkinson si osteoporoza.osteoporoza.
7. S-a dovedit ca painea da dependenta. Subiectii care au fost 7. S-a dovedit ca painea da dependenta. Subiectii care au fost privati de paine si carora li s-a dat doar apa au implorat pentru privati de paine si carora li s-a dat doar apa au implorat pentru paine dupa numai doua zile.paine dupa numai doua zile.
8. Sugarii se pot ineca de la paine. 8. Sugarii se pot ineca de la paine. 9. Majoritatea romanilor care consuma paine nu pot distinge 9. Majoritatea romanilor care consuma paine nu pot distinge
intre date stiintifice semnificative si aberatii statistice fara intre date stiintifice semnificative si aberatii statistice fara sens. sens.
In lumina acestor statistici inspaimantatoare, recomandam In lumina acestor statistici inspaimantatoare, recomandam urmatoarele restrictii:urmatoarele restrictii: Sa nu se vanda paine minorilor.Sa nu se vanda paine minorilor. O campanie nationala “Spuneti nu painii!” completata cu O campanie nationala “Spuneti nu painii!” completata cu
sustinerea unor celepritati TV si cu abtibilduri.sustinerea unor celepritati TV si cu abtibilduri. O taxa de 300% pe toata productia de paine care sa fie O taxa de 300% pe toata productia de paine care sa fie
directionata pentru prevenirea bolilor care sunt asociate cu painea.directionata pentru prevenirea bolilor care sunt asociate cu painea. Stabilirea zonelor fara paine in jurul scolilor.Stabilirea zonelor fara paine in jurul scolilor.
IntroducereIntroducere
!!!Observatie:!!!Observatie: analiza corelatiei dintre analiza corelatiei dintre doua variabile nu permite stabilirea doua variabile nu permite stabilirea relatiei de cauzalitate intre aceste relatiei de cauzalitate intre aceste variabile.variabile.
Fie x poate fi cauza pt yFie x poate fi cauza pt y Fie y poate fi cauza pt xFie y poate fi cauza pt x Fie a aparut o a treia var care a determinat Fie a aparut o a treia var care a determinat
aparitia simultana a celor doua variabileaparitia simultana a celor doua variabile
Pragul de semnificatie (p)Pragul de semnificatie (p)
Pragul de semnificatie p, ne indica in ce Pragul de semnificatie p, ne indica in ce masura ne inselam atunci cand afirmam ceva.masura ne inselam atunci cand afirmam ceva.
In cazul corelatiei p indica daca exista o In cazul corelatiei p indica daca exista o legatura intre doua sau mai multe variabile.legatura intre doua sau mai multe variabile.
In cercetarea stiintifica se lucreaza de obicei In cercetarea stiintifica se lucreaza de obicei cu doua praguri de semnificatie, cu doua praguri de semnificatie, corespunzatoare procentajului de eroarecorespunzatoare procentajului de eroare p ≤ 0.010 (gresim in mai putin de 1% din cazuri)p ≤ 0.010 (gresim in mai putin de 1% din cazuri) P ≤ 0.050 (gresim in mai putin de 5% din cazuri)P ≤ 0.050 (gresim in mai putin de 5% din cazuri)
Tipuri de eroareTipuri de eroare
EvenimentulEvenimentul
ApareApare Nu apareNu apare
Predictia Predictia evenimeevenime
ntuluintului
Apare Apare CorectCorectEroarea I Eroarea I (minciuna(minciuna
))
Nu apareNu apareEroarea IIEroarea II
(ignoranta(ignoranta))
CorectCorect
Tipuri de ipotezeTipuri de ipoteze
Ipoteze non-directionale:Ipoteze non-directionale: nu se nu se precizeaza tipul de relatie intre precizeaza tipul de relatie intre variabile.variabile. Probabilitatea de eroare se imparte la Probabilitatea de eroare se imparte la
cele doua extremitati ale distributiei => cele doua extremitati ale distributiei => test de semnificatie TWO TAILEDtest de semnificatie TWO TAILED
Ex: Exista o legatura intre salariul initial Ex: Exista o legatura intre salariul initial si cel final al subiectilor.si cel final al subiectilor.
Tipuri de ipotezeTipuri de ipoteze
Ipoteze directionale:Ipoteze directionale: sunt cele in care sunt cele in care se precizeaza tipul de relatie, se precizeaza tipul de relatie, cercetatorul se astepta la un anumit cercetatorul se astepta la un anumit rezultat.rezultat. Probabilitatea de eroare se stabileste la una Probabilitatea de eroare se stabileste la una
din extremitatile distributiei.din extremitatile distributiei. Testul de semnificatie este ONE – TAILEDTestul de semnificatie este ONE – TAILED Ex: Legatura dintre slariul initial si final este Ex: Legatura dintre slariul initial si final este
pozitiva, cu cat salariul initial este mai mare pozitiva, cu cat salariul initial este mai mare cu atat salariul final va fi mai mare.cu atat salariul final va fi mai mare.
Calcularea corelatiei Pearson cu Calcularea corelatiei Pearson cu ajutoru SPSSajutoru SPSS
Baza de date: sondaj cu privire la dormitoarele de Baza de date: sondaj cu privire la dormitoarele de camincamin
S-au adunat raspunsuri de la chestionarele a cinci S-au adunat raspunsuri de la chestionarele a cinci intrebari privind conditiile din dormitoarele de camin intrebari privind conditiile din dormitoarele de camin de la 10 studenti de anul I.de la 10 studenti de anul I.
Chestionarul evalueaza atitudinea fata de zgomot, Chestionarul evalueaza atitudinea fata de zgomot, mobila, zona de studiu, si intimitatea precum si mobila, zona de studiu, si intimitatea precum si nivelul venitului parintilor acestor studenti.nivelul venitului parintilor acestor studenti.
Ipoteza: Exista o legatura intre gradul de satisfactie Ipoteza: Exista o legatura intre gradul de satisfactie fata de mediul de locuit al universitatii si situatia fata de mediul de locuit al universitatii si situatia materiala a studentilor.materiala a studentilor.
Chestionarul contine cinci intrebari cu privire la Chestionarul contine cinci intrebari cu privire la satisfactie. Acestora li s-au dat raspunsuri pe o scara satisfactie. Acestora li s-au dat raspunsuri pe o scara de 5 puncte gen Likert (de la foarte nemultumit pana de 5 puncte gen Likert (de la foarte nemultumit pana la foarte multumit).la foarte multumit).
Pasul 1.Pasul 1. Da click pe Analyze Da click pe Analyze (analizeaza), apoi Correlate (analizeaza), apoi Correlate (coreleaza), apoi Bivariate (coreleaza), apoi Bivariate (bidimensional).(bidimensional).Pasul 2.Pasul 2. Muta variabilele pe care Muta variabilele pe care doresti sa le corelezi in campul doresti sa le corelezi in campul Variables (variabile).Variables (variabile).Pasul 3.Pasul 3. Daca doresti sa listezi mediile Daca doresti sa listezi mediile si abaterile standard, da apoi click pe si abaterile standard, da apoi click pe Options si selecteaza statisticile dorite.Options si selecteaza statisticile dorite. Apoi da click pe Continue si apoi pe OK. Apoi da click pe Continue si apoi pe OK.
Calcularea corelatiei Pearson cu Calcularea corelatiei Pearson cu ajutoru SPSSajutoru SPSS
Correlations
nivel venit parinti in miisatisfactie nivel zgomot in
camin
nivel venit parinti in mii Pearson Correlation 1 -.772**
Sig. (2-tailed)
. .009
N 10 10
satisfactie nivel zgomot in camin Pearson Correlation -.772** 1
Sig. (2-tailed)
.009
N10 10
**. Correlation is significant at the 0.01 level (2-tailed).
1
2 34 5
Explicare outputExplicare output Randul 1:Randul 1: Pearson correlation – valorile Pearson correlation – valorile
coeficientilor de corelatie dintre doua coeficientilor de corelatie dintre doua variabilevariabile
Randul 2:Randul 2: Sig (2 –TAILED) probabilitatea de Sig (2 –TAILED) probabilitatea de eroare la respingerea ipotezei de nul si eroare la respingerea ipotezei de nul si acceptarea ipotezei de cercetareacceptarea ipotezei de cercetare
Randul 3:Randul 3: N contine numarul de subiecti N contine numarul de subiecti care au scoruri la ambele variabilecare au scoruri la ambele variabile
Celula 4:Celula 4: corelatia dintre var venit parinti corelatia dintre var venit parinti cu ea insasi; corelatie perfecta dar lipsita de cu ea insasi; corelatie perfecta dar lipsita de semnificatiesemnificatie
Celula 5:Celula 5: corelatia dintre var zgomot si var corelatia dintre var zgomot si var venit parintivenit parinti
Interpretare outputInterpretare output
Semnul corelatiei: Semnul corelatiei: arata natura legaturiiarata natura legaturii r>0 r>0 => legatura pozitiva; scorurile => legatura pozitiva; scorurile micimici de la de la
prima var. se asociaza cu scorurile prima var. se asociaza cu scorurile micimici de la a 2a de la a 2a var.; sc. var.; sc. mediimedii de la prima var. se asociaza cu sc. de la prima var. se asociaza cu sc. mediimedii de la a 2a var.; sc. de la a 2a var.; sc. marimari de la prima var. se de la prima var. se asociaza cu sc. asociaza cu sc. marimari de la a 2a var. de la a 2a var.
r<0r<0 => legatura negativa; scorurile => legatura negativa; scorurile micimici de la de la prima var. se asociaza cu scorurile prima var. se asociaza cu scorurile marimari de la a 2a de la a 2a var.; sc. var.; sc. mediimedii de la prima var. se asociaza cu sc. de la prima var. se asociaza cu sc. medii medii de la a 2a var.; sc. de la a 2a var.; sc. marimari de la prima var. se de la prima var. se asociaza cu sc. asociaza cu sc. micimici de la a 2a var. de la a 2a var.
Interpretare outputInterpretare output
Marimea absoluta a Marimea absoluta a coeficientului:coeficientului: descrie taria descrie taria legaturii care apare intre variabile.legaturii care apare intre variabile.
|r| < 0.30|r| < 0.30 => legatura slaba => legatura slaba 0.30 < |r| < 0.500.30 < |r| < 0.50 => legatura medie => legatura medie |r| > 0.50|r| > 0.50 => legatura puternica => legatura puternica
Interpretare outputInterpretare output
Pragul de semnificatie:Pragul de semnificatie:
p ≤ 0.050 => exista o relatie p ≤ 0.050 => exista o relatie semnificativa intre cele 2 var. semnificativa intre cele 2 var. (probabilitatea de a gresi este mai mica (probabilitatea de a gresi este mai mica de 5%)de 5%)
!Obs: p = .000 => p<0.001; p<0.01!Obs: p = .000 => p<0.001; p<0.01 P > 0.050 => nu exista o relatie P > 0.050 => nu exista o relatie
semnificativa intre cele doua variabilesemnificativa intre cele doua variabile
Interpretare outputInterpretare output
Proportia de variantaProportia de varianta = r = r² explica la ce procent din populatie apare relatia
Relatia gasita este prezenta la x% din populatie
Rezolvare exercitiuRezolvare exercitiu r = - 0.772r = - 0.772 p = 0.009 < 0.01p = 0.009 < 0.01 N = 10N = 10 Semnul corelatiei:Semnul corelatiei: r = - 0.772 < 0; r = - 0.772 < 0; semnul semnul
este negativeste negativ => => legatura dintre var legatura dintre var venit parinti si var zgomot este venit parinti si var zgomot este negativanegativa ceea ce inseamna ca un venit ceea ce inseamna ca un venit ridicat al parintilor se asociaza cu un nivel ridicat al parintilor se asociaza cu un nivel scazut al satisfactiei la zgomot, un venit scazut al satisfactiei la zgomot, un venit mediu al parintilor se asociaza cu un nivel mediu al parintilor se asociaza cu un nivel mediu al satisfactiei la zgomot si un nivel mediu al satisfactiei la zgomot si un nivel scazut al venitului parintilor se asociaza cu scazut al venitului parintilor se asociaza cu un nivel ridicat al satisfactiei la zgomot.un nivel ridicat al satisfactiei la zgomot.
Rezolvare exercitiuRezolvare exercitiu
Marimea absoluta a coef de Marimea absoluta a coef de corelatie:corelatie: |r| = 0.772 > 0.50 => taria legaturii intre |r| = 0.772 > 0.50 => taria legaturii intre
venitul parintilor si satisfactia la zgomotul venitul parintilor si satisfactia la zgomotul din camin este puternicadin camin este puternica
Pragul de semnificatie:Pragul de semnificatie: p = 0.009 < 0.01 => putem spune ca p = 0.009 < 0.01 => putem spune ca
exista o legatura semnificativa intre exista o legatura semnificativa intre variabilele venitul parintilor si nivelul de variabilele venitul parintilor si nivelul de satisfactie la zgomotul din camin.satisfactie la zgomotul din camin.
Rezolvare exercitiuRezolvare exercitiu
Proportia de varianta:Proportia de varianta:
rr² = 0.59 * 100 = 59 => relatia gasita este prezenta la 59% dintre subiecti
Crerea unei diagrame de dispersie Crerea unei diagrame de dispersie pentru perechi de variabilepentru perechi de variabile
O diagrama de dispersie este o reprezentare grafica bi-O diagrama de dispersie este o reprezentare grafica bi-dimensionala a relatiei dintre doua variabile. Acest grafic te dimensionala a relatiei dintre doua variabile. Acest grafic te ajuta sa evaluezi natura si gradul de relatie dintre variabilele ajuta sa evaluezi natura si gradul de relatie dintre variabilele tale.tale.
Pasul 1.Pasul 1. Pentru a crea o diagrama de dispersie pentru datele Pentru a crea o diagrama de dispersie pentru datele tale, sa spunem intre variabila de venit si cea de zgomot, da tale, sa spunem intre variabila de venit si cea de zgomot, da click pe Graphs (grafice) si apoi pe Scatter (disperseaza).click pe Graphs (grafice) si apoi pe Scatter (disperseaza).Pasul 2.Pasul 2. In meniul Scatterplot, da click pe Simple si apoi pe In meniul Scatterplot, da click pe Simple si apoi pe Define (defineste).Define (defineste).Pasul 3.Pasul 3. Acum muta variabilele pe axele potrivite. In cazul Acum muta variabilele pe axele potrivite. In cazul de fata, ai putea dori sa muti variabila de zgomot in campul de fata, ai putea dori sa muti variabila de zgomot in campul axei Y iar variabila de venit in campul axei X. Odata ce ai axei Y iar variabila de venit in campul axei X. Odata ce ai facut asta, da click pe OKfacut asta, da click pe OK
Dupa cum poti vedea, acest grafic tinde sa indice o Dupa cum poti vedea, acest grafic tinde sa indice o satisfactie descrescatoare pe masura ce venitul pe familie al satisfactie descrescatoare pe masura ce venitul pe familie al participantului creste. participantului creste.
Grafic corelatieGrafic corelatie