Transcript
Page 1: Füst György III. Belklinika

Kapcsolat vizsgálat I: egy és többváltozós lineáris regressziós vizsgálatok és alkalmazásaik a

klinikumban.

Füst György

III. Belklinika

Page 2: Füst György III. Belklinika

KÉT VÁLTOZÓ KÖZÖTTI KAPCSOLAT MÉRÉSI MÓDJAI: A KORRELÁCIÓ ÉS A

REGRESSZIÓ

• Az alapvető kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában, stb. mért különböző változó között?

• Ha csak arra vagyunk kíváncsiak, hogy ilyen kapcsolat fennáll-e, akkor korrelációt számítunk, ha arra is, hogy ha fennáll ilyen kapcsolat, akkor az egyik változó értékeiből hogyan lehet előre jelezni a másik változó értékeit, akkor regressziós, általában lineáris regressziós számítást végzünk. A korreláció és a regresszió között sok a hasonlóság, ha a korreláció mérőszáma az un. korrelációs koefficiens szignifikáns, akkor mindig szignifikáns lesz a lineáris regresszió is.

• A leggyakrabban használt és az orvosi irodalomban igen gyakran megtalálható eljárások.

Page 3: Füst György III. Belklinika

A KORRELÁCIÓ

• A két változó közötti egyenes arányú, fordított arányú vagy hiányzó kapcsolat (pozitív, negatív vagy nem létező korreláció) lehet. Becslése az értékek ábrázolása alapján lehetséges.

• ELŐSZÖR MINDIG RAJZOLJUNK!!!

Page 4: Füst György III. Belklinika

0.0 2.5 5.0 7.5 10.00

5

10

15

20

25

a

0.0 2.5 5.0 7.5 10.00

1

2

3

4

b

0.0 2.5 5.0 7.5 10.00

1

2

3

4

5

6

7

c

Page 5: Füst György III. Belklinika

0 25 50 75 10010

20

30

40

50

gyengepozitív korreláció

kor (év)

BM

I

erőspozitív korreláció

50 100 150130

140

150

160

170

180

190

200

210

testsúly (kg)

test

mag

assá

g (

cm)

140 165 1900

1

2

3

nincs korreláció

testmagasság (cm)

HD

L-k

ole

szte

rin

(m

mo

l/l)

erősnegatív korreláció

35 50 65 80 95 1101251400

1

2

3

testsúly (kg)

HD

L-k

ole

szte

rin

(m

mo

l/l)

Page 6: Füst György III. Belklinika

5 10 15 200

10

20

30

HbA1C (%)

Tri

gli

ceri

d (

mm

ol/

l)

0.0 2.5 5.0 7.5 10.0 12.5 15.00

1

2

3

Triglicerid (mmol/l)

HD

L k

ole

szte

rin

(m

mo

l/l)

Page 7: Füst György III. Belklinika

1. Ha nincs lineáris korreláció, akkor a korrelációs koefficiens értéke: 0, tökéletes pozitív, ill. negatív lineáris korreláció fennállása esetén a korrelációs koefficiens értéke +1,00, ill. -1,00.

2. A korrelációs koefficiens értéke független a mértékegységektől, amelyekben a két változó rögzítve van (pl. testmagasság és testsúly közötti korreláció, mindegy, hogy ezek milyen mértékegységben (kg, font, cm, inch) vannak megadva).

3. A korrelációs koefficiens értékét az outlier (kiugró) értékek igen erősen befolyásolják. Ezt minden esetben végig kell gondolni és pl. adat-transzformációt kell végrehajtani. A kiugró érték lehet egy szabálytalan, torzult eloszlás

eredménye, ilyenkor segíthet a transzformáció, vagy lehet mérési hiba, ilyenkor lehet a mérést ismételni, vagy az értéket kizárni

4. 4, A korreláció nem jelent ok-okozati kapcsolatot, mert ez lehet annak a következménye, hogy-az x tengelyre felvett változó befolyásolja az y tengelyre felvettet-az y tengelyre felvett változó befolyásolja az x tengelyre felvettet-egyik eset sem áll fenn, hanem egy harmadik tényező mindkettőt egy irányba (pozitív korreláció) vagy különböző irányokba (negatív korreláció) mozdítja el.

A korrelációs koefficiens legfontosabb tulajdonságai

Page 8: Füst György III. Belklinika

• A korrelációs koefficiens legalacsonyabb értéke: 0 (nincs lineáris korreláció), a legmagasabb +1,0 vagy -1,0 (tökéletes pozitív, ill. negatív lineáris korreláció)

• A korrelációs koefficiens értéke független a mértékegységektől, amelyekben a két változó meg van adva pl. testmagasság és testsúly közötti korreláció, mindegy, hogy milyen mértékegységben (kiló, font, cm, inch) vannak ezek megadva)

• A korrelációs koefficiens értékét az outlier (kilógó) értékek igen erôsen befolyásolják. Ezt minden esetben végig kell gondolni, az adatokat transzformálni, esetleg, ha ez korrekt korrigálni is lehet. A kilógó érték lehet egy szabálytalan, torzult eloszlás eredménye, ilyenkor segíthet a transzformáció, vagy lehet mérési hiba, ilyenkor lehet óvatosan korrigálni

Page 9: Füst György III. Belklinika

EGY KIUGRÓ (OUTLIER) ÉRTÉK HATÁSA A KORRELÁCIÓS KOEFFICIENS NAGYSÁGÁRA ÉS SZIGNIFIKANCIÁJÁRA

Egy "kiugró" érték a nyolcból

20 30 40 50100

600

1100

R=0,2515p=0,4364

almavirág átmérője (mm)

alm

a sú

lya

(g)

A "kiugró" érték kiküszöbölése után

20 30 40 50100

200

300

400 R=0,9222p=0,0022

almavirág átmérője (mm)

alm

a sú

lya

(g)

Page 10: Füst György III. Belklinika

Korrelációs koefficiens A kapcsolat erőssége

0-0,25 Nincs vagy igen gyenge

0,25-0,50 Gyenge

0,50-0,75 Mérsékelten erős vagy erős

0,75-1,00 Igen erős

A korreláció (a két változó közötti kapcsolat) erősségének megítélése. A leegyszerűsített megoldás

Page 11: Füst György III. Belklinika

Vigyázat! a 0,95-nél nagyobb r érték biológiai rendszerekben gyanús, elsősorban arra, hogy az egyik mért érték a másikból következik, ill. ez által determinált. Ezt az erősnek mért korrelációk esetén mindig meg kell gondolni. pl. megvizsgáltuk az interferon alpha kezelés előtt mért HCV RNS szinteket és a 3 hónap alatt az e szintekben bekövetkezett változások közötti kapcsolatot

Number of XY Pairs 51Pearson r -0.8283 95% confidence inte rva l -0.8988 to -0.7162P va lue (two-ta iled) P<0.0001 P va lue summary *** Is the corre la tions ignificant? (a lpha=0.05)

Yes

R squared 0.6861

Page 12: Füst György III. Belklinika

Azonban így csak egy evidens , józan éssze l e lőrelá tha tó kapcsola tot igazoltunk: ha mindenbetegben azonos mértékben csökkenti a keze lés aHCV-RNS szinte t, akkor azokban, akikbenkezde tben magas volt a szint nagyobbcsökkenése várha tó, mint azokban, akiknek aszintje már e leve is a lacsony volt.

Page 13: Füst György III. Belklinika

20 30 40 50100

200

300

400Xátlag

x - xátlag

yátlag

y - yátlag

almavirág átmérője (mm)

alm

a sú

lya

(g)

A PEARSON-FÉLE KORRELÁCIÓS KOEFFICIENS SZÁMÍTÁS ELSŐ LÉPÉSE, AZ X ILL. Y ÁTLAGTÓL VALÓ TÁVOLSÁG

Page 14: Füst György III. Belklinika

Hogyan számítható ki a két változó közötti korreláció mértéke? A mérőszám a korrelációs koefficiens (Pearson féle product moment correlation coefficient), jele: r, képlete:

rX X Y Y

X X Y Y

( )( )

( ) ( )2 2

Page 15: Füst György III. Belklinika

Beteg C9(X) C1-INH(Y)

_X-X

_Y-Y

_ _(X-X)(Y-Y)

_(X-X)2

_(Y-Y)2

1. 80.5 80.9 1,0 9,62 90.7 96.4 9,2 25,13. 80.5 59.1 1,0 12,14. 88.1 96.6 6,6 25,35. 54.0 41.2 27,5 29,96 101.5 103.4 26,3 32,17. 75.2 21.8 6,3 49,5átlag 81,5 71,3

Page 16: Füst György III. Belklinika

Beteg C9(X) C1-INH

(Y) _ X-X

_ Y-Y

_ _ (X-X)(Y-Y)

_ (X-X)2

_ (Y-Y)2

1. 80.5 80.9 1,0 9,6 9,6 1,0 92.2 2 90.7 96.4 9,2 25,1 230,9 84,6 630,0 3. 80.5 59.1 1,0 12,1 12,1 1,0 146,4 4. 88.1 96.6 6,6 25,3 167,0 43,6 65,0 5. 54.0 41.2 27,5 29,9 822,3 756,3 894,0 6 101.5 103.4 26,3 32,1 844,2 691,7 1030,4 7. 75.2 21.8 6,3 49,5 311,9 39,7 2450,3 átlag 81,5 71,3 ösz-

szeg 2394 1617.9 5308,3

816,06,2930

2394

9,722,40

2394

3,53089,1617

2394

xr

Page 17: Füst György III. Belklinika

A determináltsági koefficiens (r2)

Az r2 érték azt fejezi ki, hogy az egyik változó változásai várhatóan milyen mértékben járnak a másik változó változásaival, vagyis mennyire lehet az egyikből a másikat előre jelezni. Ha az r=0,50, az

r2=0,25, akkor 25%-ban lehet előre jelezni az egyik változóból a másikat, és fordítva (a korrelációnál a két változó felcserélhető). Példánkban a két komplement fehérje (C9 és C1-INH) között az

r=0,62, az r2=0,38, tehát a C9 szintje alapján 39%-ban lehet a C1-INH szintet, ill. a C1-INH szintje

alapján a C9 szintet előre jelezni.

Page 18: Füst György III. Belklinika
Page 19: Füst György III. Belklinika

Az r CI-a

• Az r értékeknek is van eloszlása, ez azonban nem szimmetrikus és csak nagyobb (N>10) esetszámnál értékelhető. Minden program megcsinálja, kézzel elég macerás, A C9 és C1-INH koncentráció közötti r (0,62) CI-a 0,42-0,76.

Page 20: Füst György III. Belklinika

A korrelációs koefficiens szignifikanciája

A legfontosabb képle t, amely minden e lemszámnálhaszná lha tó, az r e loszlás t t-e loszlássá a lakítja á tés az e rre a cé lra szolgá ló tábláza tból az ígykiszámított t é rtékné l és df-ná l (N-2) megkereshe tőa P é rték.

tN

r

2

1 2

Page 21: Füst György III. Belklinika

A lineáris (Pearson) korrelációs koefficiens kiszámíthatóságának feltételei I.

• A vizsgált egyének (állatok, minták, stb) egy nagyobb populációból véletlenszerűen lettek kiválasztva

• Minden vizsgált egyénnél megmérték mindkét (x és y) változót (a hiányzó értékekkel a legtöbb számítógépes program boldogul)

• A megfigyelések egymástól függetlenek A vizsgált egyének kiválasztása egymást nem befolyásolja (nincs rokonsági kapcsolat). Nem tekinthetők független megfigyeléseknek ha ugyanazt a vizsgálatot ugyanazokban az egyénekben megismételjük és ezeket különálló mintáknak tekintjük (a kettőt összevonjuk)

Page 22: Füst György III. Belklinika

A lineáris (Pearson) korrelációs koefficiens kiszámíthatóságának feltételei II.

• Az x és y értékeknek is függetleneknek kell lenni egymástól (l. a HCV RNS változási példát fent).

• Ha az x változó szisztematikusan változik, pl. idő, koncentráció vagy dózis) akkor ne korrelációt, hanem lineáris regressziót kell számolni, bár ugyanazt az r és P értéket kapjuk, de a regresszióból több következtetés vonható le.

• Mind az x, mind az y mintáknak normál eloszlást mutató populációból kell származniuk. Ha ez nem áll fenn, akkor nem paraméteres eljárást (Spearman

korrelációs koefficiens) kell végeznünk.

Page 23: Füst György III. Belklinika

A lineáris (Pearson) korrelációs koefficiens kiszámíthatóságának feltételei III.

• Az x és az y végig egy irányban kell változzon. Pl. az r-nek semmi értelme akkor, ha az x növekedésével egy darabig nő az y, de a további növelés után csökkenni kezd.

• sohasem szabad két populációból származó mintát kombinálni, mert ez ál-szignifikáns korrelációt fog mutatni, noha sem az egyik, sem a másik mintában külön-külön nincs kapcsolat a két változó között.

Page 24: Füst György III. Belklinika

elephants

250 500 750 100030

40

50

60

70

80

90

r=0.044p=0.925

(L. E. Phant et al.: Big Animals, 2004;25:23-45)

length of right ear, cm

len

gth

of

left

fro

nt

leg

(cm

)mice

0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.050

0.055

0.060

0.065

0.070

0.075

0.080

0.085

(B. Hamster, P. Rat: Small Animals 1998;234:56-78)

length of the right ear, cm

r=0.046p=0.922

len

gth

of

left

fro

nt

leg

(cm

)

elephants and mice

0.1 1 10 100 10000.01

0.1

1

10

100

length of the right ear, cm

(G. Swine et al., unpublished)

r=0.922p<0.0001

len

gth

of

left

fro

nt

leg

(cm

)

HOGYAN NEM SZABAD KORRELÁCIÓT SZÁMÍTANI?

Page 25: Füst György III. Belklinika
Page 26: Füst György III. Belklinika

Virág-alma párok sorszáma

Virág átmérője, mm

Rangszám Alma súlya, g

Rangszám Rangszámok különbsége

1 32 3,5 210 4 0,5

2 18 1 150 1 0

3 36 5 235 6 1

4 32 3,5 205 3 0,5

5 39 7 220 5 2

6 37 6 256 7 1

7 30 2 190 2 0

8 42 8 300 8 0

Spearman korrelációs koefficiens r=0,9222,p=0,0022

Összefüggés az almavirágok átmérője és az almák súlya között. Hipotetikus példa a rang-korrelációs eljárás elvének szemléltetésére.

A számítógép az azonos sorban lévô x, ill. y rangszámokat figyelembe véve, különbözô képleteket használva számítja ki a Spearman féle korrelációs koefficienst (Spearman (ró) értéket). Első rátekintésre akkor van korreláció, ha az ugyanazokban a sorokban található rangszámok azonosak vagy kevéssé különböznek.

Page 27: Füst György III. Belklinika

5 10 15 200

10

20

30

HbA1C (%)

Tri

gli

ceri

d (

mm

ol/

l)

0.0 2.5 5.0 7.5 10.0 12.5 15.00

1

2

3

Triglicerid (mmol/l)

HD

L k

ole

szte

rin

(m

mo

l/l)

Page 28: Füst György III. Belklinika

Paraméteres, lineáris korrelációs koefficiens meghatározás

Az XY párok száma 228

Pearson korrelációs koefficiens (r) 0,2504

Az r 95%-os CI-je 0,1256 – 0,3674

p-érték (kétoldalú) 0,0001

A p-érték összefoglaló értékelése ***

Szignifikáns-e (p<0,05) a korrelációs koefficiens?

Igen

R2 (determináltsági koefficiens) 0,0627

Pozitív lineáris korreláció a szérum log10triglicerid és log10HbA1C szintek között cukorbetegekben

Page 29: Füst György III. Belklinika

Paraméteres, lineáris korrelációs koefficiens meghatározás

Az XY párok száma 228

Pearson korrelációs koefficiens (r) -0,4435

Az r 95%-os CI-je -0,5414 – -0,3337

p-érték (kétoldalú) <0,0001

A p-érték összefoglaló értékelése ***

Szignifikáns-e (p<0,05) a korrelációs koefficiens?

Igen

R2 (determináltsági koefficiens) 0,1967

Negatív lineáris korreláció a szérum log10triglicerid és HDL-koleszterin szintek között cukorbetegekben

Page 30: Füst György III. Belklinika

Nem paraméteres korrelációs koefficiens meghatározás

Az XY párok száma 228

Spearman korrelációs koefficiens (r) -0,4559

Az r 95%-os CI-je -0,5550 – -0,3442

p-érték (kétoldalú) <0,0001

A p-érték összefoglaló értékelése ***

Pontos vagy megközelítő p-érték? Gaussi megközelítés

Szignifikáns-e (p<0,05) a korrelációs koefficiens?

Igen

Negatív korreláció a szérum log10 triglicerid és HDL-koleszterin szintek között cukorbetegekben. Számítás a nem paraméteres Spearman próbával

Page 31: Füst György III. Belklinika

A korrelációs számítás legfontosabb szabálya: a szignifikáns korreláció sem

jelent ok-okozati kapcsolatot

• Ha x és y között erős korreláció van, akkor az lehet azért, mert

• 1. az y változásai okozzák az x változásait• 2. a x változásai okozzák az y változásait• 3. egy harmadik faktor mind az x-et, mind az

y-t egy irányba (vagy ellenkező irányba) befolyásolja. Ez a leggyakoribb!!!

Page 32: Füst György III. Belklinika

A REGRESSZIÓ

• A regresszió úgy mutatja meg két változó kapcsolatát, hogy egyben az egyik változó (függő változó) a másik változótól (független változó) való függésének mértékét is kifejezi.

• lineáris és nem-lineáris regresszió

• egyszerű és többszörös regresszió

Page 33: Füst György III. Belklinika

0.75 1.00 1.25 1.50

-1

0

1

2

log10 triglicerid, mmol/l

log10 HbA1c, %

0 50 100 1500

1

2

3

testsúly (kg)

HD

L-k

ole

szte

rin

(m

mo

l/l)

Page 34: Füst György III. Belklinika

y

x

a

Y változás

X változás

b (meredekség): y változás/x változás

Page 35: Füst György III. Belklinika

PÉLDA

• Az allergének aktiválják a komplement rendszert az un. klasszikus reakcióúton át. Ennek elsô lépése a C1 makromolekula belsô, enzimatikus aktivációja. A második lépésben a C1 enzim (C1 eszteráz) egyik szubsztrátját, a C4-et C4b-vé és C4a-vá hasítja el, majd a C4b tovább bomlik és C4d keletkezik belőle. Egy speciális, monoklonális ellenanyagokkal működő kit lehetővé teszi a C4d szint mérést szérumban. Mi egy allergén (Parietaria judaica=falfű) különbözô dózisaival (0,05, 0,10, 0,20, 0,40 mg/ml szérum) inkubáltuk 37oC-on 60 percig egy vizsgált egyén szérumát és minden mintában megmértük a keletkezett C4d mennyiségét (µg/ml)

Page 36: Füst György III. Belklinika

Az allergén dózis a, mg/ml A keletkezett C4d mennyis ége,µg /ml

0.05 5.50.10 9.00.20 14.20.50 21.6

Page 37: Füst György III. Belklinika

0.0 0.1 0.2 0.3 0.4 0.5 0.60

10

20

30

parietaria allergenmg/ml

C4d,

g/ml

Page 38: Füst György III. Belklinika

• Látható, hogy minél több allergént adtunk a szérumhoz, annál több C4d keletkezett. Kérdésünk a korrelációs számítással szemben, amikor csak azt kérdeztük volna, hogy kapcsolatban áll-e egymással az allergén dózisa és a keletkezett C4d mennyisége, most azt is tudni szeretnénk, hogy az allergén egy adott dózisa (x mg/ml) milyen mértékű (y µg/ml) C4d képzôdést indukál a szérumban.

• Ha az x és az y között lineáris vagy ezt megközelítő összefüggés látszik (példánkban ez a helyzet), akkor a kérdésre a (egyszerű vagy egyszeres, simple) lineáris regresszió módszerével kaphatunk választ.

Page 39: Füst György III. Belklinika

0.0 0.1 0.2 0.3 0.4 0.5 0.60

10

20

30

parietaria allergenmg/ml

C4d

, g

/ml

Page 40: Füst György III. Belklinika

• A lineáris regressziós számítás lényege az, hogy egy olyan vonalat húzunk, amely a mérési pontoktól a lehető legkisebb távolságban van, ezeket a legjobban megközelíti (best fit regression line). Matematikailag ez azt jelenti, hogy minden más vonal esetében a mérési pontok függőleges távolsága négyzeteinek összege nagyobb volna.

Page 41: Füst György III. Belklinika

• Tehát a vonal úgy készül, hogy egy képlet alapján kiszámolja a gép, de természetesen mi is kiszámolhatjuk a lineáris regressziós egyenes egyenletét (meredekség és metszési pont az y tengelyen) és ennek alapján ábrázoljuk az egyenest.

• Az első és harmadik pont elég távol esik a regressziós egyenestől ahhoz, hogy a pontok és egyenes közötti függőleges távolságokat is ábrázoljuk. E távolságok négyzetének összege kell minimális legyen. A távolságokat reziduumnak (residual) nevezzük, ezek négyzetének összege a reziduumok varianciája, melynek négyzetgyöke a reziduumok SD-je. A regressziós egyenes az az egyenes, amelynél a reziduumok összegének az SD-je a legkisebb. Egyes programok ezt is kiszámítják

Page 42: Füst György III. Belklinika

A számítás segítségével meghatározhatjuk az egyenesek konfidencia intervallumát is, tehát azokat a határokat, amelyek közé azok a

regressziós egyenesek esnének 95%-os valószínűséggel, amelyek más olyan kísérletekhez tartoznának, amelyekben ugyanezt az

összefüggést vizsgálnánk

0.0 0.1 0.2 0.3 0.4 0.5 0.60

10

20

30

40

parietaria allergenmg/ml

C4d

, g

/ml

Page 43: Füst György III. Belklinika

Mit je lent kérdés ünk s zempontjából az egyenle t?Ennek alapján megmondhatjuk, hogy a pl. 0,1mg/ml parie taria allergén 0,1x33,86 + 5,38 = 8,77µg/ml C4d-t fog generálni a vizs gált s zérumban.Ez jó l köze líti a valós ágban mért 9,0 µg /ml-esértéket

A regres s ziós egyenes egyenle te a köve tkezô:y=bx + ay=33,86x + 5,38A b (33,86) az egyenes meredeks ége (s lope ), ennek 95%-os CI-a: 10,43 - 57,29)Az a (5,38) az y tenge ly mets zés pontja (intercept),ennek 95%-os CI-a: -1,06 - +11,82

Page 44: Füst György III. Belklinika

A regressziós egyenes egyenlete

bX X Y Y

X X

( )( )

( )2

a = y- (b x),

Page 45: Füst György III. Belklinika

x (aller-géndózis,mg/ml)

y ( kép-zôdöttC4d,µg/ml)

x-x y- y (x-x)2(x-x)(y- y)

0.05 5.5 -0,16 -7.1 0,0261.1360.10 9.0 -0,11 -3.6 0,0120.3960.20 14.2 -0.01 1,6 0,000-0,0160.50 21.6 0,29 9,0 0.0842,61

x=0,21

y=12,6

=0,122

= 4,126

Page 46: Füst György III. Belklinika

példánkban

b=4,126/0,122=33,81

a=12,6-(33,81.0,21)=12,6-7,1=5,5

A program kis zámítja az r2 é rtéke t is , his zen a regres s ziónak akorre lác ió mindig ré s ze (fordítva nem. Az r2 é rték 0,9508, tehát a ké tparaméter között extrém erôs lineáris korre lác ió áll fenn (vigyázat ittkevés ponttal do lgoztunk!!!) A 0,9508-as r2 é rték azt je lenti, hogy azallergén dózis változás aival a C4d képzôdés változás ainak 95%-amagyarázható , c s ak 5% tulajdonítható egyéb faktoroknak.

Page 47: Füst György III. Belklinika

A lineáris regressziós egyenes szignifikanciája:

• A null-hipotézis: nem áll fenn lineáris összefüggés a parietária allergén dózisa és a képződött C4d mennyisége között. Ha ez igaz, akkor a regressziós egyenes az x tengellyel párhuzamos lenne, tehát a meredeksége: 0. A P érték azt jelenti, hogy ha a null-hipotézis igaz, akkor mi annak a valószínűsége, hogy véletlenül a 0-tól az észlelt mértékben eltérő, vagy ennél még nagyobb meredekséget észlelnénk. Ha a P érték kicsi, akkor valószínűtlen, hogy az észlelt összefüggés véletlen koincidencia eredménye lenne. Példánkban a P érték: 0.0249, tehát kevesebb, mint 2,5% annak a valószínűsége, hogy az allergén dózisától nem függ a szérumban képzôdő C4d mennyisége.

Page 48: Füst György III. Belklinika

A lineáris regresszió elvégezhetőségének feltételei

• Az x és az y értékek nem felcserélhetők, az x értékek alapján szeretnénk előre jelezni az y értékeket, fordítva ez nem lehetséges, mert a kísérletben az x-et variáljuk, vagy időben esetleg logikailag megelőzi az y-t (pl. előbb adtuk hozzá a szérumhoz az allergént és csak ezután képződött a C4d)

• Az ábrázolás szerint az x és y értékek között lineáris összefüggés áll fenn. Ennek eldöntésre a legtöbb program lehetővé teszi a reziduumok ábrázolását is, ennek elemzése elősegítheti annak az eldöntését, hogy valóban fennáll-e az x és y között a lineáris viszony.

Page 49: Füst György III. Belklinika
Page 50: Füst György III. Belklinika

0.1 0.2 0.3 0.4 0.5 0.6

-3

-2

-1

0

1

2

3

parietaria dózis, mg/ml

C4d

kép

zôd

és,µ

g/m

l

Ha ez fennáll, akkor a pontok többsége avízszintes vonalhoz közel esik, és nem találunknagyon kilógó értékeket sem. Az x dózisnövekedésével párhuzamosan a pontok távolsága(pontosabban a távolságok négyzeteinek SD-je)az y=0 vonaltól nem nőhet vagy csökkenhetszisztematikusan. (ez az un. homoscedasticitásvagy homogenitás elve) A lineáris összefüggésellen szól az is, ha több pont csoportosul egymásközelében

Page 51: Füst György III. Belklinika

A lineáris regresszió elvégezhetôségének feltételei (folyt.)

• Bár matematikailag az összefüggés a végtelen kicsi és a végtelen nagy irányban is megmarad az x és y között, lehetőleg csak a megfigyelések által meghatározott tartományban számoljunk ezzel, annál is inkább, mert az y értékek akár negatívvá is válhatnak, amelynek biológiailag legtöbbször semmi értelme sincs.

• A reziduumok távolsága a regressziós egyenestől normál eloszlású vagy ezt megközelítő legyen

• Minden vizsgált minta egymástól függetlenül lett kiválasztva.

• Az x érékek és az y értékeket egymástól függetlenül határoztuk meg. Tehát a korrelációhoz hasonlóan nem szabad lineáris regressziót számolni egy változó kiinduló értéke és ennek változásának mértéke között, hiszen az utóbbi kiszámításánál az elôzôt is figyelembe vettük (l. a HCV RNS példát a korrelációnál)

Page 52: Füst György III. Belklinika

A log10 szérum HbA1c értékek és az ugyanabban a mintában mért log10

triglicerid értékek közötti összefüggés vizsgálata cukorbetegekben lineáris

regresszió módszerével.

Page 53: Füst György III. Belklinika

A pontokat legjobban megközelítő egyenes (best fit values)

meredeksége (slope) 0,6109 ± 0,1558

1/slope 1,6375

metszéspontja az y tengellyel -0,2854 ± 0,1474

metszéspontja az x tengellyel 0,4672

95%-os konfiedencia intervallumok

meredeksége (slope) 0,3056-0,9162

metszéspontja az y tengellyel, amikor x=0 -0,5744-0,003545

metszéspontja az x tengellyel, amikor y=0 -0,01151-0,6320

Az illeszkedés pontossága (goodness of fit)

R2 0,06269

A meredekség szignifikánsan különbözik-e a 0-tól?

F 15,38

Szabadsági fok (n-1 ill. df) 1, 230

p-érték <0,0001

A 0-tól való eltérés szignifikáns

Adatok

száma 232

hiányzó 0

Page 54: Füst György III. Belklinika

modell Négyzetösszeg df (n-1) Négyzetek átlaga

F p-érték

1 Regresz-szió

1,267 1 1,267 15,383 <0,0001

maradék 18,942 230 0,08236

összesen 20,209 231

ANOVA

Page 55: Füst György III. Belklinika

Nem standardizált koefficiens

Standardizált koefficiens

t p-érték A B 95%-os CI-je

Modell

B SEM beta alsó határ

felső határ

konstans

-0,285 0,147 -1,936

0,054 -0,576 0,005

log10Hb

A1c

0,611 0,156 0,250 3,922 <0,0001 0,304 0,918

Regressziós koefficiens

Page 56: Füst György III. Belklinika

A x értékek kiszámítása az y értékek alapján (standard görbe a laboratóriumokban)

• Ez a laboratóriumok mindennapi feladata. Pl. van egy standard magas ismert IgG tartamú szérumom. Ebből hígítási sort készítek és megmérem benne Mancini módszerrel a keletkezett precipitációs körök átmérőjét mm-ben kifejezve. Ezután elkészítem a standard görbét: az x tengelyre az egyes hígítások ismert IgG koncentrációja jön, a y tengelyre pedig a precipitációs körök átmérője. Az ismeretlen mintákban kapott átmérőt a y tengelyre viszem majd meghatározom az ehhez tartozó x értéket, tehát IgG koncentrációt. Ez számítógéppel (hiszen ismert az x és y közötti összefüggés egyenlet) végtelenül egyszerű. Elvileg lehet extrapolálni is, tehát a standard görbénél kisebb vagy nagyobb tartományban dolgozni, itt azonban igen óvatosnak kell lenni.

Page 57: Füst György III. Belklinika

IgG, g/l á tmérô, mm15.0 30.007.5 14.003.75 8.001.9 3.000.95 1.80

9.0029.002.006.00

Page 58: Füst György III. Belklinika

Az ana lízis e redménye:

Slope 2.007 ± 0.06194 Y-inte rcept -0.3205 ± 0.4797 X-inte rcept 0.1597 1/s lope 0.4983

Page 59: Füst György III. Belklinika

Standard görbe

0 5 10 15 200

10

20

30

40

4.64414.609

1.1563.149

9.00029.000

2.0006.000

ismeretlenek

IgG, g/l

Pre

cip

itác

iós

kör

átm

érô

je,

mm

Page 60: Füst György III. Belklinika

Mi történik, ha az x és az y közötti összefüggés nem lineáris?

• 1. Meg kell próbálni úgy transzformálni az értékeket, hogy lineárissá váljon az összefüggés

• 2. Ha ez nem lehetséges, a nem-lineáris regresszióval kell dolgozni.

Page 61: Füst György III. Belklinika

NEM LINEÁRIS REGRESSZIÓ

• Az eljárást a klinikumban ritkán használjuk, az orvosbiológiai tudományokban azonban nagyon fontos eljárás, pl. a ligand receptorról való disszociációja vagy a rádióaktív izotóp bomlása, vagy a gyógyszerek májban történô metabolizmusa, ill. vesében történő kiürítése egy nem-lineáris összefüggés, szerint, az exponenciális model szerint (pl. a kiválasztott gyógyszer mennyisége a gyógyszer plazmakoncentrációjának függvénye, ahogy ez csökken a kiválasztás üteme is lelassul.

• A nem-lineáris regresszió lényege egy egyenlet illesztése az adatokhoz és annak a vizsgálat, hogy az adatok illeszkednek-e az egyenlet által meghatározott görbéhez (lineáris regesszió: ugyanez egyenessel). A számítógépes programokba számos egyenlet be van építve, de lehetőség van saját egyenlet

készítésére is.

Page 62: Füst György III. Belklinika

x y

2.00 1654.00

4.00 1515.00

6.00 1243.00

8.00 1098.00

10.00 1032.00

15.00 874.00

20.00 754.00

25.00 653.00

30.00 567.00

35.00 604.00

40.00 587.00

Page 63: Füst György III. Belklinika

0 10 20 30 40 500

1000

2000

X

Y

Page 64: Füst György III. Belklinika

one site binding model

0 10 20 30 40 500

1000

2000

X

Y

two-site binding model

0 10 20 30 40 500

1000

2000

X

Y

  one-site two-site

Degrees of Freedom 9 7

R² 0.6453 0.9933

Absolute Sum of Squares

517300 9776

Sy.x 239.7 37.37


Top Related