![Page 1: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/1.jpg)
Metodi statistici in genetica forense
terza edizione
GENETISTI FORENSI ITALIANI
Bologna, 6-7 Giugno 2016
Carla BiniFederica Alessandrini
Thore EgelandOskar Hansson
![Page 2: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/2.jpg)
GENETISTI FORENSI ITALIANI
Bologna, 6-7 Giugno 2016
Thore EgelandProfessore di statistica alla Norwegian University of Life Sciences (NMBU), progetti correlati a Familias
Oskar HanssonSenior Forensic Scientist (Norwegian Institute of Public Health)
Carla BiniBiologa, genetista forense, Medicina Legale, UNIBO
Federica AlessandriniBiologa, genetista forense, Medicina Legale, UNIVPM
![Page 3: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/3.jpg)
Calcolo biostatistico indagini di paternità e
parentela
GENETISTI FORENSI ITALIANI
Bologna, 6-7 Giugno 2016
![Page 4: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/4.jpg)
1. Per valutare l'incertezza di una data ipotesi ènecessario considerare almeno una ipotesi alternativa
2. L’interpretazione scientifica si basa su domande deltipo: «qual è la probabilità dell’evidenza datal’ipotesi?»
3. L'evidenza scientifica è condizionata non solo dalledue ipotesi fatte, anche dal contesto entro cui taliipotesi devono essere valutate
Principi generali
![Page 5: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/5.jpg)
Nel caso di un test di paternità le ipotesi alternativeformulate sono:
H1: PP è il padre di F
H2: Un altro uomo non imparentato è il padre di F
1. Formulazione ipotesi
![Page 6: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/6.jpg)
Likelihood = Pr(evidenza|ipotesi) = Pr(E|H)
2. Probabilità di E data H
![Page 7: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/7.jpg)
Likelihood ratio (LR)
Misura la strenght of the evidence in relazione ad unaipotesi
E’ la probabilità dell’evidenza data quella particolareipotesi in rapporto alla probabilità dell’evidenza l’ipotesialternativa
LR =P(E|H1)
P(E|H2)
![Page 8: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/8.jpg)
![Page 9: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/9.jpg)
![Page 10: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/10.jpg)
Paternità Standard
PP M
F
A/A B/B
A/B
LR = PI =Probabilità dell’evidenza assunto che PP è il padre (H1)
Probabilità dell’evidenza assunto che un uomo a caso è il padre (H2)
1
pA
=
pA=0.05
1
0.05= = 20=
P(F|M,PP)
P(F|M)
Interpretazione: il dato osservato è 20 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.
![Page 11: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/11.jpg)
Paternità Standard
PP M
F
C/D E/E
C/E
LR = PI =0.5
pC
=
pC=0.1
0.5
0.1= = 5
P(F|M,PP)
P(F|M)
Interpretazione: il dato osservato è 5 volte più probabile assumendoche PP sia il padre di F, in confronto all’ipotesi alternativa che unuomo a caso sia il padre.
![Page 12: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/12.jpg)
Paternità Standard
PP M
F
A/A B/B
A/B
LR = CPI =1
pA
=0.5
* = 20*5 = 100P(F|M,PP)
P(F|M)
Interpretazione: il dato osservato è 100 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.
C/D E/E
C/E
pC
PA=0.05
PC=0.1
1
0.05
0.5*
0.1=
![Page 13: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/13.jpg)
ERRORE
Una affermazione riguardo la probabilità delle ipotesidata l’evidenza:
E’ 100 volte più probabile che PP sia il padre di Cpiuttosto che un altro uomo non imparentato sia il padredi C
Diremmo qualcosa di P(H1|E) e P(H2|E) che nonconosciamo
![Page 14: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/14.jpg)
Formule per calcolo LR
Madre Figlio Presunto Padre LR=PI
A A AB
0.5/pA
A AB AB
A AB BC
AB A AB
AB A AC
BC AB AB
BC AB AC
BD AB AC
A A A
1/pA
AB A A
B AB A
BC AB A
AB AB AC 0.5/(pA+pB)
AB AB A1/(pA+pB)
AB AB AB
![Page 15: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/15.jpg)
Interpretazione dei risultati (LG SIGU sulle analisi genetiche di accertamento parentale, 2013)
EsclusioneIl Gruppo di Lavoro, per addivenire all’esclusione di compatibilitàbiologica, suggerisce un valore di rapporto di verosimiglianzainferiore a 1:10.000 (Brenner C, 2004).
AttribuzioneIl Gruppo di Lavoro, per definire l’attribuzione, suggerisce un valoredi rapporto di verosimiglianza superiore a 10.000:1.
InconclusivitàConseguentemente si definisce inconclusivo qualsiasi risultato chegeneri un rapporto di verosimiglianza compreso tra 1:10.000 e10.000:1.
![Page 16: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/16.jpg)
Teorema di Bayes: P Hp E = P Hp P(E|Hp
P Hp P(E|Hp +P Hd P(E|Hd
La probabilità di paternità W sulla base dell’osservazione dei profiligenetici (probabilità a posteriori) richiede una stima (soggettiva)delle probabilità a priori P(Hp) e P(Hd) valutate sulla base delle soleevidenze circostanziali (non genetiche)
Probabilità di Paternità: P(Hp|E) = W
Quando P(Hp) = P(Hd)=1/2 P Hp E = P Hp P(E|Hp
P Hp P(E|Hp +P Hd P(E|Hd=
= P(E|Hp
P(E|Hp + P(E|Hd=
P(E|Hp / P(E|Hp
P(E|Hp + P(E|Hd / P(E|Hp=
1
1 + 1/LR=
𝐋𝐑
𝐋𝐑 + 𝟏
Formula di Essen-Moller
![Page 17: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/17.jpg)
COMPLICAZIONI
1. Mutazioni
2. Alleli silenti
3. Theta – correction
4. Pedigrees complessi
![Page 18: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/18.jpg)
Mutazioni
Mutazioni: è il prezzo da pagare per avere marcatori altamente polimorfici e non codificanti Somatiche individuo Germinali progenie
Abbiamo buoni dati per stimare il tasso di mutazione:American Association of Blood Banks (AABB) 2003 Annual Reporthttp://www.cstl.nist.gov/strbase/mutation.htm
Tasso di mutazione (probabilità di un cambiamento nel DNA da una generazione all’altra) varia con:
Sesso (M>F) Locus Età
![Page 19: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/19.jpg)
Modelli per le mutazioni
Modelli per le mutazioni: «Equal» «Stepwise»
«extended stepwise»
Modello stabile: introducendo una persona non tipizzata nelpedigree il valore di LR non cambia.
Questa è una proprietà ragionevole, poiché le informazioni nonrilevanti non dovrebbero cambiare il risultato
Per tenere in considerazione la possibilità di mutazioni si sonosviluppati dei modelli parametrici: Matematicamente coerenti Formulati in termini di parametri che possono essere interpretati Ragionevoli dal punto di vista biologico
«stationary» (stabile) «unstationary» (non stabile)
![Page 20: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/20.jpg)
Matrici per le mutazioni
La matrice specifica il modello
Due alleli: 1 e 2Probabilità di mutare da 1 a 2 = 0.01Probabilità di mutare da 2 a 1 = 0.01
M=m11 m12
m21 m22
M=0.99 0.01
0.01 0.99
Tre alleli: 1, 2 e 3
M=
m11 m12 m13
m21 m22 m23
m31 m32 m33
Somma
0,990 0,005 0,005 1
M1= 0,005 0,990 0,005 1
0,005 0,005 0,990 1
0,990 0,009 0,001 1
M2= 0,005 0,990 0,005 1
0,001 0,009 0,990 1
![Page 21: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/21.jpg)
Intervallo di mutazione: Mutation range r
Mutation range (r) = 0.1la probabilità di mutazione decresce di 1/10 per ogni ulterioredifferenza di unità ripetuta
Somma
0,990 0,009 0,001 1
M2= 0,005 0,990 0,005 1
0,001 0,009 0,990 1
Mutation range = 0.001/0.009 = 0.1111
M=
m11 m12 m13
m21 m22 m23
m31 m32 m33
Qual è il modello «giusto»?
![Page 22: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/22.jpg)
Alleli silenti
PP M
F
B/- A/-
A/-
LR =pS(pA+pS)
(pA+pS)2(pB+2pS)+pApS(pB+2pS)
0.05(0.1+0.05)
(0.1+0.05)2(0.1+2*0.05)+0.1*0.05(0.1+2*0.05)= 1.363636
![Page 23: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/23.jpg)
Problema: persone non imparentate imparentate!
Soluzione: Theta – correction (ϴ)
Equilibrio di HW
2 alleli, A e BpA=0.4, pB=0.6
A/A= 0.42 =0.16A/B= 2*0.4*0.6 =0.48B/B= 0.62 =0.36
1.00
Theta-correction (ϴ)
Omozigoti AA: ϴpA+ pA2(1-ϴ)
Eterozigoti AB: 2pA pB(1-ϴ)
Se ϴ=0.1 (suggerito 0.01)
A/A= 0.1*0.4+0.42(1-0.1) =0.184A/B= 2*0.4*0.6(1-0.1) =0.432B/B= 0.1*0.6+0.62(1-0.1) =0.384
1.00
ϴ è la probabilità che 2 alleli presi a caso siano identici per discendenza (IBD)
Theta – correction (ϴ)
![Page 24: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/24.jpg)
Theta – correction (ϴ)
Se x alleli sono di tipo A su un totale di n alleli campionati dallasottopopolazione, la probabilità che il successivo sia di tipo A è
xϴ + (1- ϴ)pA
1 + (n- 1) ϴ
PP M
F
A/A B/B
A/B
x=2 n=4
LR= 1
P(F ha A|non paternità)
P(F ha A|non paternità) =2ϴ + (1- ϴ)pA
1 + (4- 1) ϴLR= 1 + 3ϴ
2ϴ + (1- ϴ)pA
Esempio
ϴ riduce il valore di LR: approccio conservativo
![Page 25: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità](https://reader030.vdocuments.net/reader030/viewer/2022020318/5c67b5cf09d3f226188c1d70/html5/thumbnails/25.jpg)
Pedigrees complessi
Paternità deficitarie
Ricostruzione di linee parentali
Incesti
……