metodi statistici in genetica forense - familias.namefamilias.name/bologna2016/metodi...

25
Metodi statistici in genetica forense terza edizione GENETISTI FORENSI ITALIANI Bologna, 6-7 Giugno 2016 Carla Bini Federica Alessandrini Thore Egeland Oskar Hansson

Upload: buikhuong

Post on 16-Feb-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Metodi statistici in genetica forense

terza edizione

GENETISTI FORENSI ITALIANI

Bologna, 6-7 Giugno 2016

Carla BiniFederica Alessandrini

Thore EgelandOskar Hansson

Page 2: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

GENETISTI FORENSI ITALIANI

Bologna, 6-7 Giugno 2016

Thore EgelandProfessore di statistica alla Norwegian University of Life Sciences (NMBU), progetti correlati a Familias

Oskar HanssonSenior Forensic Scientist (Norwegian Institute of Public Health)

Carla BiniBiologa, genetista forense, Medicina Legale, UNIBO

Federica AlessandriniBiologa, genetista forense, Medicina Legale, UNIVPM

Page 3: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Calcolo biostatistico indagini di paternità e

parentela

GENETISTI FORENSI ITALIANI

Bologna, 6-7 Giugno 2016

Page 4: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

1. Per valutare l'incertezza di una data ipotesi ènecessario considerare almeno una ipotesi alternativa

2. L’interpretazione scientifica si basa su domande deltipo: «qual è la probabilità dell’evidenza datal’ipotesi?»

3. L'evidenza scientifica è condizionata non solo dalledue ipotesi fatte, anche dal contesto entro cui taliipotesi devono essere valutate

Principi generali

Page 5: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Nel caso di un test di paternità le ipotesi alternativeformulate sono:

H1: PP è il padre di F

H2: Un altro uomo non imparentato è il padre di F

1. Formulazione ipotesi

Page 6: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Likelihood = Pr(evidenza|ipotesi) = Pr(E|H)

2. Probabilità di E data H

Page 7: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Likelihood ratio (LR)

Misura la strenght of the evidence in relazione ad unaipotesi

E’ la probabilità dell’evidenza data quella particolareipotesi in rapporto alla probabilità dell’evidenza l’ipotesialternativa

LR =P(E|H1)

P(E|H2)

Page 8: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità
Page 9: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità
Page 10: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Paternità Standard

PP M

F

A/A B/B

A/B

LR = PI =Probabilità dell’evidenza assunto che PP è il padre (H1)

Probabilità dell’evidenza assunto che un uomo a caso è il padre (H2)

1

pA

=

pA=0.05

1

0.05= = 20=

P(F|M,PP)

P(F|M)

Interpretazione: il dato osservato è 20 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.

Page 11: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Paternità Standard

PP M

F

C/D E/E

C/E

LR = PI =0.5

pC

=

pC=0.1

0.5

0.1= = 5

P(F|M,PP)

P(F|M)

Interpretazione: il dato osservato è 5 volte più probabile assumendoche PP sia il padre di F, in confronto all’ipotesi alternativa che unuomo a caso sia il padre.

Page 12: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Paternità Standard

PP M

F

A/A B/B

A/B

LR = CPI =1

pA

=0.5

* = 20*5 = 100P(F|M,PP)

P(F|M)

Interpretazione: il dato osservato è 100 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.

C/D E/E

C/E

pC

PA=0.05

PC=0.1

1

0.05

0.5*

0.1=

Page 13: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

ERRORE

Una affermazione riguardo la probabilità delle ipotesidata l’evidenza:

E’ 100 volte più probabile che PP sia il padre di Cpiuttosto che un altro uomo non imparentato sia il padredi C

Diremmo qualcosa di P(H1|E) e P(H2|E) che nonconosciamo

Page 14: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Formule per calcolo LR

Madre Figlio Presunto Padre LR=PI

A A AB

0.5/pA

A AB AB

A AB BC

AB A AB

AB A AC

BC AB AB

BC AB AC

BD AB AC

A A A

1/pA

AB A A

B AB A

BC AB A

AB AB AC 0.5/(pA+pB)

AB AB A1/(pA+pB)

AB AB AB

Page 15: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Interpretazione dei risultati (LG SIGU sulle analisi genetiche di accertamento parentale, 2013)

EsclusioneIl Gruppo di Lavoro, per addivenire all’esclusione di compatibilitàbiologica, suggerisce un valore di rapporto di verosimiglianzainferiore a 1:10.000 (Brenner C, 2004).

AttribuzioneIl Gruppo di Lavoro, per definire l’attribuzione, suggerisce un valoredi rapporto di verosimiglianza superiore a 10.000:1.

InconclusivitàConseguentemente si definisce inconclusivo qualsiasi risultato chegeneri un rapporto di verosimiglianza compreso tra 1:10.000 e10.000:1.

Page 16: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Teorema di Bayes: P Hp E = P Hp P(E|Hp

P Hp P(E|Hp +P Hd P(E|Hd

La probabilità di paternità W sulla base dell’osservazione dei profiligenetici (probabilità a posteriori) richiede una stima (soggettiva)delle probabilità a priori P(Hp) e P(Hd) valutate sulla base delle soleevidenze circostanziali (non genetiche)

Probabilità di Paternità: P(Hp|E) = W

Quando P(Hp) = P(Hd)=1/2 P Hp E = P Hp P(E|Hp

P Hp P(E|Hp +P Hd P(E|Hd=

= P(E|Hp

P(E|Hp + P(E|Hd=

P(E|Hp / P(E|Hp

P(E|Hp + P(E|Hd / P(E|Hp=

1

1 + 1/LR=

𝐋𝐑

𝐋𝐑 + 𝟏

Formula di Essen-Moller

Page 17: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

COMPLICAZIONI

1. Mutazioni

2. Alleli silenti

3. Theta – correction

4. Pedigrees complessi

Page 18: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Mutazioni

Mutazioni: è il prezzo da pagare per avere marcatori altamente polimorfici e non codificanti Somatiche individuo Germinali progenie

Abbiamo buoni dati per stimare il tasso di mutazione:American Association of Blood Banks (AABB) 2003 Annual Reporthttp://www.cstl.nist.gov/strbase/mutation.htm

Tasso di mutazione (probabilità di un cambiamento nel DNA da una generazione all’altra) varia con:

Sesso (M>F) Locus Età

Page 19: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Modelli per le mutazioni

Modelli per le mutazioni: «Equal» «Stepwise»

«extended stepwise»

Modello stabile: introducendo una persona non tipizzata nelpedigree il valore di LR non cambia.

Questa è una proprietà ragionevole, poiché le informazioni nonrilevanti non dovrebbero cambiare il risultato

Per tenere in considerazione la possibilità di mutazioni si sonosviluppati dei modelli parametrici: Matematicamente coerenti Formulati in termini di parametri che possono essere interpretati Ragionevoli dal punto di vista biologico

«stationary» (stabile) «unstationary» (non stabile)

Page 20: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Matrici per le mutazioni

La matrice specifica il modello

Due alleli: 1 e 2Probabilità di mutare da 1 a 2 = 0.01Probabilità di mutare da 2 a 1 = 0.01

M=m11 m12

m21 m22

M=0.99 0.01

0.01 0.99

Tre alleli: 1, 2 e 3

M=

m11 m12 m13

m21 m22 m23

m31 m32 m33

Somma

0,990 0,005 0,005 1

M1= 0,005 0,990 0,005 1

0,005 0,005 0,990 1

0,990 0,009 0,001 1

M2= 0,005 0,990 0,005 1

0,001 0,009 0,990 1

Page 21: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Intervallo di mutazione: Mutation range r

Mutation range (r) = 0.1la probabilità di mutazione decresce di 1/10 per ogni ulterioredifferenza di unità ripetuta

Somma

0,990 0,009 0,001 1

M2= 0,005 0,990 0,005 1

0,001 0,009 0,990 1

Mutation range = 0.001/0.009 = 0.1111

M=

m11 m12 m13

m21 m22 m23

m31 m32 m33

Qual è il modello «giusto»?

Page 22: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Alleli silenti

PP M

F

B/- A/-

A/-

LR =pS(pA+pS)

(pA+pS)2(pB+2pS)+pApS(pB+2pS)

0.05(0.1+0.05)

(0.1+0.05)2(0.1+2*0.05)+0.1*0.05(0.1+2*0.05)= 1.363636

Page 23: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Problema: persone non imparentate imparentate!

Soluzione: Theta – correction (ϴ)

Equilibrio di HW

2 alleli, A e BpA=0.4, pB=0.6

A/A= 0.42 =0.16A/B= 2*0.4*0.6 =0.48B/B= 0.62 =0.36

1.00

Theta-correction (ϴ)

Omozigoti AA: ϴpA+ pA2(1-ϴ)

Eterozigoti AB: 2pA pB(1-ϴ)

Se ϴ=0.1 (suggerito 0.01)

A/A= 0.1*0.4+0.42(1-0.1) =0.184A/B= 2*0.4*0.6(1-0.1) =0.432B/B= 0.1*0.6+0.62(1-0.1) =0.384

1.00

ϴ è la probabilità che 2 alleli presi a caso siano identici per discendenza (IBD)

Theta – correction (ϴ)

Page 24: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Theta – correction (ϴ)

Se x alleli sono di tipo A su un totale di n alleli campionati dallasottopopolazione, la probabilità che il successivo sia di tipo A è

xϴ + (1- ϴ)pA

1 + (n- 1) ϴ

PP M

F

A/A B/B

A/B

x=2 n=4

LR= 1

P(F ha A|non paternità)

P(F ha A|non paternità) =2ϴ + (1- ϴ)pA

1 + (4- 1) ϴLR= 1 + 3ϴ

2ϴ + (1- ϴ)pA

Esempio

ϴ riduce il valore di LR: approccio conservativo

Page 25: Metodi statistici in genetica forense - familias.namefamilias.name/Bologna2016/Metodi statistici_paternita.pdf · Il Gruppo di Lavoro, per addivenire all’eslusione di compatibilità

Pedigrees complessi

Paternità deficitarie

Ricostruzione di linee parentali

Incesti

……