taller básico de estadística forensegeoff-morrison.net/documents/morrison -taller básico...

73
Taller básico de estadística forense Introducción la lógica para a la evaluación de las evidencias forenses Geoffrey-Stewart Morrison p( E | H p ) p( E | H d ) p( E | H p ) p( E | H d )

Upload: truonghanh

Post on 27-Sep-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Taller básico de estadística forenseIntroducción la lógica paraa

la evaluación de las evidencias forenses

Geoffrey-Stewart Morrison

p(E|Hp)

p(E|Hd)

p(E|Hp)

p(E|Hd)

http://geoff-morrison.net/

Estas transparenciasestán disponibles en la siguiente página

Preocupaciones

� Marco lógicamente correcto para la evaluación de las evidencias- ; NCFS Views on statistical statements 2016ENFSI Guideline for Evaluative Reporting 2015

� Sin embargo, ¿cuál es la justificación para la opinión? ¿De dóndevienen los números?- Risinger a ICFIS 2011

� Demostración de validez y fiabilidad- NRC Report FSR ; PCAST Report 2016Daubert 1993; 2009; Codes of Practice 2014

� Transparencia- R v T 2010

� Diminuir la influencia potencial de sesgo cognitivo- NIST/NIJ Human Factors in Latent Fingerprint Analysis 2012

� Comunicar la fuerza de la evidencia forense al juzgador de loshechos

Paradigma

� Uso del marco de relaciones de verosimilitud para la evaluación delas evidencias– lógicamente correcta

� Uso de mediciones cuantitativas, datos relevantes (datosrepresentativ s de la población relevante), y modelos estadísticoso– transparente y reproducible– relativamente robusto al sesgo cognitivo

� Evaluación empírica de validez y fiabilidad bajo condiciones quereflejan las condiciones del caso bajo investigación con datos de,prueba seleccionados de la población relevante– única manera de saber como bien funciona

Validación Empírica

� The President’s Council ofAdvisors on Science and Technology

� informe que se publicó el 20 de septiembre 2016

� Forensic science in criminal courts: Ensuring scientific validity of

feature-comparison methods

� Ciencia forense en tribunales criminales: Asegurar la validez

científico de los métodos de comparación de características

Validación Empírica

� “Sin estimaciones de exactitud adecuados, la declaración de unexaminador que dos muestras son similares, o incluso indistinguibles,carece de sentido científico: no tiene valor probatorio, y tiene unconsiderable potencial para un impacto perjudicial.” (p 6)

� “el experto no debe hacer afirmaciones o implicaciones que van más alláde la evidencia empírica y las aplicaciones de los principiosestadísticos válidos a esa evidencia.” (p 6)

� “Donde no hay adecuados estudios empíricos y/o modelos estadísticospara proporcionar información significativa acerca de la exactitud deun método de comparación forense de características, los abogadosdel Departamento de Justicia y los examinadores no deben ofrecer untestimonio basado en el método.” (p 19)

Validación Empírica

� “ni la experiencia, ni el juicio, ni las buenas prácticas profesionales (talescomo programas de certificación y acreditación, protocolosestandarizados, pruebas de aptitud, y códigos de ética) puede sustituira la evidencia real de validez y fiabilidad fundamental.

� La frecuencia con la que se observó un patrón particular o conjunto decaracterísticas en diferentes muestras, que es un elemento esencial enla elaboración de conclusiones, no es una cuestión de ‘juicio.’ Es unacuestión empírica para que sólo la evidencia empírica es relevante.

� Del mismo modo, la expresión de un experto de basada en laconfianza

experiencia personal profesional o expresiones de entre losconsenso

profesionales acerca de la exactitud de su campo no puede sustituir alas tasas de error estimadas a partir de los estudios pertinentes.

Validación Empírica

� Para los métodos de comparación forense de características, elestablecimiento de la validez fundamental basada en la evidenciaempírica es, pues, una condición .sine qua non

� Nada puede sustituir a ello.” (p 6)

Validación Empírica

Marco de Relaciones de verosimilitud

� 1906 nuevo juicio de Alfred Dreyfus

Marco de relaciones de verosimilitud

� Jean-Gaston Darboux, Paul Émile Appell, Jules Henri Poincaré

� Se adoptaron para ADN a mediados de los años 90

Marco de relaciones de verosimilitud

� Association of Forensic Science Providers (2009)- Standards for the formulation of evaluative forensic science expert opinion

� 31 [de Aitken a Zadora] (2011)firmantes- Expressing evaluative opinions: A position statement

� European Network of Forensic Science Institutes (2015)- Guideline for evaluative reporting in forensic science

� US National Commission on Forensic Science (2016)- Views on statistical statements in forensic testimony

Marco de relaciones de verosimilitud

El Razonamiento Bayesiano

Imagina que conduces hacia el aeropuerto...

Imagina que conduces hacia el aeropuerto...

Imagina que conduces hacia el aeropuerto...

creenciaprobabilística

inicialevidencia+

creenciaprobabilísticaactualizada

¿más alta?o

¿más baja?

Imagina que conduces hacia el aeropuerto...

+

Imagina que conduces hacia el aeropuerto...

creenciaprobabilística

inicialevidencia

creenciaprobabilísticaactualizada

¿más alta?o

¿más baja?

Pierre-Simon Laplace¿Thomas Bayes?

� Razonamiento Bayesiano:

– se trata de la lógica

– no se trata de formulas matemáticas

– no hay nada complicado ni extraño con esto

– es la manera lógica de pensar sobre muchos problemas

Imagina que trabajas en un centro de reciclaje de zapatos...

� Te encu ntras con dos zapatos del mismo tamañoe

– ¿El hecho de que tienen el mismo tamaño indica queproceden de la misma persona?

– ¿El hecho de que tienen el mismo tamaño indica que es muyprobable que proceden de la misma persona?

� Tanto comosimilitud tipicidad

son importantes

Imagina que trabajas en un centro de reciclaje de zapatos...

� Te encu ntras con dos zapatos del mismo tamañoe

– ¿El hecho de que tienen el mismo tamaño indica queproceden de la misma persona?

– ¿El hecho de que tienen el mismo tamaño indica que es muyprobable que proceden de la misma persona?

zapato delsospechoso

huella de laescena del crimen

Imagina que eres un experto forense en comparación de calzado...

Imagina que eres un experto forense en comparación de calzado...

� La huella del zapato en la escena del crimen es talla 43

� El tamaño del zapato del sospechoso es talla 43

– ¿Cuál es la probabilidad de que la huella de la escena del

crimen sería talla 43 si la hubiera dejado el zapato del

sospechoso? (similitud)

� La mitad de los zapatos en el centro de reciclaje son talla 43

– ¿Cuál es la probabilidad de que la huella de la escena del

crimen sería talla 43 si la hubiera dejado el zapato de una

persona seleccionada al azar? (tipicidad)

� La huella del zapato en la escena del crimen es talla 48

� El tamaño del zapato del sospechoso es talla 48

– ¿Cuál es la probabilidad de que la huella de la escena del

crimen sería talla 48 si la hubiera dejado el zapato del

sospechoso? (similitud)

� 1% de los zapatos en el centro de reciclaje son talla 48

– ¿Cuál es la probabilidad de que la huella de la escena del

crimen sería talla 48 si la hubiera dejado el zapato de una

persona seleccionada al azar? (tipicidad)

Imagina que eres un experto forense en comparación de calzado...

� La huella en la escena del crimen y el zapato del sospechoso son

ambos talla 43

/ = 1 / 0.5 = 2similitud tipicidad

encontrar la huella de talla 43 sería 2 veces más probable si

fuera hecho por el zapato del sospechoso en vez de si fuera

hecho por el zapato de una persona seleccionada al azar

Imagina que eres un experto forense en comparación de calzado...

� La huella en la escena del crimen y el zapato del sospechoso son

ambos talla 48

/ = 1 / 0.01 = 100similitud tipicidad

encontrar la huella de talla 4 sería 100 veces más probable8 si

fuera hecho por el zapato del sospechoso en vez de si fuera

hecho por el zapato de una persona seleccionada al azar

Imagina que eres un experto forense en comparación de calzado...

� talla 43

/ = 1 / 0.5 = 2similitud tipicidad

� talla 48

/ = 1 / 0.01 = 100similitud tipicidad

� Sin tener una base de datos, ¿sería posible estimar subjetivamente

las proporciones relativas de los diferentes tamaños de zapatos

en la población y aplicar la misma lógica para llegar a una

respuesta conceptualmente similar?

Imagina que eres un experto forense en comparación de calzado...

¿Area?

similitud / = relación de verosimilitudtipicidad

Dado que es una vaca, ¿cuál es la probabilidad de que tenga 4 patas?

p( | ) = ¿?4 patas vaca

Dado que tiene 4 patas, ¿cuál es la probabilidad de que sea una vaca?

p( | ) = ¿?vaca 4 patas

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

0.04

0.05

0.06

-0.04

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

0.04

0.05

Dadas dos muestras de voz con propiedades acústicas y ,x x1 2

¿cuál es la probabilidad de que fueran producidas por el mismo locutor?

p( | ) = ¿?mismo locutor propiedades acústicas ,x x1 2

p( | ) = ¿?mismo locutor propiedades acústicas ,x x1 2

p( | ) = ¿?vaca x patas

p( | ) = ¿?mismo andante talla ,x xhuella zapato

apuesta a posteriori

relación de verosimilitud apuesta a priori

p( | )mismo locutor propiedades acústicas ,x x1 2

p( | )diferente locutor propiedades acústicas ,x x1 2

×

Teorema de Bayes

p( | ) p( )propiedades acústicas ,x x1 2 mismo locutor mismo locutorp( | ) p( )propiedades acústicas ,x x1 2 diferente locutor diferente locutor

=

creenciaprobabilística

inicialevidencia+

creenciaprobabilísticaactualizada

¿más alta?o

¿más baja?

Teorema de Bayes

¡¡¡ Sin Embargo !!!

El científico forense actuando como testigo expertoNO NOpuede dar una probabilidad a posteriori.

puede dar la probabilidad de que dos muestras de vozfueran producidos por el mismo locutor.

¿Por qué no?

� El científico forense no sabe las probabilidades a priori.

� Determinar la probabilidad de la hipótesis de la prosecución y sisupera una duda razonable (o el equilibrio de lasprobabilidades) es la tarea del juzgador de los hechos (juez,panel de jueces, o jurado), no la del científico forense.

� La tarea del científico forense es presentar el peso de la evidencia

que se puede extraer de las muestras que se han analizados. Nodebe considerar otras evidencias o informaciones no relevantesas su tarea.

Teorema de Bayes

apuesta a posteriori

relación de verosimilitud apuesta a priori

p( | )mismo locutor propiedades acústicas ,x x1 2

p( | )diferente locutor propiedades acústicas ,x x1 2

×p( | ) p( )propiedades acústicas ,x x1 2 mismo locutor mismo locutorp( | ) p( )propiedades acústicas ,x x1 2 diferente locutor diferente locutor

=

Teorema de Bayes

responsabilidad deljuzgador de los hechos

responsabilidad deljuzgador de los hechos

apuesta a posteriori

relación de verosimilitud apuesta a priori

p( | )mismo locutor propiedades acústicas ,x x1 2

p( | )diferente locutor propiedades acústicas ,x x1 2

×p( | ) p( )propiedades acústicas ,x x1 2 mismo locutor mismo locutorp( | ) p( )propiedades acústicas ,x x1 2 diferente locutor diferente locutor

=

Teorema de Bayes

responsabilidad deljuzgador de los hechos

responsabilidad deljuzgador de los hechosresponsabilidad del

científico forenseresponsabilidad delcientífico forense

apuesta a posteriori

relación de verosimilitud apuesta a priori

p( | )mismo locutor propiedades acústicas ,x x1 2

p( | )diferente locutor propiedades acústicas ,x x1 2

×p( | ) p( )propiedades acústicas ,x x1 2 mismo locutor mismo locutorp( | ) p( )propiedades acústicas ,x x1 2 diferente locutor diferente locutor

=

Relación de Verosimilitud

p( | )propiedades acústicas ,x x1 2 mismo locutorp( | )propiedades acústicas ,x x1 2 diferente locutor

p( | )E Hprosecución

p( | )E Hdefensa

p( | )x patas vacap( | )x patas no vaca

p( | )talla ,x xhuella zapato mismo andantep( | )talla ,x xhuella zapato diferente andante

� Científico forense: La probabilidad de observar las propiedades acústicasde la grabación del delicuente sería 4 veces más probable si fuesela voz del sospechoso contra si fuese la voz de una personaseleccionada al azar de la población relevante.

� Sea cual sea su creencia anterior sobre las probabilidades relativasde que la voz sea del sospecho contra de que sea de otrapersona, después de oír la relación de verosimilitud el juzgadorde los hechos debe cambiar su creencia de tal manera que debepensar que la probabilidad relativa de que sea la voz delsospechoso contra de que sea otro locutor será 4 veces más

alto de lo que fuera antes.

Ejemplo

antes

mismodiferente

1 1

La dad laaevidencia es 4 veces más probable hipótesis de mismolocutor que dad laa hipótesis de diferente locutor

multiplicareste por 4

4

1

1 1

si antes pensaba quela hipótesis de mismo locutor

y la de diferente locutorestaban igualmente probable

ya debe pensar que laprobabilidad de la hipótesisde mismo locutor es 4 vecesmás probable que la hipótesis

de diferente locutor

1

1111

después

mismodiferente

antes

mismodiferente

multiplicareste por 4

si antes pensaba quela hipótesis de mismo locutorestaba 2 veces más probable

que la hipótesisde diferente locutor

ya debe pensar que laprobabilidad de la hipótesisde mismo locutor es 8 vecesmás probable que la hipótesis

de diferente locutor

después

mismodiferente

8

1

1

21

1

11

1111

1111

La dad laaevidencia es 4 veces más probable hipótesis de mismolocutor que dad laa hipótesis de diferente locutor

antes

mismodiferente

multiplicareste por 4

si antes pensaba quela hipótesis de diferente

locutor estaba 2 veces másprobable que la hipótesis

de mismo locutor

ya debe pensar que laprobabilidad de la hipótesisde mismo locutor es veces2más probable que la hipótesis

de diferente locutor

después

mismodiferente

4

2

21

11

1 11

1111

La dad laaevidencia es 4 veces más probable hipótesis de mismolocutor que dad laa hipótesis de diferente locutor

antes

mismodiferente

multiplicareste por 4

si antes pensaba quela hipótesis de diferente

locutor estaba 8 veces másprobable que la hipótesis

de mismo locutor

ya debe pensar que laprobabilidad de la hipótesisde diferente locutor es 2veces más probable que lahipótesis de mismo locutor

después

mismodiferente

48

8

1

11111

1111

1111 1

111

1111

La dad laaevidencia es 4 veces más probable hipótesis de mismolocutor que dad laa hipótesis de diferente locutor

Cálculo de Relación de Verosimilitud I

datos discretos

¿Listos para calcular una relación de verosimilitud?

p( | )E Hprosecución

p( | )E Hdefensa

p( | )x patas vacap( | )x patas no vaca

0

0.2

0.4

0.6

0.8

1

1 2 3 4 5 6 7 8

vacas

no vacas

patas

pro

porc

ión

Datos discretos: gráfico de barras

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8

vacas

no vacas

patas

pro

porc

ión

p( | )4 patas vacap( | )4 patas no vaca

0 98, →

←0 49,

Datos discretos: gráfico de barras

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8

vacas

no vacas

patas

pro

porc

ión

p( | )4 patas vacap( | )4 patas no vaca

0 98, →

←0 49,0 98,0 49, = 2

Datos discretos: gráfico de barras

Población Relevante

Imagina que eres un experto forense en comparación de pelo ...s

� Todos los testigos dicen que el delicuente tiene pelo rubio

� El sospechoso tiene pelo rubio

� ¿Qué haces?

p( | )tener pelo rubio el sospechosop( | )tener pelo rubio otra persona

� Todos los testigos dicen que el delicuente tiene pelo rubio

� El sospechoso tiene pelo rubio

Imagina que eres un experto forense en comparación de pelo ...s

� Todos los testigos dicen que el delicuente tiene pelo rubio

� El sospechoso tiene pelo rubio

� Otra persona seleccionada al azar de la población relevante

p( | )tener pelo rubio el sospechosop( | )tener pelo rubio otra persona

Imagina que eres un experto forense en comparación de pelo ...s

p( | )tener pelo rubio el sospechosop( | )tener pelo rubio otra persona

� Todos los testigos dicen que el delicuente tiene pelo rubio

� El sospechoso tiene pelo rubio

� Otra persona seleccionada al azar de la población relevante

� ¿Cuál es la población relevante?

Imagina que eres un experto forense en comparación de pelo ...s

p( | )tener pelo rubio el sospechosop( | )tener pelo rubio otra persona

� Todos los testigos dicen que el delicuente tiene pelo rubio

� El sospechoso tiene pelo rubio

� Otra persona seleccionada al azar de la población relevante

� ¿Cuál es la población relevante?– Estocolmo– Pekín

� Se necesita una muestra de la población relevante

Imagina que eres un experto forense en comparación de pelo ...s

� Una relación de verosimilitud es la respuesta a una pregunta

específica definido por la hipótesis de la y laprosecución

hipótesis de la .defensa

� La hipótesis de la especifica la .población relevantedefensa

� El científico forense tiene que hacer explícito la pregunta que ha

contestado para que el juzgado de los hechos pueda:

– entender la pregunta

– considerar si la pregunta es apropiada

– entender la respuesta

Falacias de Interpretación

� Científico Forense:– La probabilidad de obtener las propiedades acústicas del la voz enla llamada telefónica sería mil veces más probable si fuese la vozdel acusado en vez de si fuese la voz de otra persona seleccionada alazar de la población relevante.

� Fiscal:– Entonces, para simplificar: es mil veces mas probable que la vozde la llamada telefónica es la voz de acusado de que es la voz deotra persona.

Falacia del Fiscal

Falacia del Fiscal

� Científico Forense:– La probabilidad de obtener las propiedades acústicas del la voz enla llamada telefónica sería mil veces más probable si fuese la vozdel acusado en vez de si fuese la voz de otra persona seleccionada alazar de la población relevante.

� Fiscal:– Entonces, para simplificar: es mil veces mas probable que la vozde la llamada telefónica es de que esla voz del acusado la voz deotra persona.

p( | )Hprosecución Ep( | )Hdefensa E

p( | )E Hprosecución

p( | )E Hdefensa

Falacia del Abogado Defensor

� Científico Forense:– Sería mil veces más probable obtener las propiedades medidas de huellaladactilar parcial si su origen fuese el dedo del acusado contra de si fuese de undedo de otra persona.

� Abogado Defensor:– Bueno, dado que hay aproximadamente un millón de personas en la región, y bajola suposición de que cualquiera de ellos pudiera haber dejado la huella, empezamoscon una apuesta a priori de uno dividido por un millón, y multiplicando por milllegamos a una ap esta a posteriori de uno dividido por mil. Uno dividido por mil esuun número pequeño. Dado que es mil veces más probable que la huella procede deotra persona de que la procede de mi cliente, sostengo que la huella dactilar noprueba que mi cliente estuv presente en la escena del crimen y que el jurado debaodesatender la evidencia de la huella dactilar.

LA MATEMÁTICA ES CORRECTA: apuesta a priori × relación de verosimilitud = apuesta a posteriori(1 / 1 000 000) × 1 000 = 1 / 1 000

Falacia de Números Grandes

� Científico Forense:– Obtener las propiedades medidas del ADN encontrado en laescena del crimen sería un billón veces más probable si fuera laADN del acusado contra de si fuera la ADN de otra persona en elpaís.

� Juzgador de los Hechos:– Un billón es un número grande. Por esto, está cierto que el ADNprocede del acusado. Puedo descartar cualquier otra evidencia quesugiere que no procedió de él.

Cálculo de Relación de Verosimilitud II

datos continuos

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8

vacas

no vacas

patas

pro

porc

ión

p( | )4 patas vacap( | )4 patas no vaca

0 98, →

←0 49,0 98,0 49, = 2

Datos discretos: gráfico de barras

Datos continuos: histogramas funciones de densidad de probabilidad→

0

0.002

0.004

0.006

0.008

0.010

0.012

0.014

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos: 10

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos: 5

(a) (b)

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos ,: 2 5

(c)

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos ,: 0 1

(d)

0

0.002

0.004

0.006

0.008

0.010

0.012

0.014

Datos continuos: histogramas funciones de densidad de probabilidad→

0

0.002

0.004

0.006

0.008

0.010

0.012

0.014

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos: 10

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos: 5

(a) (b)

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos ,: 2 5

(c)

0 20 40 60 80 100 120 140 160 180 200

anchura de rectángulos ,: 0 1

(d)

0

0.002

0.004

0.006

0.008

0.010

0.012

0.014

μ = 100= 30σ

20 40 60 80 100 120 140 160 180 2000

0.005

0.010

0.015

0.020

0.025

x

0

densid

ad d

e p

robabaili

dad

modelo delsospechoso

modelo de lapoblación

20 40 60 80 100 120 140 160 180 2000

0.005

0.010

0.015

0.020

0.025

x

0

0.021

0.005

valordeldelicuente

modelo de lapoblación

modelo delsospechoso

RV = / = 4.020.021 0.005densid

ad d

e p

robabaili

dad

Modelos de Mezclas Gaussianas

20 40 60 80 100 120 140 160 180 20000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

modelo de lapoblación

modelo delsospechoso

380

390

400

410

420

430

440

1980

1990

2000

2010

2020

2030

2040

0

0.5

1

1.5

x 10-3

Gracias

http://geoff-morrison.net/

http://forensic-evaluation.net/