estadística redux

25
29/11/21 1 Cómo escribir, publicar y difundir un texto científico Dr. Gregorio Giménez Curso organizado por la Vicerrectoría de Investigación 1 Estadística Análisis y visualización de datos 2

Upload: others

Post on 28-Jul-2022

40 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadística Redux

29/11/21

1

Cómo escribir, publicar y difundir un texto científicoDr. Gregorio Giménez

Curso organizado por la Vicerrectoría de Investigación

1

EstadísticaAnálisis y visualización de datos

2

Page 2: Estadística Redux

29/11/21

2

¿Qué es la estadís-ca?

Disciplina que trata de extraer información a los números.

Mostrar información.

3

Consideración

Los números no hablan por sí mismos

5

Page 3: Estadística Redux

29/11/21

3

7

215Harold Shipman

9

Page 4: Estadística Redux

29/11/21

4

11

David Spiegelhalter

12

Page 5: Estadística Redux

29/11/21

5

Spiegelhalter, D. (2019). The art of statistics: Learning from data. Penguin UK.

13

¿Quiénes eran las víctimas de Harold Shipman?

14

Page 6: Estadística Redux

29/11/21

6

¿Cuándo cometía sus crímenes?

16

Ejercicio

¿Quiénes eran las víctimas de Harold Shipman?

¿Cuándo come?a sus crímenes?

¿Proporciona el análisis estadísticoevidencia incriminatoria?

19

Page 7: Estadística Redux

29/11/21

7

Figure 0.1 A scatter-plotshowing the age and theyear of death of Harold Shipman’s 215 confirmedvictims. Bar-charts havebeen added on the axes to reveal the pattern of agesand the pattern of yearsin which he committedmurders.

21

Figure 0.2. The time at which Harold Shipman’s patients died, compared to the times at which patients of other local general practitioners died. The pattern does notrequire sophisticated statistical analysis.Shipman used to make his home visits after lunch.

24

Page 8: Estadística Redux

29/11/21

8

Figure 0.2. The time at which Harold Shipman’s patients died, comparedto the times at which patients of other local general practitioners died.

25

Reflexión

Ha habido un aumento en • La producción cien3fica, • La presión por publicar en

revistas bien rankeadas• Las bases de datos y del

so;ware estadís>co amigable

Esto hace que sea cada vez más necesario aprender a hacer buena estadís>ca

26

Page 9: Estadística Redux

29/11/21

9

Spiegelhalter(2019) identifica varios peligros.“Buenas maneras” de hacer estadística

• Tenemos que estar atentos ante las prácticas de “torturar” datos y presentar informes selectivos.• Sobreinterpretar un solo

estudio fuera de contexto.• Nuestra investigación científica

debe ser replicada por otros científicos.• Necesitamos comprender y

criticar cualquier conclusión extraída por otros a partir de los conceptos básicos de la estadística.

27

Ejercicio

Lectura“Cómo tres investigadores lograron publicar artículos

intencionadamente erróneos en prestigiosas revistas”

28

Page 10: Estadística Redux

29/11/21

10

Recomendación

29

Causalidad

58

Page 11: Estadística Redux

29/11/21

11

¿Qué es causalidad?

60

Si bajo el precio de las manzanas y ese día vendo más manzanas, ¿puedo hablar de que la bajada de precios ha tenido el efecto de aumentar la venta de manzanas?

61

Page 12: Estadística Redux

29/11/21

12

Fallecimientos por caídas en el metro de Londres por la pandemia de la COVID-19¿Cómo averiguar cuál es la verdadera causa?¿Cómo demostrarlo?

63 66

Page 13: Estadística Redux

29/11/21

13

Extracto

• Highly educated people are more likely to suffer from brain tumours than thosewho do not progress as far in their educa&on, according to a new study.• Gliomas are the most common type of brain tumour which develops in the main

supporOng cells in the brain called glial cells.• And researchers found they are more common among people who are university-

educated. They did not establish the reason for the apparent link.• Experts at University College London and the Karolinska InsOtute, in Stockholm,

Sweden, examined data from 4.3 million people in Sweden born between 1911 and 1961.• They tracked them between 1993 and 2010 and found that 7,100 women and

5,700 men were diagnosed with brain tumours.• Lead author Dr Amal Khanolkar, of the University College London, said: “This

study found consistent associaOons between indicators of higher socioeconomicposiOon and increased risk of glioma in both sexes.”

67

¿Qué ocurre?

69

Page 14: Estadística Redux

29/11/21

14

Explicación de los autores del estudio

• Khanolkar, A. R., Ljung, R., Talbäck, M., Brooke, H. L., Carlsson, S., Mathiesen, T., & Feychting, M. (2016). Socioeconomic position and the risk of brain tumour: a Swedish national population-based cohortstudy. J Epidemiol Community Health, 70(12), 1222-1228.• Los sesgos de detección y registro del cáncer son posibles

explicaciones de los hallazgos• Sesgo de verificación

70

Spiegelhalter, D. (2019). The art of statistics: Learning from data. Penguin UK.

71

Page 15: Estadística Redux

29/11/21

15

Nociones a tener en cuenta que pueden afectar a nuestra idea de causalidad1. Variables de confusión

2. Causación inversa y doble causalidad

72

Variables de confusión(confunders / lurking factors)

Cuando una aparente asociación entre dos resultados puede explicarse por algún factor común observado que influye en ambos, esta causa común se conoce como confusión.

73

Page 16: Estadística Redux

29/11/21

16

Resultados escolares

Colegios privados

Nivel socioconó

mico

Ejemplo 1

76

Ejemplo 2

Spiegelhalter, D. (2019). The art of sta+s+cs: Learningfrom data. Penguin UK.

Muchos niños son diagnosticados con autismo después de ser vacunados. ¿Significa que las vacunas causan el autismo? No, significa que ambos acontecimientos se producen a la misma edad.

77

Page 17: Estadística Redux

29/11/21

17

Correlación no implica causalidadhttps://www.tylervigen.com/spurious-correlations

78 80

Page 18: Estadística Redux

29/11/21

18

81

Más relaciones espuriasheps://tylervigen.com/discover

86

Page 19: Estadística Redux

29/11/21

19

Causación inversa y

doble causalidad

88

Figura 2.2. Relación entre la inversión y renta por persona empleada. 1980-2015.

Giménez, G. (2017). Introducción al crecimiento económico y desarrollo. Madrid: Ediciones Pirámide.

AFG

ALB

DEU

AGO

SAU

DZA

ARG

ARM

AUSAUT

AZEBHS

BHR

BGD

BRB

BLR

BEL

BLZ

BEN

BTNBOL

BIHBWA

BRA

BRN

BGR

BFA

BDI

CPV

KHMCMR

CAN

TCD

CHL

CHN

CYP

COL

COM

COG

ZAR

KOR

CRI

CIV

HRVCUB

DNK

ECU

EGY

SLV

ERI

SVN

ESP

USA

EST

ETH

MKDRUS

FJI

PHL

FINFRA

GAB

GMB

GEO

GHA

GRC

GTM

GIN GNB

GUY

HND

HKG

HUN

IND

IDN

IRNIRQ

IRL

ISL

SLB

ISRITA

JAM

JPN

JORKAZ

KENKGZ

KWT

LSO

LVALBN

LBR

LBYLTU

LUX

MDG

MYS

MWI

MDV

MLI

MLT

MAR

MUS

MRT

MEX

MNG

MNE

MOZMMR

NAM

NPL

NIC

NER

NGA

NOR

NZLOMNNLD

PAK

PAN

PNG

PRY

PER

POL PRT

PRI

MAC

GBR

SYR

CAF

CZE

MDA

LAO

DOM

SVK

WBG

ROM

RWA

SEN

SRB

SLE

SGP

SOM

LKA

ZAF

SDN

SWE CHE

SUR

SWZ THA

TZA

TJK

TMP

TGO

TTO

TUNTKM

TUR

UKR

UGA

URY

UZB

VEN

VNM

YEM

ZMB

ZWE

y = 0.02x + 3.88

4000

1000

030

000

8000

0PI

B po

r cad

a pe

rson

a em

plea

da (e

scal

a lo

garít

mic

a), 2

015

10 20 30 40 50Formación bruta de capital fijo (% del PIB), 1980-2015

90

Page 20: Estadística Redux

29/11/21

20

Entonces, ¿cómo podemos comprobar la existencia de causalidad?

92

¿Fumar causa cáncer de pulmón?

93

Page 21: Estadística Redux

29/11/21

21

Esto es, nuestra idea estadísGca de causalidad no es estrictamente determinista

95

¿Podemos hablar de causalidad?Ensayos clínicos - Randomized control trials

97

Page 22: Estadística Redux

29/11/21

22

¿Reducen las estatinas el colesterol?

98

Treated Control

RCT

Randomized control trials (ensayos aleatorizados)

100

Page 23: Estadística Redux

29/11/21

23

Los ensayos aleatorizados han sido el “estándar de oro” para probar nuevos tratamientos médicos y ahora se utilizan cada vez más para estimar los efectos de las nuevas políticas en la educación, economía y otras disciplinas

101

Crítica

• La esencia de la crí-ca se ha dirigido a la limitación de este enfoque en el sen-do de que un determinado ensayo aleatorizado solo proporciona una respuesta precisa y sólida a una pregunta muy limitada, es decir, ¿cuál es el efecto de un programa específico, en una fecha específica y dentro de un contexto específico?

• ¿Contribuyen los ensayos aleatorizados a descubrir los mecanismos subyacentes a través de los cuales una intervención afecta el resultado deseado?

102

Page 24: Estadística Redux

29/11/21

24

Crítica

“Learning about theory, or mechanisms, requires that the invesHgaHon be targeted toward that theory, toward why something works, not whether it works” (Deaton 2010, p.p. 442).

*Deaton, A. (2010). Instruments, randomization, and learning aboutdevelopment. Journal of economic literature, 48(2), 424-55.

103

¿Podemos concluir causalidad a partir de datos observados?

104

Page 25: Estadística Redux

29/11/21

25

1. Fuerza 2. Consistencia (reproducibilidad)3. Especificidad4. Temporalidad5. Gradiente biológico (relación dosis-

respuesta)6. Plausibilidad7. Coherencia8. Experimento9. Analogía10. Reversibilidad

CriteriosdeBradfordHill(1965)*

*Hill, A. B. (1965). The Environment and Disease: Association or Causation? Proceedings of the Royal Society of Medicine, 58(5), 295–300. https://doi.org/10.1177/003591576505800503

105