¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
¿Nueva estadística?
Miguel Ángel García PérezFacultad de Psicología
Universidad Complutense de Madrid
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
¿Nueva estadística?1. ¿Por qué hace falta una nueva estadística?
2. ¿Dónde está la novedad?
3. ¿Nos lleva esto a más y mejor conocimiento?
1
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Dimorfismo sexual en razón 2D:4D
Hombresnh = 400
Mujeresnm = 400
Media ± ET 0.98 ± 0.002 1.00 ± 0.002diferencia t = 3.79; p = 0.0002
2
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Fotografía de ChrisO, tomada de English language Wikipedia, CC BY-SA3.0, https://commons.wikimedia.org/w/index.php?curid=2367271
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
35 machos31 hembras
3
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
303 machos242 hembras
267 machos213 hembras
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 4
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Problemas prácticos de la vieja estadística
–Si la muestra es suficientemente grande, la hipótesis nula se rechazaprácticamente siempre
! muestreo secuencial (recoger más datos si conviene)! “p-hacking” (p.ej., eliminar “atípicos”)
–El valor del nivel de significación ( ) es arbitrario y responde a unplanteamiento dicotómico: los resultados son significativos o no
! estadísticamente significativo no es sinónimo de científicamenterelevante
–p es la probabilidad del resultado encontrado si la hipótesis nula es cierta;esto es irrelevante porque lo que nos interesa es la probabilidad de que lahipótesis sea cierta
¿Soluciones?
5
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
American Psychologist, 1999, 54, 594–604
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 6
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Arbuthnott, J. (1710). Philosophical Transactions, 27, 186–190
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Arbuthnott, J. (1710). Philosophical Transactions, 27, 186–190
7
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Datos: (1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1); n = 12; Y = = 8; = 0.05X
Contraste de hipótesis
H0: = 0.5 H1: 0.5
Z = = 1.1558/12 0.50.5×0.5/12
P(Z ≥ 1.155) = 0.124
Estadístico de contraste, Z
N(0, 1)
–4 –3 –2 –1 0 1 2 3 4
p = 0.248, no significativo
Estimación
Estimación puntual: = 8/12 = 0.67ˆIntervalo de confianza del 95%:
H0: = 0 H1: 0
Estadístico de contraste, Z
N(0, 1)
–4 –3 –2 –1 0 1 2 3 4
1.96 < < 1.968/12 0
0(1 0)/12
IC95: 0 [0.391, 0.862]
Tamaño del efecto:
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Hombresnh = 400
Mujeresnm = 400
Media ± ET 0.98 ± 0.002 1.00 ± 0.002diferencia t = 3.79; p = 0.0002
Tamaño del efecto:
= μm μh
x
ds = = = 0.268t 1nh
1nm
3.79 1400
1400
8
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Datos: (1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1); n = 12; Y = = 8X
Estimación
Estimación puntual: = 8/12 = 0.67ˆIntervalo de confianza del 95%:
H0: = 0 H1: 0
Estadístico de contraste, Z
N(0, 1)
–4 –3 –2 –1 0 1 2 3 4
1.96 < < 1.968/12 0
0(1 0)/12
IC95: 0 [0.391, 0.862]
¿Tamaño del efecto?
X = 0.667sx = 0.471
Frec
uenc
ia
Variable X0 1
0
2
4
6
8
10
= 0.354 ??0.667 0.50.471
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 9
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
Kruschke, J. K., & Liddell, T. M. (2017). The Bayesian New Statistics: Hypothesis testing,estimation, meta-analysis, and power analysis from a Bayesian perspective. PsychonomicBulletin & Review, en prensa
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 10
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
estadístico de contraste-4 -3 -2 -1 0 1 2 3 4
dens
idad
0
0.1
0.2
0.3
0.4
0.5p = 0.157
datos: [0 0 0 0 0 0 1 1 1 0 1 0 1 1 0 0 0 0 1 0 ... 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 1 0]; (π = 0.5)H0: π = 0.5; H1: π 0.5; N = 50; Y = 20
parámetro π
0 0.2 0.4 0.6 0.8 1
dens
idad
0
2
4
6
8
10
12FB = 0.468 a posteriori
a priori
log p-10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0
log
FB
-1
0
1
2
3
4
5
6
7
8
9p ≤ 0.05: 5.00%
FB ≥ 3: 1.25%
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 11
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
parámetro π
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
vero
sim
ilitud
×10-5
0
2
4
6
8
max: 0.778IC95: [0.548, 0.910]
p = 0.018
N = 18; X = 14 f(π) = πX(1-π)N-X
parámetro π
0 0.2 0.4 0.6 0.8 1
dens
idad
de
prob
abilid
ad
0
5
10
15distribución a priori; Beta(1, 1)
parámetro π
0 0.2 0.4 0.6 0.8 1
dens
idad
de
prob
abilid
ad
0
5
10
15max: 0.778HDI95: [0.564, 0.922]factor de Bayes: 0.22
distribución posteriorparámetro π
0 0.2 0.4 0.6 0.8 1
dens
idad
de
prob
abilid
ad
0
5
10
15distribución a priori; Beta(120, 120)
parámetro π
0 0.2 0.4 0.6 0.8 1
dens
idad
de
prob
abilid
ad
0
5
10
15max: 0.520HDI95: [0.458, 0.580]factor de Bayes: 0.85
distribución posterior
12
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
valor verdadero de π0 0.2 0.4 0.6 0.8 1
cobe
rtura
0.5
0.6
0.7
0.8
0.9
intervalo de confianza del 95%
valor verdadero de π0 0.2 0.4 0.6 0.8 1
límite
s de
l int
erva
lo
0
0.5
1
valor verdadero de πanch
ura
del i
nter
valo
0
0.2
0.4
valor de π0 0.2 0.4 0.6 0.8 1
dens
idad
0
5
10
15a priori, Beta(1,1)
valor verdadero de π0 0.2 0.4 0.6 0.8 1
cobe
rtura
0.5
0.6
0.7
0.8
0.9
int. credibilidad del 95%, Beta(1,1)
valor verdadero de π0 0.2 0.4 0.6 0.8 1
límite
s de
l int
erva
lo
0
0.5
1
valor verdadero de πanch
ura
del i
nter
valo
0
0.2
0.4
valor de π0 0.2 0.4 0.6 0.8 1
dens
idad
0
5
10
15a priori, Beta(120,120)
valor verdadero de π0 0.2 0.4 0.6 0.8 1
cobe
rtura
0.5
0.6
0.7
0.8
0.9
int. credibilidad del 95%, Beta(120,120)
valor verdadero de π0 0.2 0.4 0.6 0.8 1
límite
s de
l int
erva
lo
0
0.5
1
valor verdadero de πanch
ura
del i
nter
valo
0
0.2
0.4
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 13
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
14
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
número de observaciones0 10 20 30 40 50 60 70 80
prop
orci
ón e
mpi
rica
0
0.2
0.4
0.6
0.8
1
H0
número de observaciones0 10 20 30 40 50 60 70 80
pva
lor
0
0.2
0.4
0.6
0.8
1
número de observaciones0 10 20 30 40 50 60 70 80
log
fact
or d
e Ba
yes
0
5
10
15
20
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017 15
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
año1630 1640 1650 1660 1670 1680 1690 1700 1710
mile
s de
nac
imie
ntos
6
8
10
12
14
16
Arbuthnott (1710)
parámetro π
0.35 0.4 0.45 0.5 0.55 0.6 0.65
dens
idad
0
20
40
60
80
100
120
año1630 1640 1650 1660 1670 1680 1690 1700 1710
mod
a po
ster
ior +
HD
I 95
0.45
0.5
0.55
13 de 82 intervalos (15.85%) contienen π = 0.5
parámetro π
0.35 0.4 0.45 0.5 0.55 0.6 0.65
dens
idad
0
20
40
60
80
100
120
año1630 1640 1650 1660 1670 1680 1690 1700 1710
prop
. hom
bres
+ IC
95
0.45
0.5
0.55
12 de 82 intervalos (14.63%) contienen π = 0.5
¿Nueva estadística? Miguel Ángel García Pérez Basque Center for Applied Mathematics, 22 Sep 2017
A modo de resumen ...
! El uso habitual de la estadística frecuencista (contraste de hipótesis yp valores) deja mucho que desear: Será significativo, pero ¿esrelevante?
! El énfasis en estimación frecuencista (intervalos de confianza ytamaños del efecto) añade información útil, pero siguen faltandocriterios para juzgar relevancia
! En estadística frecuencista se pueden usar “trucos” para ayudar a quela conclusión vaya en una dirección u otra
! Las alternativas Bayesianas (factores de Bayes e intervalos decredibilidad) tienen exactamente los mismos problemas de fondo, bajootra apariencia
! No hace falta una “nueva estadística” sino criterios de relevancia
16