análisis de datos en física de partículas · 2013. 6. 5. · funciones de una variable aleatoria...
TRANSCRIPT
-
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 1
Análisis de Datos en Física de Partículas
Sección de PosgradoFacultad de CienciasUniversidad Nacional de Ingeniería
C. Javier [email protected]://compinformatidf.wordpress.com/
Página del curso:http://compinformatidf.wordpress.com/2013/04/13/curso-analisis-estadistico-de-datos-en-fisica-de-particulas-mf708/
-
Análisis de Datos en Física de Partículas: Capítulo 2
1 Teorema de Probabilidad de Bayes, Variables aleatorias, y pdfs2 Funciones de r.v.s, Valores de expectación, propagación de errores3 Catálogo de pdfs4 El método de Monte Carlo5 Test estadísticos: conceptos generales6 Test statistics, métodos multivariantes7 Tests Bondad de ajuste (goodness-of-fit)8 Parámetros de estimación, maximum likelihood9 Mas de maximum likelihood10 Método de mínimos cuadrados (least squares)11 Intervalo de estimación, establecimiento de límites12 Parámetros molestos (nuisance), incertidumbres sistemáticas13 Ejemplos de aproximación Bayesiana
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 2
-
Funciones de una variable aleatoria
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 3
Una función de una variable aleatoria es en sí misma una variable aleatoria.
Supongamos que x sigue una pdf f(x), consideremos una función a(x).
¿Que es la pdf g(a)?
dS = región del espacio x para el cuala está en [a, a+da].
Para el caso de variable con inversaúnica esto simplemente es
→
-
Funciones sin inversa única
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 4
Si inversa de a(x) no es única,incluir todos los intervalos dx en dSque corresponden a da:
Ejemplo:
-
Funciones de mas de una r.v.
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 5
Considerar r.v.s y una función
dS = región del espacio-x entre (hyper)superficies definidas por
-
Funciones de mas de una r.v. (2)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 6
Ejemplo: r.v.s x, y > 0 siguen pdf conjunta f(x,y),
considerar la función z = xy. ¿Qué es g(z)?
→
(Convolución de Mellin)
-
Más en la transformación de variables
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 7
Considerar un vector aleatorio con pdf conjunta
Formar n funciones linealmente independientes
Para las que las funciones inversas existan.
Entonces la pdf conjunta del vector de funciones es
donde J es el
determinante Jacobiano:
Por e.g. integra sobre componentes que no queremos.
-
Valores de expectación
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 8
Considerar r.v. continuo x con pdf f(x).
Definir valor de expectación (medio) como
Notación (frecuente): ~ “centro de gravedad” del pdf.
Para una función y(x) con pdf g(y),
(equivalente)
Variancia:
Notación:
Desviación Standard:
σ ~ ancho del pdf, mismas unidades que x.
-
Covariancia y correlación
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 9
Definir covariancia cov[x,y] (tambien usar notación matricial Vxy) como
Coeficiente de correlación (adimensional) definido como
Si x, y, independiente, i.e., , entonces
→ x e y, ‘no correlacionados’
N.B. lo contrario no siempre es cierto.
-
Correlación (cont.)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 10
-
Propagación de errores
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 11
que cuantifican los errores de medición en xi.
Suponer que medimos un conjunto de valores
y que tenemos las covariancias
Ahora considerar la función
¿Cual es la variancia de
El camino difícil: usar pdf conjunta para hallar la pdf
entonces de g(y) hallar V[y] = E[y2] − (E[y])2.
Frecuentemente impráctico, puede ni siquiera ser bien conocido.
-
Propagación de errores (2)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 12
Suponer que tenemos
en la práctica sólo estimaciones dadas por la medida
Expandir a 1st orden en una serie de Taylor como
desde que
Para hallar V[y] necesitamos E[y2] y E[y].
-
Propagación de errores (3)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 13
Poniendo los ingredientes juntos da la variancia de
-
Propagación de errores (4)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 14
Si los xi no están correlacionados, i.e., entonces esto
Similar para un conjunto de m funciones
O en notación matricial donde
se convierte en
-
Propagación de errores (5)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 15
La formulae de ‘propagación de errores’ nos da las covariancias de un conjunto de funciones en términos de las covariancias de las variables originales.
Limitaciones: exacta solo si lineal.Aproximación falla si función es nonlineal sobre una región comparableen tamaño al σi.
N.B. No hemos dicho nada acerca de la pdf exacta del xi,
por ejemplo, que no tiene que ser gaussiano.
x
y(x)
σx
σy
xσx
?
y(x)
-
Propagación de errores – casos especiales
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 16
→
→
Esto es, si los xi no son correlacionados:
añadir errores cuadráticamente para la suma (o diferencia), añadir errores relativos cuadráticamente para el producto (o radio).
Pero correlaciones pueden cambiar esto completamente...
-
Propagación de errores – casos especiales (2)
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 17
Considerar con
Ahora supongamos ρ = 1. Entonces
i.e. para 100% de correlación, error en la diferencia→ 0.
-
Terminando Capítulo 2
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 2 página 18
Conocemos como determinar el pdf de una funcion de una r.v.
una variable, inversa única:
también vimos inversa no-única y caso multivariante.
Conocemos como describir un pdf usando
valores de expectación (media, variancia),covariancia, correlación, ...
Dada una función de una variable aleatoria, conocemos comohallar la variancia de la función usando propagación de errores.
También para matriz covariancia en caso multivariante;basado en aproximación lineal.