informe gráfico p-p plot
DESCRIPTION
p-p plotTRANSCRIPT
11Diagrama P-P plot para una distribucin Log-normal a partir de datos empricos
DIAGRAMA P-PPLOTJimmy D. Almeyda AtncarUNIVERSIDAD NACIONAL DE INGENIERA
Facultad de Ingeniera Geolgica Minera y MetalrgicaEscuela Profesional de Ingeniera de MinasAugusto Teves Rojas. Ing.
TABLA DE CONTENIDO1.OBJETIVOS32.ALCANCES33.INTRODUCCIN34.FUNDAMENTO TEORICO35.PRIMER TRABAJO DEJADO POR EL PHD . MARN76.TABLAS Y FIGURAS76.1 Tablas de datos Tabla de datos de poblacin anormal76.2 Figuras histogramas y P-P plot87.SEGUNDO TRABAJO DEJADO POR EN PHD. MARN117.1Algoritmo del Variograma117.2Visualizacin del programa117.3Algoritmo del programa en VBA117.4Creacin de datos con el T.L.C iniciar el programa128.TABLAS Y FIGURAS138.1Tablas de datos generados138.2Figuras149.CONCLUSIONES1510.REFERENCIAS15
OBJETIVOS Analizar la grfica p-p plot de los Ln de los datos dejador por el PHD Marn. Analizar la grfica p-p plot de los Ln de los datos con un incremento de datos anormales. Tener capacidad para comprender porque se produce cambios es la grfica p-p plot. Crear un algoritmo para generar datos con distribucin de gauss usando el Teorema del Limite Central.
INTRODUCCINLa necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas las reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de informacin enmarcada dentro de este contexto. Como consecuencia de este impulso surgi la geoestadstica, teniendo como padre a George Matheron.
FUNDAMENTO TEORICOPROBABILIDAD-PROBABILIDAD (PP) TERRENOUna probabilidad-probabilidad (PP) parcela se utiliza para ver si un determinado conjunto de datos sigue alguna distribucin especificada. Debe ser aproximadamente lineal si la distribucin especificada es el modelo correcto.
La probabilidad-probabilidad (PP) trama se construye utilizando la funcin de distribucin acumulada terica, F (x), del modelo especificado. Los valores de la muestra de datos, en orden de menor a mayor x, se denotan X (1), X (2),..., X (n). Para i = 1, 2,....., n, F (x (i)) se representa frente a (i-0.5) / n.EjemploEn la figura de abajo, dos conjuntos de datos se han visualizado en grficos de probabilidad normal. El primer conjunto de datos (que se muestra en negro) realmente proviene de una distribucin normal, por lo que la trama PP es lineal. El segundo conjunto de datos (que se muestra en rojo) proviene de una distribucin exponencial, por lo que no es ni siquiera cerca de simetra, y la trama del PP se desva de una lnea recta. El uso de estas parcelas, queremos inferir correctamente que el primer conjunto de datos es normal, pero la segunda no lo es.
HISTOGRAMAEn estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribucin de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua, de la misma y que es de inters para el observador (como la longitud o la masa). De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o poblacin por ubicarse hacia una determinada regin de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la caracterstica. As pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisin entre los valores de todas las partes que componen la poblacin o la muestra, o, en contraposicin, poder observar el grado de variabilidad, y por ende, la dispersin de todos los valores que toman las partes, ..En el eje vertical se representan las frecuencias, es decir, la cantidad de poblacin o la muestra, segn sea el caso, que se ubica en un determinado valor o subrango de valores de la caracterstica conocido como intervalo de clase. En el eje horizontal se representa el espectro de valores posibles que toma la caracterstica de inters, evidentemente, cuando ste espectro de valores es infinito o muy grande el mismo es reducido a slo una parte que muestre la tendencia o comportamiento de la poblacin, en otras ocasiones ste espectro es extendido para mostrar el alejamiento o ubicacin de la poblacin o la muestra analizada respecto de un valor de inters.
TEOREMA DEL LIMITE CENTRALEl teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes y de varianza no nula pero finita, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.Sealafuncin de densidadde ladistribucin normaldefinida como:
Con unamediay unavarianza2. El caso en el que su funcin de densidad sea, a la distribucin se le conoce comonormal estndar. Se defineSncomo la suma denvariables aleatorias, independientes, distribuidas, y con una mediay varianza2finitas (20):
De manera que, la media deSnesny lavarianzan2, dado que son variables aleatorias independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se hace una estandarizacin deSncomo:
Para que la media de la nueva variable sea igual a 0 y ladesviacin estndarsea igual a 1. As, las variablesZnconvergern en distribucina la distribucin normal estndarN(0,1), cuandontienda ainfinito. Como consecuencia, si (z) es lafuncin de distribucinde N(0,1), para cadanmero realz:
Donde Pr () indicaprobabilidady lim se refiere allmite matemtico.
DIAGRAMA P-P PLOT PARA UNA DISTRIBUCIN LOG- NORMALAgregar datos al archivo una poblacin anormal y ver la media y desviacin tpica hacer el P-P plot.Tabla de datos de poblacin anormal#DatosLn(datos)
11.9080.64605557
20.7630.27049725
30.760.27443685
40.9040.10092592
52.991.09527339
60.490.71334989
70.6890.37251401
81.5870.46184544
92.3930.87254781
100.8730.13581972
111.8810.63180355
120.9670.03355678
131.1030.09803374
142.0840.73428912
19650.7420.29840604
19660.908-0.0965109
19672.0480.71686371
19681.5110.41277168
19693.0331.10955223
19701.1220.11511281
19710.6130.48939034
19720.950.05129329
19731.4430.36672428
19741.1590.14755756
19751.4120.34500714
19761.1460.13627762
19770.8640.14618251
19782.6510.97493693
6.2 Figuras histogramas y P-P plotHISTOGRAMA DE DATOS
HISTOGRAMA DE LN(DATOS)
P-P PLOT DE LN DE DATOS
CONCLUSIONES El p-p plot sirve para identificar la funcin ms adecuada para representar los datos. El p-p plot ayuda a identificar posibles anomalas en el muestreo al variar la recta. El Teorema del Limite central nos ayuda a simular datos con una media y desviacin estndar dados. El teorema del lmite central nos da como resultado una funcin de gauss
REFERENCIASClases de Informtica por Ing. Chvez, Adolfo Clases del PhD. Alfredo Marn SuarezClases realizadas por el Ing. Tves.http://www.stats.gla.ac.uk/glossary/?q=node/392http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central