estadistica aplicada

Upload: gilbert-sifuentes-mendoza

Post on 22-Jul-2015

151 views

Category:

Documents


0 download

TRANSCRIPT

ESTADISTICA Y PROBABILIDADES

AO DE LA INTEGRACIN NACIONAL Y EL RECONOCIMIENTO DE NUESTRA DIVERSIDAD

FACULTAD DE ING. INDUSTRIAL, SISTEMAS E INFORMATICA E.A.P.: CURSO: DOCENTE: CICLO: INTEGRANTES: INGENIERIA INFORMATICA ESTADISTICA MOISES EMILIO ARMAS IV

HUACHO PERU

ESTADISTICA Y PROBABILIDADES

TITULO DEL TRABAJO: Encuestas Centros Tursticos

CURSO: Estadstica y Probabilidades

CICLO: IV

NOMBRE DEL DOCENTE: Moiss Emilio Armas

FECHA DE PRESENTACION:

PRESENTACION El arduo trabajo de cada uno de los integrantes del 3er ciclo de Ingeniera Industrial, ha hecho posible hacer realidad esta investigacin permitido durante el basado con del datos verdicos, nuestro lo cual nos a a recopilar datos, aplicando los mtodos aprendidos curso, objetivo sido

desarrollo

ESTADISTICA Y PROBABILIDADES

recolectar,

resumir,

clasificar, analizar e interpretar

los

diferentes tipos de datos brindados. En forma breve y concisa explicaremos los diferentes temas desarrollados de este trabajo, y de esta manera el lector tendr un fcil entendimiento de los desarrollado

Mediante este trabajo aprendern

la forma correcta de usar

los mtodos estadsticos, cabe recalcar que todos los datos recopilados son verdicos y que han sido buscados de manera prctica para poder en s, informar a partir de una muestra tomada, algo general en s.

ESTADISTICA Y PROBABILIDADES

DEDICATORIA A aquellas personas que hacen posible que nuestra formacin sea la mejor de todas: nuestros padres. Y a aquellos que toman como suyo dicho reto: nuestros maestros.

INTRODUCCION

ESTADISTICA Y PROBABILIDADES

La

palabra

estadstica

se

origina

en

las

tcnicas

de

recoleccin, organizacin, conservacin, y tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban sus sbditos y dominios econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las matemticas, utilizando sus herramientas en el proceso del anlisis e interpretacin de la informacin. En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas histricas, que partiendo modelos de Observaciones mustrales que o se crean lgico-matemticos

"aventuran" a describir o pronosticar un determinado fenmeno con cierto grado de certidumbre medible. El propsito de este trabajo de investigacin aplicacin Estadstica este de Y los conocimientos obtenidos este en Probabilidades y no solo por grupo las representa la el curso de de alumnos

Ingeniera Informtica que trabajo, caractersticas,

se han esforzado para desarrollar explique diferentes tcnicas de los distribuciones,

comportamientos,

ordenamientos de datos sino tambin las diferentes modelos lgicos para obtener conclusiones a partir

estadsticas que partiendo de Observaciones mustrales crean resultados de los experimentos o Procesos.

ESTADISTICA Y PROBABILIDADES

ADJUNTACION DE DATOS ESTADISTICOS

ESTADISTICA Y PROBABILIDADES

Siguiendo la temtica del curso, nuestra problemtica se ha basado en la proliferacin de una gran cantidad de universidades pblicas y privadas por lo cual sustentaremos nuestro anlisis, con los datos obtenidos y las diferentes dificultades que se nos presentaron como tambin desarrollaremos la temtica de los tpicos enseados durante el presente curso. (Distribuciones de frecuencia, histogramas, curvas de tendencia, medidas de tendencia central medidas de variabilidad, distribuciones de probabilidad, etc.)

I.

ASPECTOS TERICOS La estadstica descriptiva es una gran parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. sexo de los entrevistados

grupos de edad lugar donde residen y donde estudian tipo de colegio donde estudian

nivel de ingresos mensuales de sus padres

gastos

en

educacin

mensual

razones de continuar estudios superiores preguntar si conoce a la UNJFSC universidad donde estudiara razones de haber elegido ese centro universitario o centro

superior carrera profesional a estudiar razones de eleccin de esa carrera.

ESTADISTICA Y PROBABILIDADES

Estos datos fueron obtenidos a travs de una Entrevista por la cual se elaboro detalladamente una hoja de Entrevista, qu rena toda la informacin que se necesita.

FORMULAS A UTILIZAR PARA DISTRIBUIR LOS DATOSAmplitud de la clase.la clase, es la diferencia entre el lmite su perior e infer ior de

esto nos puede ser muy til para poder calcular el rangos de los datos y resolver la tabla de distribucin. Amplitud= Limite mayor Limite menor

Marca de clase.- es el punto med io de cada inter valo y es el valor que re presen taa todo el intervalo para el clculo de algunos parmetros.

ANCHO O RANGO DE CLASE

EL PROMEDO ( ) .- Se desarrolla obteniendo la suma de todos los datos observados dividido entre el nmero de de datos.

ESTADISTICA Y PROBABILIDADES

MEDIA O VALOR MEDIO (Me).-

se encuentra en el inter valo donde

la frecuencia acumulada ll ega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que bus car el int er valo en el que s e encuentre

.

Donde :

L i - 1 es el lmite inferior de la clas e donde se encuent ra la mediana.

es la s emis uma de las fr ecuencias absolutas .

F i - 1 es la frecuencia acumulada anterior a la cl ase mediana.

a i es la ampl itud de la clas e.

MODA .- Representa al valor que aparece con mayor frecuencia dentro de las observaciones.

Donde :

L i - 1 es el lmite inferior de la clas e modal.

f i es la fr ecuencia absoluta de la cl ase modal.

f i - - 1 es la fr ecuencia absoluta inmediatament e inferior a la en clas e modal .

f i - + 1 es la frecuencia abs olut a inmediat amente posterior a la cl ase modal.

a i es la amplitud de la cl ase.

ESTADISTICA Y PROBABILIDADES

CUARTIL.-

Los cuartiles s on

l os tres

valores de

la

variable

que dividen a un conjunto de datos ordenados en cuatro parte s iguales.

Q 1 , Q 2 y Q 3 determinan l os valores corr es pondient es al 25%, al 50% y al 75 % de los datos.

Q 2 coincide con la mediana.

Siendo: Li = Limite inferior de la clase donde se encuentra la mediana. N = Total de observaciones. Fi-1 = Frecuencia absoluta acumulada anterior ala clase donde se encuentra la mediana.a i es la amplitud de la cl ase.

DECIL.-

Los deciles s on

los nue ve

valores que dividen la

s erie

de datos en die z partes iguales.

ESTADISTICA Y PROBABILIDADESLos deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos .

D 5 coincide con la mediana.

PERCENTIL.-

Los percentiles s on

los 99

valores que dividen la

s erie

de datos en 100 partes ig uales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos .

P 5 0 coincide con la mediana.

Desviacin Media.-

Si los dat os vienen agrupados en una tabla de frecuencias, la expr es in de la de sviacin med ia es:

ESTADISTICA Y PROBABILIDADES

Desviacin Cuartilica (DQ).- Se define como el promedio de la diferencia entre el tercer cuartil y el primer cuartil.

Varianza.- Es una medida de variabilidad que se obtiene sumando al cuadrado la diferencia de las desviaciones alrededor de la media y dividindole entre el total de observaciones menos uno.

Desviacin Estndar.- Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este indicador tiene la misma unidad de medida en la que se expresa el promedio.

ESTADISTICA Y PROBABILIDADES

ndice De Asimetra.- Cun simtrica o no es una curva de distribucin de frecuencias, es un problema que se resuelve determinando su ndice de asimetra. Una curva es simtrica si su ndice de asimetra es cero, de otro modo ser asimtrica; se determina mediante la relacin.

Coeficiente de variabilidad o Coeficiente de dispersin.- Es la relacin entre la desviacin estndar y su media aritmtica.

Variable estndar o Variable tipificada.- Es tambin otra forma de uniformizar datos que presentan diferentes grupos de distribuciones, teniendo en cuenta la media y su desviacin estndar y un valor observado.

ESTADISTICA Y PROBABILIDADES

Coeficiente de variabilidad o Coeficiente de dispersin.- Es la relacin entre la desviacin estndar y su media aritmtica.

CVS=25.53

Variable estndar o Variable tipificada.- Es tambin otra forma de uniformizar datos que presentan diferentes grupos de distribuciones, teniendo en cuenta la media y su desviacin estndar y un valor observado.

ESTADISTICA Y PROBABILIDADES

II.

METODOLOGIA DEL TRABAJO

I. METODOLOGA DEL TRABAJO Al realizar un conjunto de preguntas a los distintos estudiantes de un centro educativo que cursan 4to y 5to grado de secundaria, por lo cual nos proporcionara la informacin necesaria para realizar nuestro trabajo de Investigacin, por lo general el Entrevistador debe de estar capacitado para el desarrollo de la entrevista y as facilitar las cosas, sin embargo las personas entrevistadas se abstuvieron a respondernos algunas preguntas. II. PASOS PARA LA RECOPILACION DE DATOS

Problemtica: proliferacin de una gran cantidad de universidades pblicas y privadas por estas razones se trata de encontrar una explicacin tentativa de los potenciales postulantes a esta universidad u otras, las razones de querer estudiar en dichos centros educativos. Este sentido se requiere tener informacin de los estudiantes del cuarto y quinto ao de secundaria, de los diferentes colegios de la zona, si en el futuro desearn continuar estudios superiores.

ESTADISTICA Y PROBABILIDADES

ELABORACIN DEL FORMULARIO DE TRABAJO: El siguiente formulario que nos sirvi para obtener informacin fue hecho por nosotros luego de formular las preguntas adecuadas para una buena recopilacin de datos. Para el formulario nos centramos en: sexo de los entrevistados

grupos de edad lugar donde residen y donde estudian tipo de colegio donde estudian

nivel de ingresos mensuales de sus padres

gastos

en

educacin

mensual

razones de continuar estudios superiores preguntar si conoce a la UNJFSC universidad donde estudiara razones de haber elegido ese centro universitario o

centro superior carrera profesional a estudiar razones de eleccin de esa carrera.

ESTADISTICA Y PROBABILIDADES

Ill.ANALISIS Y PROCESAMIENTO DE LOS DATOS

I)

ANALISIS Y PROCESAMIENTO DE LOS DATOS

Ya recolectado los datos de la encuesta realizada a la I.E.T.I PEDRO E. PAULET, continuamente se hara el desarrollo del trabajo de RECOPILACION Y ANALISIS ESTADISTICO. REPRESENTACIN GRAFICA DE LOS DATOS.- Los datos procesados, segn correspondan pueden representarse grficamente para ayudar a su mejor interpretacin. GRAFICO DE BARRAS: Pueden representarse datos cualitativos o cuantitativos. TABLA N1.- Muestra de 125 alumnos encuestados. SEXO MASCULINO FEMENINO

ESTADISTICA Y PROBABILIDADES

CANTIDAD

76

49

Fuente: Encuesta estudiantil de la I.E.T.I "PEDRO E. PAULET" Elaboracin: Alumnos de Ing. Industrial- 3er ciclo

OBSERVACION: El cuadro estadstico nos muestra que una mayor parte son del gnero masculino y una pequea parte del gnero femenino. TABLA N 2.- muestra de la nocin de los beneficios de la UNJFSC. CONOCEN NO CONOCEN71 54

ESTADISTICA Y PROBABILIDADES

Fuente: Encuesta estudiantil de la I.E.T.I "PEDRO E. PAULET" Elaboracin: Alumnos de Ing. Industrial- 3er ciclo OBSERVACION: Podemos apreciar que el 56,8% de alumnos conocen los beneficios que brinda la UNJFSC por lo tanto un 43,2 % no conoce los beneficios de dicha universidad.

TABLA N3.- LUGAR DE PROCEDENCIA DE LOS ALUMNOSPROCEDENCIA Fuera de la Regin Hualmay Huaura Sta. Mara Huacho Medio Mundo Vegueta Carquin CANTIDAD 11 15 8 12 70 6 2 1

ESTADISTICA Y PROBABILIDADES

Fuente:Encuesta estudiantil de la I.E.T.I "PEDRO E. PAULET" Elaboracin: Alumnos de Ing. Industrial- 3er ciclo OBSERVACION: Del total de los 125 alumnos un 8,8% de los alumnos provienen fuera de la regin como: Trujillo, Loreto, San Martn, mbar y Huancayo. Dentro de la provincia de Huaura hay un 12% procedente de Hualmay, 6,4% de Huaura, 9,6% de Santa Mara, 4,8% de Medio Mundo, 1,6% de Vegueta , un mnimo de 0.8% de Carquin y un numero alto de un 56% alumnos de huacho.

AMPLITUD O RANGO DE DATOS SOBRE LOS INGRESOS MENSUALES SOBRE LOS ALUMNOS. Mayor valor Observado Menor valor Observado

7400 400 = 7000 NUMERO DE CLASES 1+ 3.3

ESTADISTICA Y PROBABILIDADES

1+ 3.3log 1 0 125 = 7,9= 8 ANCHO O RANGO DE CLASE =>7000/8=875

ESTADISTICA Y PROBABILIDADES

OBSERVACION:

ESTADISTICA Y PROBABILIDADES

TABLA N 4: DISTRIBUCION DE FRECUENCIAS DEL PROMEDIO DE INGRESOS DE LOS PADRES DE FAMILIAN CLASES 1 2 3 4 5 6 7 8 INGRESOS MENSUALES [400-1275 > [1275-2150 > [2150-3025 > [3025-3900 > [3900-4775 > [4775-5650 > [5650-6525 > [6525-7400 > Xi 837,5 1712,5 2587,5 3462,5 4337,5 5212,5 687,5 6962,5 fi 29 76 11 1 1 3 2 2

hi0,232 0,608 0,088 0,008 0,008 0,024 0,016 0,016

Fi29 105 116 117 118 121 123 125

Hi0,232 0,84 0,928 0,936 0,944 0,968 0,984 1

Xifi 24287,5 130150 28462,5 3462,5 4337,5 15637,5 1375 13925

Fuente: Encuesta estudiantil de la I.E.T.I "PEDRO E. PAULET" Elaboracin: Alumnos de Ing. Industrial- 3er ciclo HISTOGRAMA

Este grafico de barras nos indica que: 29 tienen un ingreso entre 400 y 1275 soles 76 1275 y 2150 soles 11 2150 y 3025 soles 1 tienen un ingreso entre 3025 y 3900 soles 1 3900 y 4775 soles 3 4775 y 5650 soles 2 5650 y 6525 soles 2 6525 y 7400 soles

ESTADISTICA Y PROBABILIDADES

ndice de asimetra

OBSERVACION La curva de tendencia muestra es asimetra positiva lo cual explica que los ingresos de los padres se ubican en la parte izquierda que sus ingresos estn contenidos entre los 1275 y 2150. La curva es asimtrica positiva por ser mayor a cero.

DIAGRAMA DE CAJA Y EXTENSIONES N 01

ESTADISTICA Y PROBABILIDADES

OBSERVACION El 50% de los ingresos estn por debajo de la mediana que es 1660.70 soles. El U que significa el mximo no outlier es igual a 3099.25 soles. El L que es el mnimo no outlier es igual a 221.23 soles. TABLA N5: DISTRIBUCION DE FRECUENCIAS DEL PROMEDIO DE GASTOS DE LOS ALUMNOS ANCHO O RANGO DE CLASE =>720/8=90 hi0,12 0,592 0,144 0,104 0,016 0,008 0,008 0,008 1.00

Gastos MENSUALES [20-110 > [110-200> [200-290 > [290-380 > [380-470 > [470-560 > [560-650 > [650-740 >

Xi 65 155 245 335 425 515 605 695

fi 15 74 18 13 2 1 1 1 125

Fi15 89 107 120 122 123 124 125

Hi0,12 0,712 0,856 0,96 0,976 0,984 0,992 1

Xifi 975 11470 4410 4355 850 515 605 695

Fuente: Encuesta estudiantil de la I.E.T.I "PEDRO E. PAULET" Elaboracin: Alumnos de Ing. Industrial- 3er cicloPromedio Desviacin Estndar Varianza Media Moda PERCENTIL Desviacin Cuartilica coeficiente de variabilidad 191 102,23 10451,6 1 167,77 156,174 P10= 95 P25= 129,76 P75=223,75 P90= 328,077 46,995

OBSERVACION:

ESTADISTICA Y PROBABILIDADES

HISTOGRAMA

OBSERVACION: CURVA DE TENDENCIA

indice de asimetria

ESTADISTICA Y PROBABILIDADES

OBSERVACION:

DIAGRAMA DE CAJA N2

OBSERVACION:

ESTADISTICA Y PROBABILIDADES

PROBABILIDAD Numero adicional que se obtiene relacionando el numero de eventos entre su espacio muestral.

Gastos MENSUALES N de padres que gastan entre [20-110 > N de padres que gastan entre [110-200> N de padres que gastan entre [200-290 > N de padres que gastan entre [290-380 >

fi 15 74 18 13

De Este cuadro se obtiene:a) La

probabilidad educacin de sus b) La probabilidad educacin de sus c) La probabilidad educacin de sus d) La probabilidad educacin de sus

de que hijos de que hijos de que hijos de que hijos

el N de padres entre [20 - 110> el N de padres entre [110 - 200> el N de padres entre [200 - 290> el N de padres entre [290- 380> CANTIDAD 73 17 20 4 3 8

gastan en = 12.5% gastan en = 61.67% gastan en = 15% gastan en = 10.83

De este cuadro se obtiene: UNIVERSIDAD E INSTITUTOS UNJFSC UAP SENATI UNI UNMSM OTROS

ESTADISTICA Y PROBABILIDADES

Bloque A Ing. Electronica 2 Ing. Civil 4

Bloque B Medicina 9

Bloque C Educacion Inicial 3 Ciencias de la Comunicacin 2 Lengua y Ingles 1 Derecho 14 Trabajo Social 4 ciencias sociales 2

Bloque D Turismo y Hoteleria 5

Otros Secretariado 8

Enfermeria 7

Administracion 7 Negocios Internacionales 6 contabilidad 2

Policia 2

Ing. Sistemas 13 Ing. De Minas 2 Ing.Industrial 5 Ing. Ambiental 3

Farmacia 2 Obstetricia 2 Psicologia 7

Mecanica 10 Electronica 2

a) Cual es la probabilidad de que 4 alumnos del bloque A ingresen ingeniera industrial: 0.0042% b) Probabilidad de 5 personas del bloque B ingresen medicina: 0.0027%

DISTRIBUCIN DE PROBABILIDAD POISSON : Esta distribucin est asociada al nmero de eventos que ocurre en un intervalo de tiempo, su funcin de probabilidad es:

f(x) =

APROXIMACIN DE LA BINOMIAL A LA POISSON: Cuando en una binomial, n es muy grande y p muy pequeo, de modo que n*p 5, entonces se

ESTADISTICA Y PROBABILIDADES

cumplir que = n * p, poisson.

y se procede como una

Ejm) la probabilidad de encontrar postulantes de diferentes ingresos econmicos es 0.005, si en dicha encuesta encontramos 125 alumnos que nos brindaron su cooperacin. a) Ms de 5 padres tienen ingresos de 1300. b) 13 padres tengan ingresos menos de 1000. c) A lo ms 4 personas superiores a 3000. tengan ingresos

Solucin: Como nos dan la probabilidad de encontrar padres que tengan ingresos, entonces este problema seria una binomial, con p = 0.005, y n = 125; vemos que p es muy pequeo, entonces para facilitar el problema lo aproximaremos a un poisson, entonces hallaremos = p * n = 0.005 * 125 =0,625, y su funcin de probabilidad ser:

a) P(x > 5) =

b) P(x = 13) = f(x = 13)

0%

c) P(x 4) = f(0) + f(1) + f(2) + f(3) +f(4) = 99.98%

ESTADISTICA Y PROBABILIDADES

LA DISTRIBUCIN NORMAL Carl Friedrich Gauss (1777-1855) formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y . En nuestra entrevista realizada del consumo de los turistas que gastan en su alimentacin estn comprendidos entre 6 y 20 soles. Y Distribuidos segn se muestra en la siguiente tabla Cantidad De Gastos (Alimentacin) 8 - 10 10 - 12 12 - 14 14 - 16 16 - 18 18 20 Grafica: El promedio de ingreso mensual de estos establecimientos es = 6.6, con una desviacin estndar de = . Ac se muestra que gran parte de los sueldos comprendidos entre 10 y 12 estn concentrados hacia el promedio. Esto quiere decir que es una distribucin normal porque la curva no es acampanada y porque no cumple con las siguientes caractersticas. 10 11 5 8 2 4 N Turistas

Curva de la distribucin normal:

ESTADISTICA Y PROBABILIDADES

Es simtrico respecto a su media. Tiene un mximo en la media . Crece hasta la media y decrece a partir de ella. En los puntos y + presenta puntos de

inflexin. El eje de abscisas es una asntota de la curva. El rea bajo la curva ser igual a uno. Al ser simtrica respecto al eje que pasa por x=, deja un area igual a 0.5... a la izquierda y otra igual a 0.5... a la derecha. p ( - < X + ) = 0.6826 = 68.26%. p ( - 2 < X + 2) = 0.954 = 95.4%. p ( - 3 < X + 3) = 0.997 = 99.7%.

Gran parte de las observaciones del mundo real, cuando se construye la curva de las distribuciones de frecuencia y se busca su curva de tendencia, stas se asemejan a una curva de distribucin normal, el cual es parecido a una campana, cuya funcin de probabilidad es.

ESTADISTICA Y PROBABILIDADES

Es importante conocer que, a partir que a partir de cualquier variable X que siga una distribucin ,se puede tener otra caracterstica Z con una distribucin normal estndar, sin mas que efectuar la transformacin:

PARA LOS SIGUIENTES EJEMPLOS TOMAREMOS POR REFENCIA GANACIA DE LOS ESTABLECIMIENTO QUE BRINDA SERVICIO ALIMENTACION A LOS TURISTAS QUE LLEGAN A LA PROVINCIA Ejemplos:

LA DE

Si el promedio de ingreso mensual de los establecimientos que brindan alimentacin a los turistas se distribuye normalmente con una media de 1170 y con una desviacin estndar de s/244, se selecciona al azar un centro de alimentacin, determine la probabilidad de que:a) Gane mas

de

S/ 1200 al mes.

P(x>1200)= P(Z>1200-1170/244)=P(Z>0.12)= 45.22%

ESTADISTICA Y PROBABILIDADES

0 Z=0.12 0.5-P (01100-1170/244)=P(Z>-0.29)=61.41 %

Z= -0,29 0.5+P (01500-1170/244)=P(Z>1.35)= 8.85%

ESTADISTICA Y PROBABILIDADES

0 Z=1.35

0.5-P (01000-1170/244)=P(Z>-0.70)=75.8 %

Z=-0.70

0

0.5+P (0800-1170/244)=P(Z>-1.52)= 93.57%

ESTADISTICA Y PROBABILIDADES

Z=-1.52

0

0.5+P (0