tdf datos agrupados

6
1.2 RecopilaciOn de datos y dislribuciOn de frecuenCias. 13 Edad Fl'eC!ueneSa Frecueneln reln.h·a X, h i; 8 2 Ir <: 0.133 10 4 n <: 0.267 21 4 n = 0.267 23 I 5 (; <: 0.333 a Los datos de la muestra .r11.[1' .... X. tambien pueden clasificarse en clases 0 categorlas, este tipo de ctasmcacrcn se conoce como -distribucion de freclJencias~ a Una distribucion de trecuencies ccnsisten una tabla compuesta cor clases 0 categorlas, mutuamente excluyentes entre si, en las que han sido clasificados los datos. a En una distribucion de (recuencias, a cada ceteqon« 0 clase se':~ asoclan: el intervalo dB clast) y la irecuencie de ctese. la frecuenci8 relativa de ctes« mismos que se definen como sigue. n.~finieiun I.U Cumpu~~nicsrdc una a a. Intervalo de ctese indica el inicio (con ellimite inferior L, ) y el terrnino de la clase (con ellimite superior L,). b. La frecuencia de ctese (0 simplemente frecuencia) es la cantidad I, de datos que pertenecen a una ctase estadistica. e. La trecuenas relativa de ctese (0 simplemente frecuencia) es el resultado de dividir la frecuencia de ctese por el numero de elementos de la muestra. a Existen diversos metodos para construir una distribucion de frecuencias. sin embargo, nosotros seguiremos el procedimiento descrito en el sigUiente ejemplo. EJemplo 1.10 Los siguientes datos corresponden al numero de minutos que permanecieron 60 clientes en la pulqueria "los Dinamos·. ~ 320 282 31~ 280 320 318 295 309 309 320 310 310 315 310 325 318 308 308 300 317 29& 309 302 306 2R3 282 300 283 304 282 282 320 316 294 298 280 309 309 308 308 297 294 316 318 306 29S 308 296 301 316 294 290 309 300 296 290 298 301 299 302 Para agruparlos en una distribuci6n de frecuencias: Paso I

Upload: ramsanri

Post on 18-Jul-2015

1.195 views

Category:

Education


3 download

TRANSCRIPT

Page 1: Tdf datos agrupados

1.2 RecopilaciOn de datos y dislribuciOn de frecuenCias. 13

Edad Fl'eC!ueneSa Frecueneln reln.h·aX, h i;

8 2 Ir <: 0.13310 4 n <: 0.26721 4 n= 0.26723 I 5 (; <: 0.333

a

Los datos de la muestra .r11.[1' .... X. tambien pueden clasificarse en clases 0 categorlas, este

tipo de ctasmcacrcn se conoce como -distribucion de freclJencias~

aUna distribucion de trecuencies ccnsisten una tabla compuesta cor clases 0 categorlas,mutuamente excluyentes entre si, en las que han sido clasificados los datos.

aEn una distribucion de (recuencias, a cada ceteqon« 0 clase se':~asoclan: el intervalo dB clast)

y la irecuencie de ctese. la frecuenci8 relativa de ctes« mismos que se definen como sigue.

n.~finieiun I.U Cumpu~~nicsrdc una

aa. Intervalo de ctese indica el inicio (con ellimite inferior L, ) y el terrnino de la clase (con ellimite

superior L,).

b. La frecuencia de ctese (0 simplemente frecuencia) es la cantidad I, de datos que pertenecen a

una ctase estadistica.e. La trecuenas relativa de ctese (0 simplemente frecuencia) es el resultado de dividir lafrecuencia de ctese por el numero de elementos de la muestra.

aExisten diversos metodos para construir una distribucion de frecuencias. sin embargo, nosotros

seguiremos el procedimiento descrito en el sigUiente ejemplo.

EJemplo 1.10Los siguientes datos corresponden al numero de minutos que permanecieron 60 clientes en lapulqueria "los Dinamos·.

~320 282 31~ 280 320 318 295 309 309 320 310 310315 310 325 318 308 308 300 317 29& 309 302 3062R3 282 300 283 304 282 282 320 316 294 298 280309 309 308 308 297 294 316 318 306 29S 308 296301 316 294 290 309 300 296 290 298 301 299 302

Para agruparlos en una distribuci6n de frecuencias:Paso I

Page 2: Tdf datos agrupados

14 • CAPiTVLO 1 Estadlsticacescnpuva

Ordenemos los datos de menor a mayor para asl facilitar su clasificaci6n.280 282 294 296 298 301 306 )08 309 3)0 316 320280 283 294 296 299 30I 306 308 309 315 ) 11 320282 289 294 297 300 302 J08 309 309 315 318 320282 290 295 298 300 302 308 309 310 316 318 320282 290 295 298 300 304 308 309 310 316 318 325

Paso 2Calculemos el recorrido 0 rango ( R) de los datos, es decir, la lon~':~l!ddel intervalo (I) que loscontiene .

I = [280,325],entonces el rango es

R = X..u - x..;. = 325 - 280= 45 .

A continuaci6n debemos elegir un numero de crases 0 categorias en las que debemosclasificar los datos; ta eleccien del numero de clase 0 categorlas es arbitraria, sin embargo, debeser un numerc suliciente de modo que los datos no quaden amontonados, pero no demasiadaspuesto que la tabla de frecuencias serla de diffcil manejo y se pudiere perder informaci6n.

EI mstodo. emplrico, que utilizaremos para determinar el nurnero de clases se denomina"regia de /8 reiz" y consists en extraer la ralz cuadrada del tama"o de la muestra y redondear elnumero obtenido al entero mayor (existen otros criterios emplricos para determinar el numero deintervalos de frecuencias, como la ursgfa de Sturges", que sugiere que el nurnero de crases. es el

nurnerc entero mas cercano a I ~ ~ log( " ) d6nde n representa el tamano de la muestra; otra regia3

establece que el entero mas cercano a 1082 ( n ) dOnde n representa el tarnano de la muestra es el

numero adecuado de clases}.

Paso 3Utilicemos la uregla de la rsiz" para determinar el numero de clases:

IIClases = ..}n = .J6O '" 8 .lIamemos a las clases

iA,8,C,D,E,F,GyH.

Paso 4EI siguiente paso consiste en determinar el lama"o 0 ancho de cada clase ( C ), es convenienteque su tamano sea un numero entero, luego es necesario redondear el cociente

C = __ R_ ,al numero entero pr6ximo mayor que el resultado obtenido, as! C = 45 '" 6 .#~ 8

Paso 5EI redondeo hecho en el paso anterior altera el tama"o del (ecorrido 0 rango ( R ), por tantodebemos ajustar los Iimites del intervalo I que contiene a los datos, eslo se obtiene como sigue.Determinemos el nuevo rt3corrido (rango) NR, para ello multipliquemos el numero de categoriaspor el tamano de la categorla; es decir

NR = (MCloses XC)= 8x6= 48.

Paso 6EI exceso (£) en el rango de los dalos (consecuencia de las aproximaciones y redondeosefectuados antes) es

£ = NR - R = 48-45 = 3.

Page 3: Tdf datos agrupados

' .....

1.2 RecopilaciOnde datos y distribuciOnde frecuencias' 15

Mismo que conviene distribuirlo de la rnanera mas equitativa posible entre los extremes delintervalo (de manera entera y si existe una parte que es mayor se aconseja asignarla al mayor delos datos)

R = [ 280., 325 J

de manera que recorrido aumente en tarnano..,,:.

P8807Si descomponemos el exceso t = 3 como t: = 3 = 1+ 2 de manera que el recorrido incremente sutamano obtenemos

P8808Ahora construiremos los limitas de las cteses en los que clasificaremos los '~atos que componen lamuestra.x .....:; 279 es el IImile inferior de la primera clase A. A X.....:::279 Ie agre'gamos (el ancho de laclass calculado rt. .nos 1) C -I :; S y asl obtenemos al limite superior de la primera clase.

A 279 284. . ;, '.

Para obtener los "mites de /8 clase B solamente agregamos 1 al limite superior del intervaloue la erase A y luego agregamos C -1 :; 5 al limite infen'or del intervalo de ·frecuencia antesobtenido, luego

omptetar 0 os os mterva 0u-t...de

eIaaea.- L, L,

A 279 284B 285 290C 291 296D 297 302E 303 308 ..

F 309 314G 315 320R 321 326

I s de frecuencia.el proceso anterior se repite hasta cB 285

t d290,

P8809Ahora clasificamos los datos en los intervalos de ctase, obtenemos:

Ualce. de lFMe_aelaelaeea__

L( L, J;

A 279 284 7B 285 290 3c 291 296 70 297 302 12E 303 308 8f' 309 314 9G 315 320 13

U 321 326 J

Ili.I(I1,P88010

Los limites reales de los intervalos de clase se obtienen de la siguiente manera ... Eilimite real inferior (Lrf) es L" = L, - 0.5.

Page 4: Tdf datos agrupados

16 • CAP~LO I Estadfstlcadescripnva

b. EI limite real superior (L,.) es L" '" i,+0.5.

Ual&e. de UJRJ&e..... e.IFr.ellellel. ~.elle.l.

e.... dee"'" _lad ....(;1aM

L, L, Ln L,. /, IR.A 279 284 278.5 284.5 7 0.117B 285 290 284.5 290.5 3 0.050c 291 296 290.5 296.5 7 0.117D 297 302 296.5 3025 12 0.200E 303 308 3025 308.5 8 0.133IF 309 314 308.5 314.5 9 0.150G 315 320 314.5 320.5 13 0.2160 321 326 320.5 326.5 I 0.016

La tabla anterior contiene las frecuencias relativas. mismas que se calculan de la misma forma queen una tabla de frecuencias. por ejemplo

1M =g = 0.200 (frecuencia relativa del intervalo de clase D).60

IHJf = _!_ = 0.0 16 (frecuencia relativa del intervalo de clase H).60

Paso IIlas marcas de clase son las representaciones puntuales de los intervalos de clase y corresponden

a los puntos mecios de de eUas, se calculan por las relaciones m, = L, ; Ls 6 "', = Ln ; L" ,par

. I 279+ 284 "," __303+308 __305.5,ejemp a iliA = '" 281.5 Y ..2 2

f

I.illllle. de Uall.ell ........'rIIelieDel.

.·n!elll.ael. Mareae.... dee .... relAd". de elA»e

(;IaseL, L, Ln L",

/, III. m,

A 279 284 218.5 284.5 7 0.117 281.5B 285 290 284.5 290.5 J 0.050 287.5C 291 296 290.5 296.5 7 0.117 293.5D 297 302 296.5 3025 12 0.200 299.5E 303 308 3025 308.5 8 0.133 305.5F 309 314 308.5 314.5 9 0.150 311.5G 315 320 314.5 320.5 13 0.216 31 ;.5U 321 326 320.5 326.5 I 0016 323.5

Paso 12La frecuencia acumuJada (/.. ) es bastca en la interpretaci6n de una distribuci6n de frecuencias y

representa el nurnero total de datos que han side cJasificados hasta una clase especifica. Lafrecuencia acumulada hasta la clase especifica i es la suma de las frecuencias hasta la clase i.La ultima de las columnas de la siguiente tabla corresponde a las frecuencias acumuladas.

Page 5: Tdf datos agrupados

1.2 RecopilaCi6'n de datos y distribuci6n de frecuenclas • 17

Umlee. de ..... 1... reale.lTeeaellPJ. F'ree1IlIaelD Itt.rea l"l'eea ..aeJ.

elue _elaM _lad"" de eta.e ae .... DI...ClaIM! L, I., Lrl L"

/..fflll f., .m,

" 279 284 278.5 284.5 7 0.117 281.5 7B 285 290 2&4.5 290.5 3 0.050 287.5 10C 291 ~96 290.5 296.5 7 0.117 293.5 17D 297 302 296.5 302.5 12 0.200 299.5 29 '

E 303 308 302.5 )08.5 8 0.133 305.5 37F 309 314 308.S 314.5 9 0.150 311.5 46G 315 320 314.5 320.5 13 .0.216 317.5 59H 321 326 320.5 326.5 1 0.016 323.5 60

Paso 13Las proporcio c?S suelen ser de interpretaci6n mas sencilla que las cantidades especificas. pertanto convip''''~ calcular las frecuencias relativas acumuladas /0" para ello utihzarnos la relaci?n

I.rl = 101 . por ejemplo:II

f.,D = Ion = 29 = 0.4833 (frecuencia acumulada relativa de la clase D).n 60 '. .

f.,,- = f.F = 46 = 0.7666 (frecuencia acumulada relativa de la clase F). ,.n 60

f • -o = flt(j :; 59 = 0.9833 (frecuencia acumulada relativa de la clase G).n 60

Uada-cie u.J... reah. ~e" Freeae.da Marea ....-. ...,.e.. If'reeaeDd.

ClaM elaN .oes.- _lad_ IIIe daae aea.Jaalada Ae_aIada

L; L, L" L"/,

IR' m' f." Relachaf.rl, .

" 279 284 278.5 284.5 7 0.117 281.S 7 0.117

B 285 290 284.5 . 290.S ) 0.050 287,5 10 0.167

C 291 296 290.5 296.5 7 0.117 293.5 17 0.283

D 297 302 296.5 3025 12 0.200 299.5 29 0.483

E 303 308 )025 308.5 8 0.133 30S.S 37 0.617

F 309 314 308.5 314.5 9 0.150 311.S 46 0.767

CiI 315 320 314.5 320.5 13 0.216 317.5 S9. 0.983

B J21 326 320.5 326.S I 0.016 323.5 60 1.000

a

EJemplo 1.11 . .Los siguientes datos son los tiempos en minutos utiliiados por 68 operadores del 'Metrobus" en

recorrer el Circuito "Indios Verdes - EI Caminero - Indios verdes" en un dla de intenso trllfico.

209 195 196 190 178 188 169 185 178 '190 .168 197 206 204 187 199 189196 202 200 188 187 190 170 183 181 188 179 19~ 198 205 181 179 170 J.,204 165 200 183 190 185 178 175 188 184 184 195 208 187 196 172 194 !203 183 195 176 190 183 181 169 189 178 190 19.5 186 175 188 170 190

Paso)Los datos ordenados de menor a mayor son:'

Page 6: Tdf datos agrupados

1.2 RecopilaciOn de datos y distribuciOn de frecuencias • 23

EJERCICIOS 1.2

I. EI numero de tortas que comen. en promedio. a la

semana 20 estudiantes universitarios seleccionados

de forma aleatoria de ta ENAP son:3.2 1.9 25 2.4 2.8 3.2 2.,

3.0 2.8 3.0 2.5 3.2 2.4 1.9

1.9 2.5 3.2 28 2.0 2.0

a. Construya la labia de trecuenclas.b. Calcule las trecuencias relativas.

3. La siguiente muestra COrr9&pOfl_d!_al flujo de agua

del Rio Magdalena 1- en la epoca de 6slllti8J

288 385 411 28'S 370 393 296 )8$

419 288 465 288 296 465 419 419

385 419 385 288 419 196 370 393465 385 370 288 370 296 393 296

a. Construya la tabla de frecuencias.b. Calcule las frecuencias re.lativas.eoCalcule las trecuencias relativas pcrcentuaies.d. LQue porcenta)e de los datos es menor 8 385 ?

e. <-Queporcentaje de los datos es mayor a 296?. /

S. La tabla representa las longitudes en centlmetrosalcanzadas por las mazorcas transgenicas que secosecharon en una regiOn especltica.

Xi 26 27 2& 29 30 31

/; 3 II 8 7 15 2S

:t. 32 33 34 35 36 37

/. 20 12 7 4 4 4

a. Determrne el tamano de la muestra.b. Calcule las frecuencias relativas.

Co i.EI dato x, es?

d.i.EI dato xr2 es?

e. i.EI dato .1'60 es?

I. i.EI dato .1100 es?

g. l.Que porcentaje de las mazorcas tiene longitud

menora los 28.S centlmetros?h. LQue porcentaje de tas mazorcas tiene longitud

superior a los 31.5 centimetros?

I. l.Que porcentaje de las mazorcas tiene longitudcomprendic1aentre 28. I Y 29.3 centlmetros?

7. Los siguientes datos son el numero de autos

2. Los siguientes datos que indican los niveles de

azutre en el aire en 20 dlas consecutivos en laCludad de Mexico.

12 34 12 24 20 34 39 34 12 40

2~ 40 25 12 24 20 32 12 32 24

a.ConstruYa ta labia de trecuencias.Ia. C8itlylQ 1011 frecuencias relalivas.

4. Considere la siguiente tabla de frecuencias

XI 3.2 ~:~ ~~ H 6.4 7.0 7.5 8.0- ..

!. 2 3 3 10 8 7 4 3.. Determine el tamano de la muestrab. Calcul~ le~~~~tJenCiia.relatlv8s.eo i.EI oato X, es?

d. i.EI dato Xu es?

e. i.EI dato .I'll es?

f. i.Et dato Xl) es?

g. (.Qu~ porcentaje de los datos es menor a 6.4?

h. l,Que porcentaje de los datos es mayor a 6.4 ?

8. Los siguientes datos reoresentan los precios en -pesos de SO marcas diferentes de shampoo en

presentaciOn de 500 mi.40 30 18 30 30 30 3S 23 28 1730 27 14 30 26 28 23 19 14 2314 27 34 10 19 45 17 27 2S 2136 30 27 20 42 19 12 IS 22 1823 28 25 21 20 21 3S 8 12 14

a. Ordenelos de menor a mayor.b. Determine el recorrido de los precios.eo Compruebe (de acuerdo al criterio de la ralz)que son necesarias 8 clases de tamano C == 5 .

d. Verifique que el nuevo recortido es NR == 40 Y

el exceso E:: 3 .

e. Distribuya el exceso de (orma que XMi• = 7 .

f. Construya los IImites de clase y los IImitesreales de dase.fC. Clasifique los datos en las 8 clases que

construy6. determine las frecuencias relativas y lasmarcas de c1ase.

8. Los siguientes datos son el ~(Jmero piQuetes de