diseño de muestreo.ppt

37
DISEÑOS MUESTRALES

Upload: joshua-martin

Post on 07-Aug-2015

128 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: diseño de muestreo.ppt

DISEÑOS MUESTRALES

Page 2: diseño de muestreo.ppt

• Los diseños muestrales son procedimientos para extraer muestras de poblaciones con el objeto de conocer sus características y a partir de ellas lograr inferir hacia la población.

• Por ejemplo, hemos mencionado que las poblaciones están formadas por individuos, pero sería mejor denominarlas unidades de muestreo o unidades de estudio:– Personas, células, familias, hospitales, países

• La población ideal que se pretende estudiar se denomina población objetivo.– No es fácil estudiarla por completo. Aproximamos mediante muestras

que den idealmente la misma probabilidad a cada individuo de ser elegido.

– Tampoco es fácil elegir muestras de la población objetivo:• Si llamamos por teléfono excluimos a los que no tienen.• Si elegimos individuos en la calle, olvidamos los que están

trabajando...

Magister Luis F. Mucha Hospinal

Page 3: diseño de muestreo.ppt

POBLACIÓN Y MUESTRA.

Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se hace necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio o investigación

“Población es un conjunto definido, limitado y accesible del universo que forma el referente para la elección de la muestra. Es el grupo al que se intenta generalizar los resultados”. (Buendía, Colás y Hernández, 1998: 28)

El término universo designa a todos los posibles sujetos o medidas de un cierto tipo... La parte del universo a la que el investigador tiene acceso se denomina población”. (Fox, 1981: 368)

Page 4: diseño de muestreo.ppt

Se conoce con el nombre de muestreo al proceso de extracción de una muestra a partir de la población. El proceso esencial del muestreo consiste en identificar la población que estará representada en el estudio.

MUESTREO.

“...es una parte o subconjunto de una población normalmente seleccionada de tal modo que ponga de manifiesto las propiedades de la población. Su característica más importante es la representatividad, es decir, que sea una parte típica de la población en la o las características que son relevantes para la investigación”. (Jiménez Fernández, 1983: 237)

Muestra

Magister Luis F. Mucha Hospinal

Page 5: diseño de muestreo.ppt

Etapas del proceso de muestreo.

Fox (1981: 367-369) señala cinco etapas en el proceso de muestreo:

5. Muestra productora de datos; la parte que aceptó y que realmente produce datos.

1. Definición o selección del universo o especificación de los posibles sujetos o elementos de un determinado tipo

2. Determinación de la población o parte de ella a la que el investigador tiene acceso

3. Selección de la muestra invitada o conjunto de elementos de la población a los que se pide que participen en la investigación

4. Muestra aceptante o parte de la muestra invitada que acepta participar

Magister Luis F. Mucha Hospinal

Page 6: diseño de muestreo.ppt

Por ejemplo: Si la población de un estudio sobre prácticas de planeación

familiar constara de un conjunto de mujeres de 15 a 45 años de edad, de las cuales el 40% utilizara anticonceptivos orales y el 10% parches de estrógeno.

la muestra representativa debería reflejar dichos atributos en proporciones similares

Características generales de la poblaciónCriterios de inclusión. Son las características necesarias para

que las unidades de análisis (individuos, pares de madres e hijos, familiares, etc.) formen parte de la población de estudio

Criterios de exclusión. Son las características no necesarias o excluyentes para que las unidades de análisis formen parte de la población de estudio. Ej. embarazo , presencia de otra enfermedad

Magister Luis F. Mucha Hospinal

Page 7: diseño de muestreo.ppt

TIPOS DE MUESTREO

Aunque no existe una única forma de clasificar las técnicas de muestreo, es frecuente clasificarlas en probabilísticas y no probabilísticas.

A. Muestreo probabilístico.

Para Marín Ibáñez (1985) este tipo de muestreo es el que alcanza mayor rigor científico, y se caracteriza porque se cumple el principio de la equiprobabilidad, según el cual todos los elementos de la población tienen la misma probabilidad de salir elegidos en una muestra.

El muestreo por azar o probabilístico presenta varias modalidades:

Magister Luis F. Mucha Hospinal

Page 8: diseño de muestreo.ppt

1. MUESTREO ALEATORIO SIMPLE

d) Extraer al azar los elementos.

Es la modalidad de muestreo más conocida y que alcanza mayor rigor científico. Garantiza la equiprobabilidad de elección de cualquier elemento y la independencia de selección de cualquier otro

En este procedimiento se extraen al azar un número determinado de elementos, ‘n’, del conjunto mayor ‘N’ o población, procediendo según la siguiente secuencia:

a) Definir la población, confeccionar una lista de todos los elementos, asignándoles números consecutivos desde 1 hasta ‘n’;

b) La unidad de base de la muestra debe ser la misma

c) Definir el tamaño de la muestra, y

Magister Luis F. Mucha Hospinal

TECNICAS DE MUESTREO PROBABILÍSTICO TECNICAS DE MUESTREO PROBABILÍSTICO

Page 9: diseño de muestreo.ppt

2. Muestreo Sistemático (MS )

Se usa cuando hay que seleccionar un número grande de números aleatorios en forma sistemática

Ejemplo: de 10 000 historias clínicas de archivo (N) se toman 500 para el estudio (n)

Un peligro de este método es el que se den periodicidades en la población que anulen la representatividad de la muestra. Supongamos que I = 10 y trabajamos con empleados de una empresa agrupados en Departamentos en los que el personal está listado según categorías profesionales, por este orden: 1 directivo, 14 profesionales especializados, 5 administrativos. Al elegir la muestra por este método, ésta quedará sesgada porque elegirá siempre, por ejemplo, un directivo por cada departamento o bien porque no lo elegirá nunca.

Magister Luis F. Mucha Hospinal

Page 10: diseño de muestreo.ppt

Procedimiento:a) se establece la fracción de muestreo o %f = (n/N) x 100, f = (500/10000) x 100 = 5%Se calcula el intervalo de muestreo denotada por: k = N/n y se genera un intervalo entre 1 y k así en nuestro ejemplo el intervalo de muestreo es:K = 10000/500 = 20, por consiguiente, el intervalo que se obtiene está entre 1 y 20 (no siempre k resulta un entero y se recomienda redondear al entero inmediato)b) Se elige un número al azar que este comprendido entre 1 y k inclusive. El número elegido se denota por x y se le denomina arranque aleatorio. La muestra queda constituida como: x, x+k , x+2k,…x +(n-1)kUtilizando la tabla de números aleatorios se elige un número que esté entre 1 y 20 resultando x = 10. Por consiguiente, la muestra queda constituida por:10, 30, 50, 70, 90,110; hasta completar las 500 historias clínicas, aquellas unidades que estén identificadas con estos números pasarán a integrar la muestra

Magister Luis F. Mucha Hospinal

Page 11: diseño de muestreo.ppt

3. Muestreo aleatorio estratificado (MAE)

Se utiliza cuando la población de estudio no es homogénea, reduciendo el error de muestreo mediante la estratificación de la población accesible, subdividiéndose en subpoblaciones independientes llamadas estratos.

Ejemplo: Si se tiene interés en conocer la estatura, media de estudiantes del primer año de una determinada universidad. Se sabe que el número total de estudiantes del primer año es N= 400. Además, se tiene información de que la estatura está correlacionada con el sexo de los estudiantes. Por consiguiente, la estructura de la población es heterogénea. De acuerdo con la variable (sexo) que está provocando la heterogeneidad se tienen que formar dos estratos y estos son

Magister Luis F. Mucha Hospinal

Page 12: diseño de muestreo.ppt

Estratos frecuencias (ni)

Estrato 1 (hombres) 300

Estrato 2 (mujeres) 100

Total N = 400

Si el tamaño de la muestra es 60 ¿cómo lo podemos distribuir entre los dos estratos?Usaremos la tabla de distribución de frecuencias para distribuir el tamaño de la muestra entre los L estratos

Magister Luis F. Mucha Hospinal

Page 13: diseño de muestreo.ppt

Estratos ni Hi Hixn submuestras

Hombres 300 0,75 0,75x6045

Mujeres 100 0,25 0,25x60 15

Total 400 1,00 60

Magister Luis F. Mucha Hospinal

Page 14: diseño de muestreo.ppt

B. Muestreo no probabilístico

En estas técnicas no se utiliza el muestreo al azar sino que la muestra se obtiene atendiendo al criterio o criterios del investigador o bien por razones de economía, comodidad, etc.

Desde el punto de vista de la investigación este tipo de muestreo es más débil. No obstante, puede usarse en estudios exploratorios cuando no se disponen de otras, cuidando mucho el análisis y la interpretación de resultados.

1. MUESTREO ACCIDENTAL O CASUAL.

Magister Luis F. Mucha Hospinal

TECNICAS DE MUESTREO NO PROBABILÍSTICO

Page 15: diseño de muestreo.ppt

2. MUESTREO INTENCIONAL U OPINATIVO.

Este método, que Jiménez Fernández (1983) califica de “deliberado”, se justifica cuando se quieren estudiar elementos excepcionales de cierta población, ya que la forma de asegurarse de que se incluirán en dicho estudio, es elegirlos intencionalmente.

No dudando de su utilidad, se presta a críticas porque las muestras obtenidas resultan inevitablemente sesgadas en el sentido del criterio que se ha usado para seleccionarla.

Magister Luis F. Mucha Hospinal

Page 16: diseño de muestreo.ppt

3. MUESTREO POR CUOTAS.

El sistema de cuotas consiste en fijar unas “cuotas”. Cada cuota consiste en un número de elementos que reúnen unas determinadas condiciones. La selección de las “cuotas” suele hacerse mediante “rutas” o “itinerarios”.

En este procedimiento se parte de una muestra estratificada cuyas proporciones debe conservar el investigador, pero cada uno de los casos queda a su arbitrio elegirlos

Magister Luis F. Mucha Hospinal

Page 17: diseño de muestreo.ppt

Ejemplo: Un investigador que desea estudiar las actitudes de los estudiantes de enfermería respecto de trabajar con pacientes que tienes SIDA. La población accesible consta de una sola facultad cuyo número de estudiantes asciende a 1000. En este caso se busca una muestra de 200 estudiantes.

Grupo Género I Ciclo II Ciclo III Ciclo IV Ciclo Total

Población VaronesMujerestotal

25 (2,5%)225(22,5%)250 (25%)

25 (2,5%)225(22,5%)250 (25%)

25 (2,5%)225(22,5%)250 (25%)

25 (2,5%)225(22,5%)250 (25%)

100 (10%)900 (90%)1000(100%)

Muestra por conveniencia

VaronesMujerestotal

2 (1%)98 (49%)100 (50%)

4 (2%)36(18%)40 (20%)

3(1,5%) 37 (18%)40 (20%)

1 (0,5%)19 (9,5%)20 (10%)

10 (5%)190 (95%)200 (100%)

Muestra por cuotas

VaronesMujerestotal

5 (2,5%)45(22,5%)50 (25%)

5 (2,5%)45(22,5%)50 (25%)

5 (2,5%)45(22,5%)50 (25%)

5 (2,5%)45(22,5%)50 (25%)

20 (10%)180 (90%)200 (100%)

Magister Luis F. Mucha Hospinal

Page 18: diseño de muestreo.ppt

TAMAÑO ADECUADO DE LA MUESTRA

El tamaño de la muestra, un tema que siempre preocupa, no tiene fácil solución y va estrechamente unido a la representatividad. En principio hay que rechazar la idea

En principio hay que rechazar la idea, demasiado extendida, de que la muestra debe ser proporcional a la población. De hecho, a medida que aumenta ésta, con una menor proporción podemos alcanzar la representatividad

No obstante, en igualdad de otras condiciones, los estadísticos calculados con muestras grandes son más precisos que los calculados con muestras pequeñas, pero una muestra representativa de 50 elementos es preferible a otra no representativa de 100 (Jiménez Fernández, 1983).

Magister Luis F. Mucha Hospinal

Page 19: diseño de muestreo.ppt

No existe un tamaño ideal de la muestra. A efectos descriptivos, se considera una muestra grande cuando n > 30. Una muestra debe ser lo suficientemente grande como para ser representativa, pero el número de elementos necesarios para lograr la representatividad varía de una investigación a otra

Cuanto más homogénea es una población en la/s característica/s objeto de estudio, más fácil resulta obtener muestras representativas sin necesidad de que sean grandes. Es decir, el tamaño de la muestra está en relación directa con la desviación típica de las puntuaciones en la/s características de la variable a investigar.

Nivel de confianza que queramos que alcancen nuestros resultados también influye en el tamaño que debamos dar a la muestra. Entre +2 y -2 sigmas de la curva de distribución normal de Gauss, a partir de la media, está incluido el 95.5% de la población. Esto quiere decir que tenemos una probabilidad de que 955/1000 coincidan con los de la población total

Magister Luis F. Mucha Hospinal

Page 20: diseño de muestreo.ppt

Otro dato determinante del tamaño de la muestra es el error de estimación. Es lógico pensar que no haya una coincidencia total entre los datos de la población y los de la muestra. Hemos de indicar el máximo error tolerable, que suele establecerse en el 5%. Pero si queremos rebajar ese error tendremos que aumentar el volumen de la muestra.

Concluimos que determinar el tamaño de la muestra es un tema complejo. Por tanto, el investigador habrá de tener en cuenta: la amplitud del universo (infinito o no), representatividad, las variables (tipo de datos, valores de la misma, homogeneidad/variabilidad de los datos), el tipo de muestreo, el proceso y medios de recogida de datos, los análisis estadísticos que se planifiquen, el error muestral, el error de estimación y el nivel de confianza con el que deseemos trabajar entre otras consideraciones. Con esta base se tendrán los referentes necesarios para determinar el tamaño de la muestra

Magister Luis F. Mucha Hospinal

Page 21: diseño de muestreo.ppt

Determinación estadística del tamaño de la muestra

Conociendo el nivel de confianza que queremos que alcancen los datos se puede aplicar una ecuación matemática para estimar el tamaño de la muestra. Según se trate de poblaciones infinitas o finitas,

Frecuentemente se opta por un nivel de confianza del 95% ó 99.7%, y un error de estimación máximo del un 5%

Determinación del tamaño de la muestra para estimar una proporción poblacional infinitas

En este caso pueden presentarse dos situaciones:

a). Que conozcamos la proporción de elementos que posee la característica a través de estudios previos. En este caso se aplica la fórmula:

Z2 * p * q n =

e2 Magister Luis F. Mucha Hospinal

Page 22: diseño de muestreo.ppt

n = número de elementos que debe poseer la muestraα = riesgo o nivel de significación zα = puntuación correspondiente al riesgo " que se haya elegido. Por ejemplo, para un riesgo del 5%; α = 0.05 (Zα = 1.96) p = % estimado q = 100- p e = error permitido

b) Si desconocemos la proporción de individuos que poseen la característica, se toma p = 50% y q = 50%.

De este modo, el número de elementos óptimo de una muestra, estimando qué proporción de sujetos poseen una característica al nivel de confianza del 99.7% (3 Z) y un error de estimación admitido del 2%, será:

32*50*50N = ---------------- = 5625 elementos.

22

Magister Luis F. Mucha Hospinal

Page 23: diseño de muestreo.ppt

Importante: Para aplicar la fórmula se necesita conocer P y para establecer su valor se recomienda lo siguiente:

•Recurrir a estudios similares al que se quiere estudiar y de ahí obtener el valor que corresponde a la proporción P.

•Realizar un estudio piloto y estimar el valor que le corresponde a P

•En caso de que no existieran estudios similares y no pudiera hacerse un estudio piloto, se recomienda considerar la máxima varianza cuando P=0,5 con un error absoluto de E= 0,05

Importante: Para determinar el tamaño de muestra se requiere conocer el error absoluto o error máximo permisible E, pero podemos calcularlo en base al error relativo.

El error absoluto E = Er. P

Magister Luis F. Mucha Hospinal

Page 24: diseño de muestreo.ppt

Determinación del tamaño de la muestra para estimar una proporción poblacional finita. En este caso se emplea la siguiente fórmula:

Z2 * p * q * N n = ----------------------------- e2 (N-1) + Z2 p * q

Ejemplo: Se desea tomar una muestra de un pedido de 5000 libros, a fin de controlar la calidad del producto, con las siguientes restricciones:

Error muestral máximo. E = 5%

Coeficiente de confianza : 95%

La proporción defectuosa en otros pedidos ha sido P = 0,02

Determinar el tamaño de la muestra

Magister Luis F. Mucha Hospinal

Page 25: diseño de muestreo.ppt

Z2 * p * q * N n = ----------------------

e2 (N-1) + Z2 p * q

(1,96)2(0,02)(0,98)(5000 n = --------------------------------------------- 4999(0,05)2 + (1,96)2(0,02)(0,98)

n= 30

Magister Luis F. Mucha Hospinal

Page 26: diseño de muestreo.ppt

Ejemplo: A una universidad ingresaron 1500 alumnos el año 2006. se desea conocer el porcentaje de alumnos fumadores y el promedio de cigarrillos diarios que fuman los alumnos. Como no es posible estudiar a todos los alumnos se decide seleccionar una muestra que permita realizar las estimaciones de las dos características de interés. Las condiciones que se imponen para determinar el tamaño de muestra son :

- Para el porcentaje de fumadores.

a) Nivel de confianza: 95% , error absoluto o precisión 5%

- Para el promedio de cigarrillos:

a) Nivel de confianza 95%

b) Error absoluto o precisión no superior del 10% del promedio verdadero en un estudio realizado el año 2004 en un facultad de dicha universidad se obtuvo que el porcentaje de fumadores fue 65%. El promedio de cigarrillos diarios por alumno fumador fue de 12 cigarrillos con una varianza de 30 cigarrillos.

Se pide determinar el tamaño de la muestra necesaria para estimar:

i) El porcentaje de fumadores de la población

ii) El promedio de cigarrillos de los que fuman

Magister Luis F. Mucha Hospinal

Page 27: diseño de muestreo.ppt

Solución:

i) Determinación del tamaño de muestra para estimar la proporción de fumadores:

Se tiene que N= 1500

Si el nivel de confianza es 95% el valor Zα = 1,96

P=0,65

Error absoluto E = 0,05

(1,96)2(0,65)(0,35)(1500) n = --------------------------------------------- 1499(0,05)2 + (1,96)2(0,65)(0,35)

n= 284

El tamaño de muestra que se requiere para estimar la proporción de fumadores es de 284 alumnos

Magister Luis F. Mucha Hospinal

Page 28: diseño de muestreo.ppt

De los que fumaron cigarrillos, determinar el tamaño de muestra para estimar el promedio de cigarrillos:

En este caso desconocemos el número de fumadores en la población. Pero se tiene que s2 = 30. para un nivel de confianza del 95% el Zα= 1,96.

Por otro lado, de la información del problema se deduce el error relativo Er = 0,10. por consiguiente el error absoluto es :

E= Er. media (x) = (0,10)(12) = 1,2

Utilizando la fórmula obtenemos el tamaño de la muestra

Z2 * s2

n = --------------------- e2

(1,96)2 * 30n = --------------------- = 81

(1,2)2

El tamaño de muestra que se requiere para estimar el número de promedio de cigarrillos que fuman es de 81 alumnos fumadores

Magister Luis F. Mucha Hospinal

Page 29: diseño de muestreo.ppt

Tamaño de la muestra para estimar una media poblacional ( infinitas)

En el caso de que la investigación requiera estimar una media poblacional se utiliza la siguiente fórmula:

Z2 * s2

n = --------------------- e2

Ejemplo : La comisión de cuotas diferenciadas de un sindicato de médicos de un cierto hospital desea conocer el ingreso promedio de sus afiliados con el objeto de proponer una nueva estrategia para establecer una nueva aportación. Para hacer esta investigación por muestreo se indican las siguientes restricciones:

Error máximo S/. 25 nuevos soles, nivel de confianza de 95%, siendo la desviación estándar , según archivos, ha sido σ =S/. 325

Calcular el tamaño adecuado de la muestra de acuerdo a las condiciones dadas.

Magister Luis F. Mucha Hospinal

Page 30: diseño de muestreo.ppt

Aplicando la fórmula

Z2 * s2

n = --------------------- e2

(1,96)2 (325)2

n = --------------------- = 649 (25)2

El tamaño de la muestra para realizar el estudio es 649

Magister Luis F. Mucha Hospinal

Page 31: diseño de muestreo.ppt

Ejemplo: en una de 100 000 hombres adultos se trata de construir una tabla que relaciones los pesos, con la talla y la edad de las personas. Se quiere estimar el tamaño de una muestra aleatoria que sea representativa de la población dada.

No hay antecedentes, dado que las tablas que usan los médicos u otros especialistas

Muestra guía o piloto

De varios gimnasios de varones, se tomó una muestra guía de 50 personas de edades y tallas que están dentro de los límites de estudio. Sus pesos en kilogramos son:

55 85 60 59 72 70 71 80 58 61 68 90 83 58 64 77 72 70 69 60 73 77 72 56 72 81 73 85 74 62 64 82 66 74 62 69 85 71 70 71 50 52 78 57 73 54 76 78 80 70

Magister Luis F. Mucha Hospinal

Page 32: diseño de muestreo.ppt

Importante : el error E lo fija el especialista, puesto que él es la persona más indicada para estimar el máximo error que se puede admitir al calcular el valor promedio poblacional de la variable en estudio

En la práctica cuando no hay el especialista se toma: E = 3% de la media ó 5% de la media

Esto es, el 3% o el 5% del valor medio de la pre-muestra.

De los valores obtenemos media 69,78 Kg y S = 9,52 Kg

Sumiendo el nivel de confianza de 99% el valor de Z = 2,58

E = 3% de la media

E = 3(69,78)/100 =2,09

(2,58)2*(9,52)2

N = -------------------- = 138

(2,09)2

Es el tamaño mínimo, de acuerdo a las condiciones dadas

Magister Luis F. Mucha Hospinal

Page 33: diseño de muestreo.ppt

Observación : si asumimos un nivel de confianza de 99% y aceptamos un error de sólo 1 kg, se tiene:

(2,58)2 * (9,52)2

n = ----------------------- = 603

(1)2

Tamaño mínimo 603 de acuerdo a las nuevas condiciones

Magister Luis F. Mucha Hospinal

Page 34: diseño de muestreo.ppt

Tamaño de la muestra para estimar una media poblacional ( finitas)

En el caso de que la investigación requiera estimar una media la fórmula a utilizar quedaría así:

N * Z2 * s2 n = ----------------------------- e2 * (N-1) + Z2 * s2

Magister Luis F. Mucha Hospinal

Page 35: diseño de muestreo.ppt

Fórmulas generales presentan modalidades diversas según se trate de muestras con desviación típica o muestras con proporciones, o poblaciones finitas / infinitas:

es

n

N n

N

2

1e

s

n

2

ep q

n

N n

N

*

1e

p p

n

( )1

Fórmulas del error muestral para:

Poblaciones infinitas Poblaciones finitas Muestras

De intervalo

De proporciones

Magister Luis F. Mucha Hospinal

Page 36: diseño de muestreo.ppt

Los siguientes cuadros aclaran mejor el enfoque:

Nivel de confianza

Error alfa (nivel de significancia)

Valor Z de alfa correspondiente

90% 0,10 1,64

95% 0,05 1,96

99% 0,01 2,58

99,9% 0,001 3,29

Error Beta Potencia1 - Beta

Valor Z de alfa correspondiente

0,01 0,99 2,326

0,05 0,95 1,645

0,10 0,90 1,282

0,20 0,80 0,842Magister Luis F. Mucha Hospinal

Page 37: diseño de muestreo.ppt

Dirección de la hipótesis en estudios comparativos de dos colas y de una cola, en la

curva normal

Dos colas Z α=1,96

-1,96 +1,96 Nivel de α = 0,05 significancia Una cola Z α= 1,64

-1,64 +1,64

Magister Luis F. Mucha Hospinal