teorÍa de muestreo - … · en lo que sigue nos vamos a limitar a problemas de inferencia ......

25
TEORÍA DE MUESTREO (HAMLET Mata Mata prof. Del Tecnologico de El Tigre) www.mipagina.cantv.net/hamletmatamata POBLACIÓN Y MUESTRA Una población está determinada por sus características definitorias. Por lo tanto, el conjunto de elementos que posea esta característica se denomina población o universo. Población es la totalidad del fenómeno a estudiar, donde las unidades de población poseen una característica común, la que se estudia y da origen a los datos de la investigación. Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una población. Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la información recolectada depende en gran manera de la forma en que fue seleccionada la muestra. Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra representativa de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las características que definen la población de la que fue extraída, lo cual nos indica que es representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra. Leyes del método de muestreo. El método de muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las cuales son: Ley de los grandes números: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la relación entre las veces que se produce el suceso y la cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la probabilidad P. Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación entre el número de casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son igualmente posibles. El método de establecer la probabilidad es lo que se denomina cálculo de probabilidad. De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más directamente al método de muestreo: Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las características del grupo más grande. Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte igual del mismo grupo, varíe en dirección opuesta. Ley de la permanencia de los números pequeños: si una muestra suficientemente grande es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con características raras, es de esperar encontrar igual proporción en la segunda muestra.

Upload: lamquynh

Post on 12-Oct-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

TEORIacuteA DE MUESTREO

(HAMLET Mata Mata prof Del Tecnologico de El Tigre)

wwwmipaginacantvnethamletmatamata

POBLACIOacuteN Y MUESTRA

Una poblacioacuten estaacute determinada por sus caracteriacutesticas definitorias Por lo tanto el conjunto de

elementos que posea esta caracteriacutestica se denomina poblacioacuten o universo Poblacioacuten es la totalidad del

fenoacutemeno a estudiar donde las unidades de poblacioacuten poseen una caracteriacutestica comuacuten la que se

estudia y da origen a los datos de la investigacioacuten

Entonces una poblacioacuten es el conjunto de todas las cosas que concuerdan con una serie determinada de

especificaciones Un censo por ejemplo es el recuento de todos los elementos de una poblacioacuten

Cuando seleccionamos algunos elementos con la intencioacuten de averiguar algo sobre una poblacioacuten

determinada nos referimos a este grupo de elementos como muestra Por supuesto esperamos que lo

que averiguamos en la muestra sea cierto para la poblacioacuten en su conjunto La exactitud de la

informacioacuten recolectada depende en gran manera de la forma en que fue seleccionada la muestra

Cuando no es posible medir cada uno de los individuos de una poblacioacuten se toma una muestra

representativa de la misma

La muestra descansa en el principio de que las partes representan al todo y por tal refleja las

caracteriacutesticas que definen la poblacioacuten de la que fue extraiacuteda lo cual nos indica que es representativa

Por lo tanto la validez de la generalizacioacuten depende de la validez y tamantildeo de la muestra

Leyes del meacutetodo de muestreo

El meacutetodo de muestreo se basa en ciertas leyes que le otorgan su fundamento cientiacutefico las cuales son

Ley de los grandes nuacutemeros si en una prueba la probabilidad de un acontecimiento o suceso es

P y si eacuteste se repite una gran cantidad de veces la relacioacuten entre las veces que se produce el

suceso y la cantidad total de pruebas (es decir la frecuencia F del suceso) tiende a acercarse

cada vez maacutes a la probabilidad P

Caacutelculo de probabilidades La probabilidad de un hecho o suceso es la relacioacuten entre el nuacutemero

de casos favorables (p) a este hecho con la cantidad de casos posibles suponiendo que todos los

casos son igualmente posibles El meacutetodo de establecer la probabilidad es lo que se denomina

caacutelculo de probabilidad

De estas dos leyes fundamentales de la estadiacutestica se infieren aquellas que sirven de base maacutes

directamente al meacutetodo de muestreo

Ley de la regularidad estadiacutestica un conjunto de n unidades tomadas al azar de un conjunto N

es casi seguro que tenga las caracteriacutesticas del grupo maacutes grande

Ley de la inercia de los grandes nuacutemeros esta ley es contraria a la anterior Se refiere al hecho

de que en la mayoriacutea de los fenoacutemenos cuando una parte variacutea en una direccioacuten es probable

que una parte igual del mismo grupo variacutee en direccioacuten opuesta

Ley de la permanencia de los nuacutemeros pequentildeos si una muestra suficientemente grande es

representativa de la poblacioacuten una segunda muestra de igual magnitud deberaacute ser semejante a la

primera y si en la primera muestra se encuentran pocos individuos con caracteriacutesticas raras es

de esperar encontrar igual proporcioacuten en la segunda muestra

Inferencia Estadiacutestica

La Inferencia Estadiacutestica es la parte de la estadiacutestica matemaacutetica que se encarga del estudio de los

meacutetodos para la obtencioacuten del modelo de probabilidad (forma funcional y paraacutemetros que determinan

la funcioacuten de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten a traveacutes de

una muestra (parte de la poblacioacuten) obtenida de la misma

La inferencia estadiacutestica es el proceso a traveacutes del cual se extraen conclusiones relativas a una

poblacioacuten a partir de una muestra La expresioacuten inferencia se utiliza tambieacuten para designar su

resultado y la rama de la estadiacutestica que se ocupa de ella

Los estadiacutesticos son funciones de los valores observados en la muestra (ya se han visto algunos como

la media la desviacioacuten tiacutepica percentiles)

Por ser funciones de una variable aleatoria los estadiacutesticos son tambieacuten variables aleatorias y por lo

tanto a cada uno de ellos se le puede asociar una distribucioacuten de probabilidad llamada distribucioacuten

en el muestreo del estadiacutestico dado Es posible pasar de la Teoriacutea de la Probabilidad a la

Inferencia Estadiacutestica

En la mayor parte de las teacutecnicas que se describen aquiacute las inferencias (conclusiones) se refieren a

paraacutemetros poblacionales Sin embargo es posible realizar inferencias que no se relacionen con

paraacutemetros (ver anaacutelisis de frecuencias) Seguacuten la finalidad de la Inferencia Estadiacutestica se puede

dividir en

TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS

TEORIacuteA DE LA ESTIMACIOacuteN

Los dos problemas fundamentales que estudia la inferencia estadiacutestica son el Problema de la

estimacioacuten y el Problema del contraste de hipoacutetesis Cuando se conoce la forma funcional de la

funcioacuten de distribucioacuten que sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los

paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica parameacutetrica por el

contrario cuando no se conoce la forma funcional de la distribucioacuten que sigue la variable aleatoria

objeto de estudio estamos ante un problema de inferencia estadiacutestica no parameacutetrica

En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica parameacutetrica donde la

variable aleatoria objeto de estudio sigue una distribucioacuten normal y soacutelo tendremos que tratar de

estimar los paraacutemetros que la determinan la media y la desviacioacuten tiacutepica

Esta situacioacuten se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional

de la distribucioacuten de probabilidad por consideraciones teoacutericas quedando uacutenicamente indeterminados

los paraacutemetros que determinan la funcioacuten de distribucioacuten

Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria son grandes

es muy caro o imposible estudiar a todos sus individuos lo que se hace es estudiar una muestra ( una

parte) de la poblacioacuten En todos estos problemas que estudia la inferencia estadiacutestica juega un papel

fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de las distribuciones de

probabilidad) y la Teoriacutea de Muestras (procedimientos para tomar muestras de manera apropiada)

TEORIacuteA DEL MUESTREO

La teoriacutea de muestreo frecuentemente es llamada teoriacutea de Nyquist o Shannon por los investigadores

del primer trabajo sobre el tema lo cual ocurrioacute en los antildeos cuarentaConceptualmente definida como

el estudio de las relaciones existentes entre una poblacioacuten y muestras extraiacutedas de la misma La teoriacutea

del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos

muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas

lo que nos lleva a los procesos denominados ensayos e hipoacutetesis de significacioacuten fundamental para

comprensioacuten de la teoriacutea de la decisioacuten en el aacuterea de la inferencia estadiacutestica Abarca el estudio de las

relaciones que existen entre una poblacioacuten y las muestras extraiacutedas de la misma Permite estimar los

paraacutemetros poblacionales (media varianza etc) a partir de los correspondientes valores muestrales

denominados estadiacutesticos La teoriacutea del muestreo tambieacuten permite determinar si las diferencias

observadas entre dos muestras son significativas o por el contrario debidas al azar lo que supone la

realizacioacuten de ensayos e hipoacutetesis de significacioacuten

Pues bien la teoriacutea del muestreo estudia las teacutecnicas y procedimientos que debemos emplear para que

las muestras sean representativas de la poblacioacuten que pretendemos estudiar de forma que los errores en

la determinacioacuten de los paraacutemetros de la poblacioacuten objeto de estudio sean miacutenimos Para conseguirlo

la muestra tiene que ser representativa de la poblacioacuten Para que la extraccioacuten de la muestra sea

representativa se deben cumplir dos principios baacutesicos

Que haya independencia en la seleccioacuten de los individuos que forman la muestra

Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra

El propoacutesito de un estudio estadiacutestico suele ser extraer conclusiones acerca de la naturaleza de una

poblacioacuten Al ser la poblacioacuten grande y no poder ser estudiada en su integridad en la mayoriacutea de los

casos las conclusiones obtenidas deben basarse en el examen de solamente una parte de eacutesta lo que

lleva en primer lugar a la justificacioacuten necesidad y definicioacuten de las diferentes teacutecnicas de muestreo

Los primeros teacuterminos obligados a los que se debe hacer referencia seraacuten los de estadiacutestico y

estimador

Dentro de este contexto seraacute necesario asumir un estadiacutestico o estimador como una variable aleatoria

con una determinada distribucioacuten y que seraacute la pieza clave en las dos amplias categoriacuteas de la

inferencia estadiacutestica la estimacioacuten y el contraste de hipoacutetesis

El concepto de estimador como herramienta fundamental se caracteriza mediante una serie de

propiedades que serviraacuten para elegir el ``mejor para un determinado paraacutemetro de una poblacioacuten asiacute

como algunos meacutetodos para la obtencioacuten de ellos tanto en la estimacioacuten puntual como por intervalos

iquestCoacutemo deducir la ley de probabilidad sobre determinado caraacutecter de una poblacioacuten cuando soacutelo se

conoce una muestra

Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacioacuten entre el

fumar y el caacutencer de pulmoacuten y se intenta extender las conclusiones obtenidas sobre una muestra al

resto de individuos de la poblacioacuten

La tarea fundamental de la estadiacutestica inferencial es hacer inferencias acerca de la poblacioacuten a partir

de una muestra extraiacuteda de la misma

Las teacutecnicas estadiacutesticas para ser utilizados requieren datos cuya adquisicioacuten es un compromiso difiacutecil

La teoriacutea de muestras o muestreo tiene por objeto proporcionar una metodologiacutea que guiacutee los

problemas de recogida de datos es decir coacutemo se hace para recoger esos datos Por lo tanto El

muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica es determinar que parte

de una realidad en estudio (poblacioacuten o universo) debe examinarse con la finalidad de hacer inferencias

sobre dicha poblacioacuten El error que se comete debido a hecho de que se obtienen conclusiones sobre

cierta realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error de muestreo

Obtener una muestra adecuada significa lograr una versioacuten simplificada de la poblacioacuten que

reproduzca de alguacuten modo sus rasgos baacutesicos

En el muestreo se utilizan por lo general las siguientes Terminologiacuteas

UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan

caracteriacutesticas comunes entre si

POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de

las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una

poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el

universo

MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya

seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o

elementos de anaacutelisis sacados del marco

UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que

mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las

partes que se van a analizar

UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la

informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que

obtener la informacioacuten

UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la

informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente

UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y

que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los

conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras

palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo

miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo

MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)

representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este

muestre puede ser No Probabiliacutestico y Probabiliacutestico

MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan

las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco

muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades

muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a

distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas

por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos

Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten

Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten

de los paraacutemetros

Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro

correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al

valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten

basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo

Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida

podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean

muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en

cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten

muestral de un estadiacutestico y su fiabilidad

Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier

informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)

asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un

estadiacutestico capte el verdadero valor del paraacutemetro

Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de

entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes

pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios

previos

SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos

grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un

mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la

significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es

necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de

frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc

Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos

que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica

Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por

lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un

evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe

al azar sino a factores especiacuteficos

De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar

estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no

puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten

El disentildeo de muestras tiene dos procesos fundamentales

Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la

muestra

Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de

la muestra

El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es

maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de

encuestados

VENTAJAS DEL MUESTREO

a) Costos reducidos

b) Mayor rapidez para obtener resultados

c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores

1- Volumen de trabajo reducido

2- Puede existir mayor supervisioacuten en el trabajo

3- Se puede dar maacutes entrenamiento al personal

4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten

d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo

- Pruebas de germinacioacuten

- Anaacutelisis de sangre

- Control de calidad

Tipos de muestreo

Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo

aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y

meacutetodos de muestreo no probabiliacutesticas

Meacutetodos de muestreo probabiliacutesticas

Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad

El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y

dicha probabilidad no es nula para ninguacuten elemento

Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la

misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la

representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los

meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos

PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO

a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la

aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de

muestreo pertenecen a M1 M2 y asiacute sucesivamente

b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi

c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser

seleccionada

d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles

muestras Mi

PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO

Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las

metas del estudio

Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que

constituyen una poblacioacuten Este generalmente puede ser de dos tipos

a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad

de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de

un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras

caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor

b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las

que se ha dividido el aacuterea total

Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por

ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa

estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una

variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los

meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas

a) uniformidad

b) practicabilidad

c) deber ser comprensibles para el grupo de trabajo

Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo

que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple

aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico

Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el

esquema o tipo de muestreo seleccionado

Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una

poblacioacuten de tamantildeo N

Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa

por las siguientes razones

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Inferencia Estadiacutestica

La Inferencia Estadiacutestica es la parte de la estadiacutestica matemaacutetica que se encarga del estudio de los

meacutetodos para la obtencioacuten del modelo de probabilidad (forma funcional y paraacutemetros que determinan

la funcioacuten de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten a traveacutes de

una muestra (parte de la poblacioacuten) obtenida de la misma

La inferencia estadiacutestica es el proceso a traveacutes del cual se extraen conclusiones relativas a una

poblacioacuten a partir de una muestra La expresioacuten inferencia se utiliza tambieacuten para designar su

resultado y la rama de la estadiacutestica que se ocupa de ella

Los estadiacutesticos son funciones de los valores observados en la muestra (ya se han visto algunos como

la media la desviacioacuten tiacutepica percentiles)

Por ser funciones de una variable aleatoria los estadiacutesticos son tambieacuten variables aleatorias y por lo

tanto a cada uno de ellos se le puede asociar una distribucioacuten de probabilidad llamada distribucioacuten

en el muestreo del estadiacutestico dado Es posible pasar de la Teoriacutea de la Probabilidad a la

Inferencia Estadiacutestica

En la mayor parte de las teacutecnicas que se describen aquiacute las inferencias (conclusiones) se refieren a

paraacutemetros poblacionales Sin embargo es posible realizar inferencias que no se relacionen con

paraacutemetros (ver anaacutelisis de frecuencias) Seguacuten la finalidad de la Inferencia Estadiacutestica se puede

dividir en

TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS

TEORIacuteA DE LA ESTIMACIOacuteN

Los dos problemas fundamentales que estudia la inferencia estadiacutestica son el Problema de la

estimacioacuten y el Problema del contraste de hipoacutetesis Cuando se conoce la forma funcional de la

funcioacuten de distribucioacuten que sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los

paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica parameacutetrica por el

contrario cuando no se conoce la forma funcional de la distribucioacuten que sigue la variable aleatoria

objeto de estudio estamos ante un problema de inferencia estadiacutestica no parameacutetrica

En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica parameacutetrica donde la

variable aleatoria objeto de estudio sigue una distribucioacuten normal y soacutelo tendremos que tratar de

estimar los paraacutemetros que la determinan la media y la desviacioacuten tiacutepica

Esta situacioacuten se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional

de la distribucioacuten de probabilidad por consideraciones teoacutericas quedando uacutenicamente indeterminados

los paraacutemetros que determinan la funcioacuten de distribucioacuten

Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria son grandes

es muy caro o imposible estudiar a todos sus individuos lo que se hace es estudiar una muestra ( una

parte) de la poblacioacuten En todos estos problemas que estudia la inferencia estadiacutestica juega un papel

fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de las distribuciones de

probabilidad) y la Teoriacutea de Muestras (procedimientos para tomar muestras de manera apropiada)

TEORIacuteA DEL MUESTREO

La teoriacutea de muestreo frecuentemente es llamada teoriacutea de Nyquist o Shannon por los investigadores

del primer trabajo sobre el tema lo cual ocurrioacute en los antildeos cuarentaConceptualmente definida como

el estudio de las relaciones existentes entre una poblacioacuten y muestras extraiacutedas de la misma La teoriacutea

del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos

muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas

lo que nos lleva a los procesos denominados ensayos e hipoacutetesis de significacioacuten fundamental para

comprensioacuten de la teoriacutea de la decisioacuten en el aacuterea de la inferencia estadiacutestica Abarca el estudio de las

relaciones que existen entre una poblacioacuten y las muestras extraiacutedas de la misma Permite estimar los

paraacutemetros poblacionales (media varianza etc) a partir de los correspondientes valores muestrales

denominados estadiacutesticos La teoriacutea del muestreo tambieacuten permite determinar si las diferencias

observadas entre dos muestras son significativas o por el contrario debidas al azar lo que supone la

realizacioacuten de ensayos e hipoacutetesis de significacioacuten

Pues bien la teoriacutea del muestreo estudia las teacutecnicas y procedimientos que debemos emplear para que

las muestras sean representativas de la poblacioacuten que pretendemos estudiar de forma que los errores en

la determinacioacuten de los paraacutemetros de la poblacioacuten objeto de estudio sean miacutenimos Para conseguirlo

la muestra tiene que ser representativa de la poblacioacuten Para que la extraccioacuten de la muestra sea

representativa se deben cumplir dos principios baacutesicos

Que haya independencia en la seleccioacuten de los individuos que forman la muestra

Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra

El propoacutesito de un estudio estadiacutestico suele ser extraer conclusiones acerca de la naturaleza de una

poblacioacuten Al ser la poblacioacuten grande y no poder ser estudiada en su integridad en la mayoriacutea de los

casos las conclusiones obtenidas deben basarse en el examen de solamente una parte de eacutesta lo que

lleva en primer lugar a la justificacioacuten necesidad y definicioacuten de las diferentes teacutecnicas de muestreo

Los primeros teacuterminos obligados a los que se debe hacer referencia seraacuten los de estadiacutestico y

estimador

Dentro de este contexto seraacute necesario asumir un estadiacutestico o estimador como una variable aleatoria

con una determinada distribucioacuten y que seraacute la pieza clave en las dos amplias categoriacuteas de la

inferencia estadiacutestica la estimacioacuten y el contraste de hipoacutetesis

El concepto de estimador como herramienta fundamental se caracteriza mediante una serie de

propiedades que serviraacuten para elegir el ``mejor para un determinado paraacutemetro de una poblacioacuten asiacute

como algunos meacutetodos para la obtencioacuten de ellos tanto en la estimacioacuten puntual como por intervalos

iquestCoacutemo deducir la ley de probabilidad sobre determinado caraacutecter de una poblacioacuten cuando soacutelo se

conoce una muestra

Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacioacuten entre el

fumar y el caacutencer de pulmoacuten y se intenta extender las conclusiones obtenidas sobre una muestra al

resto de individuos de la poblacioacuten

La tarea fundamental de la estadiacutestica inferencial es hacer inferencias acerca de la poblacioacuten a partir

de una muestra extraiacuteda de la misma

Las teacutecnicas estadiacutesticas para ser utilizados requieren datos cuya adquisicioacuten es un compromiso difiacutecil

La teoriacutea de muestras o muestreo tiene por objeto proporcionar una metodologiacutea que guiacutee los

problemas de recogida de datos es decir coacutemo se hace para recoger esos datos Por lo tanto El

muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica es determinar que parte

de una realidad en estudio (poblacioacuten o universo) debe examinarse con la finalidad de hacer inferencias

sobre dicha poblacioacuten El error que se comete debido a hecho de que se obtienen conclusiones sobre

cierta realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error de muestreo

Obtener una muestra adecuada significa lograr una versioacuten simplificada de la poblacioacuten que

reproduzca de alguacuten modo sus rasgos baacutesicos

En el muestreo se utilizan por lo general las siguientes Terminologiacuteas

UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan

caracteriacutesticas comunes entre si

POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de

las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una

poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el

universo

MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya

seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o

elementos de anaacutelisis sacados del marco

UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que

mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las

partes que se van a analizar

UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la

informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que

obtener la informacioacuten

UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la

informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente

UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y

que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los

conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras

palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo

miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo

MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)

representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este

muestre puede ser No Probabiliacutestico y Probabiliacutestico

MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan

las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco

muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades

muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a

distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas

por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos

Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten

Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten

de los paraacutemetros

Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro

correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al

valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten

basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo

Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida

podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean

muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en

cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten

muestral de un estadiacutestico y su fiabilidad

Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier

informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)

asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un

estadiacutestico capte el verdadero valor del paraacutemetro

Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de

entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes

pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios

previos

SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos

grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un

mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la

significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es

necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de

frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc

Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos

que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica

Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por

lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un

evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe

al azar sino a factores especiacuteficos

De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar

estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no

puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten

El disentildeo de muestras tiene dos procesos fundamentales

Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la

muestra

Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de

la muestra

El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es

maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de

encuestados

VENTAJAS DEL MUESTREO

a) Costos reducidos

b) Mayor rapidez para obtener resultados

c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores

1- Volumen de trabajo reducido

2- Puede existir mayor supervisioacuten en el trabajo

3- Se puede dar maacutes entrenamiento al personal

4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten

d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo

- Pruebas de germinacioacuten

- Anaacutelisis de sangre

- Control de calidad

Tipos de muestreo

Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo

aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y

meacutetodos de muestreo no probabiliacutesticas

Meacutetodos de muestreo probabiliacutesticas

Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad

El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y

dicha probabilidad no es nula para ninguacuten elemento

Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la

misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la

representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los

meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos

PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO

a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la

aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de

muestreo pertenecen a M1 M2 y asiacute sucesivamente

b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi

c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser

seleccionada

d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles

muestras Mi

PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO

Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las

metas del estudio

Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que

constituyen una poblacioacuten Este generalmente puede ser de dos tipos

a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad

de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de

un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras

caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor

b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las

que se ha dividido el aacuterea total

Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por

ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa

estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una

variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los

meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas

a) uniformidad

b) practicabilidad

c) deber ser comprensibles para el grupo de trabajo

Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo

que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple

aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico

Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el

esquema o tipo de muestreo seleccionado

Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una

poblacioacuten de tamantildeo N

Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa

por las siguientes razones

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de las distribuciones de

probabilidad) y la Teoriacutea de Muestras (procedimientos para tomar muestras de manera apropiada)

TEORIacuteA DEL MUESTREO

La teoriacutea de muestreo frecuentemente es llamada teoriacutea de Nyquist o Shannon por los investigadores

del primer trabajo sobre el tema lo cual ocurrioacute en los antildeos cuarentaConceptualmente definida como

el estudio de las relaciones existentes entre una poblacioacuten y muestras extraiacutedas de la misma La teoriacutea

del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos

muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas

lo que nos lleva a los procesos denominados ensayos e hipoacutetesis de significacioacuten fundamental para

comprensioacuten de la teoriacutea de la decisioacuten en el aacuterea de la inferencia estadiacutestica Abarca el estudio de las

relaciones que existen entre una poblacioacuten y las muestras extraiacutedas de la misma Permite estimar los

paraacutemetros poblacionales (media varianza etc) a partir de los correspondientes valores muestrales

denominados estadiacutesticos La teoriacutea del muestreo tambieacuten permite determinar si las diferencias

observadas entre dos muestras son significativas o por el contrario debidas al azar lo que supone la

realizacioacuten de ensayos e hipoacutetesis de significacioacuten

Pues bien la teoriacutea del muestreo estudia las teacutecnicas y procedimientos que debemos emplear para que

las muestras sean representativas de la poblacioacuten que pretendemos estudiar de forma que los errores en

la determinacioacuten de los paraacutemetros de la poblacioacuten objeto de estudio sean miacutenimos Para conseguirlo

la muestra tiene que ser representativa de la poblacioacuten Para que la extraccioacuten de la muestra sea

representativa se deben cumplir dos principios baacutesicos

Que haya independencia en la seleccioacuten de los individuos que forman la muestra

Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra

El propoacutesito de un estudio estadiacutestico suele ser extraer conclusiones acerca de la naturaleza de una

poblacioacuten Al ser la poblacioacuten grande y no poder ser estudiada en su integridad en la mayoriacutea de los

casos las conclusiones obtenidas deben basarse en el examen de solamente una parte de eacutesta lo que

lleva en primer lugar a la justificacioacuten necesidad y definicioacuten de las diferentes teacutecnicas de muestreo

Los primeros teacuterminos obligados a los que se debe hacer referencia seraacuten los de estadiacutestico y

estimador

Dentro de este contexto seraacute necesario asumir un estadiacutestico o estimador como una variable aleatoria

con una determinada distribucioacuten y que seraacute la pieza clave en las dos amplias categoriacuteas de la

inferencia estadiacutestica la estimacioacuten y el contraste de hipoacutetesis

El concepto de estimador como herramienta fundamental se caracteriza mediante una serie de

propiedades que serviraacuten para elegir el ``mejor para un determinado paraacutemetro de una poblacioacuten asiacute

como algunos meacutetodos para la obtencioacuten de ellos tanto en la estimacioacuten puntual como por intervalos

iquestCoacutemo deducir la ley de probabilidad sobre determinado caraacutecter de una poblacioacuten cuando soacutelo se

conoce una muestra

Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacioacuten entre el

fumar y el caacutencer de pulmoacuten y se intenta extender las conclusiones obtenidas sobre una muestra al

resto de individuos de la poblacioacuten

La tarea fundamental de la estadiacutestica inferencial es hacer inferencias acerca de la poblacioacuten a partir

de una muestra extraiacuteda de la misma

Las teacutecnicas estadiacutesticas para ser utilizados requieren datos cuya adquisicioacuten es un compromiso difiacutecil

La teoriacutea de muestras o muestreo tiene por objeto proporcionar una metodologiacutea que guiacutee los

problemas de recogida de datos es decir coacutemo se hace para recoger esos datos Por lo tanto El

muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica es determinar que parte

de una realidad en estudio (poblacioacuten o universo) debe examinarse con la finalidad de hacer inferencias

sobre dicha poblacioacuten El error que se comete debido a hecho de que se obtienen conclusiones sobre

cierta realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error de muestreo

Obtener una muestra adecuada significa lograr una versioacuten simplificada de la poblacioacuten que

reproduzca de alguacuten modo sus rasgos baacutesicos

En el muestreo se utilizan por lo general las siguientes Terminologiacuteas

UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan

caracteriacutesticas comunes entre si

POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de

las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una

poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el

universo

MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya

seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o

elementos de anaacutelisis sacados del marco

UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que

mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las

partes que se van a analizar

UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la

informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que

obtener la informacioacuten

UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la

informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente

UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y

que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los

conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras

palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo

miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo

MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)

representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este

muestre puede ser No Probabiliacutestico y Probabiliacutestico

MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan

las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco

muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades

muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a

distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas

por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos

Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten

Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten

de los paraacutemetros

Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro

correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al

valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten

basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo

Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida

podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean

muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en

cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten

muestral de un estadiacutestico y su fiabilidad

Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier

informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)

asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un

estadiacutestico capte el verdadero valor del paraacutemetro

Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de

entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes

pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios

previos

SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos

grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un

mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la

significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es

necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de

frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc

Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos

que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica

Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por

lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un

evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe

al azar sino a factores especiacuteficos

De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar

estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no

puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten

El disentildeo de muestras tiene dos procesos fundamentales

Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la

muestra

Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de

la muestra

El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es

maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de

encuestados

VENTAJAS DEL MUESTREO

a) Costos reducidos

b) Mayor rapidez para obtener resultados

c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores

1- Volumen de trabajo reducido

2- Puede existir mayor supervisioacuten en el trabajo

3- Se puede dar maacutes entrenamiento al personal

4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten

d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo

- Pruebas de germinacioacuten

- Anaacutelisis de sangre

- Control de calidad

Tipos de muestreo

Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo

aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y

meacutetodos de muestreo no probabiliacutesticas

Meacutetodos de muestreo probabiliacutesticas

Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad

El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y

dicha probabilidad no es nula para ninguacuten elemento

Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la

misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la

representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los

meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos

PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO

a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la

aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de

muestreo pertenecen a M1 M2 y asiacute sucesivamente

b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi

c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser

seleccionada

d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles

muestras Mi

PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO

Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las

metas del estudio

Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que

constituyen una poblacioacuten Este generalmente puede ser de dos tipos

a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad

de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de

un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras

caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor

b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las

que se ha dividido el aacuterea total

Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por

ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa

estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una

variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los

meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas

a) uniformidad

b) practicabilidad

c) deber ser comprensibles para el grupo de trabajo

Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo

que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple

aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico

Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el

esquema o tipo de muestreo seleccionado

Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una

poblacioacuten de tamantildeo N

Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa

por las siguientes razones

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

En el muestreo se utilizan por lo general las siguientes Terminologiacuteas

UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan

caracteriacutesticas comunes entre si

POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de

las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una

poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el

universo

MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya

seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o

elementos de anaacutelisis sacados del marco

UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que

mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las

partes que se van a analizar

UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la

informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que

obtener la informacioacuten

UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la

informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente

UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y

que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los

conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras

palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo

miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo

MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)

representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este

muestre puede ser No Probabiliacutestico y Probabiliacutestico

MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan

las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco

muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades

muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a

distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas

por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos

Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten

Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten

de los paraacutemetros

Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro

correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al

valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten

basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo

Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida

podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean

muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en

cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten

muestral de un estadiacutestico y su fiabilidad

Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier

informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)

asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un

estadiacutestico capte el verdadero valor del paraacutemetro

Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de

entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes

pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios

previos

SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos

grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un

mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la

significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es

necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de

frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc

Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos

que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica

Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por

lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un

evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe

al azar sino a factores especiacuteficos

De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar

estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no

puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten

El disentildeo de muestras tiene dos procesos fundamentales

Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la

muestra

Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de

la muestra

El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es

maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de

encuestados

VENTAJAS DEL MUESTREO

a) Costos reducidos

b) Mayor rapidez para obtener resultados

c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores

1- Volumen de trabajo reducido

2- Puede existir mayor supervisioacuten en el trabajo

3- Se puede dar maacutes entrenamiento al personal

4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten

d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo

- Pruebas de germinacioacuten

- Anaacutelisis de sangre

- Control de calidad

Tipos de muestreo

Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo

aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y

meacutetodos de muestreo no probabiliacutesticas

Meacutetodos de muestreo probabiliacutesticas

Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad

El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y

dicha probabilidad no es nula para ninguacuten elemento

Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la

misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la

representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los

meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos

PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO

a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la

aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de

muestreo pertenecen a M1 M2 y asiacute sucesivamente

b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi

c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser

seleccionada

d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles

muestras Mi

PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO

Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las

metas del estudio

Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que

constituyen una poblacioacuten Este generalmente puede ser de dos tipos

a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad

de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de

un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras

caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor

b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las

que se ha dividido el aacuterea total

Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por

ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa

estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una

variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los

meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas

a) uniformidad

b) practicabilidad

c) deber ser comprensibles para el grupo de trabajo

Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo

que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple

aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico

Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el

esquema o tipo de muestreo seleccionado

Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una

poblacioacuten de tamantildeo N

Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa

por las siguientes razones

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios

previos

SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos

grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un

mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la

significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es

necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de

frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc

Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos

que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica

Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por

lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un

evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe

al azar sino a factores especiacuteficos

De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar

estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no

puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten

El disentildeo de muestras tiene dos procesos fundamentales

Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la

muestra

Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de

la muestra

El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es

maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de

encuestados

VENTAJAS DEL MUESTREO

a) Costos reducidos

b) Mayor rapidez para obtener resultados

c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores

1- Volumen de trabajo reducido

2- Puede existir mayor supervisioacuten en el trabajo

3- Se puede dar maacutes entrenamiento al personal

4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten

d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo

- Pruebas de germinacioacuten

- Anaacutelisis de sangre

- Control de calidad

Tipos de muestreo

Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo

aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y

meacutetodos de muestreo no probabiliacutesticas

Meacutetodos de muestreo probabiliacutesticas

Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad

El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y

dicha probabilidad no es nula para ninguacuten elemento

Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la

misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la

representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los

meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos

PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO

a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la

aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de

muestreo pertenecen a M1 M2 y asiacute sucesivamente

b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi

c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser

seleccionada

d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles

muestras Mi

PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO

Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las

metas del estudio

Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que

constituyen una poblacioacuten Este generalmente puede ser de dos tipos

a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad

de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de

un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras

caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor

b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las

que se ha dividido el aacuterea total

Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por

ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa

estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una

variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los

meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas

a) uniformidad

b) practicabilidad

c) deber ser comprensibles para el grupo de trabajo

Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo

que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple

aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico

Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el

esquema o tipo de muestreo seleccionado

Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una

poblacioacuten de tamantildeo N

Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa

por las siguientes razones

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad

El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y

dicha probabilidad no es nula para ninguacuten elemento

Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la

misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la

representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los

meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos

PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO

a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la

aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de

muestreo pertenecen a M1 M2 y asiacute sucesivamente

b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi

c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser

seleccionada

d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles

muestras Mi

PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO

Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las

metas del estudio

Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que

constituyen una poblacioacuten Este generalmente puede ser de dos tipos

a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad

de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de

un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras

caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor

b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las

que se ha dividido el aacuterea total

Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por

ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa

estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una

variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los

meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas

a) uniformidad

b) practicabilidad

c) deber ser comprensibles para el grupo de trabajo

Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo

que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple

aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico

Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el

esquema o tipo de muestreo seleccionado

Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una

poblacioacuten de tamantildeo N

Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa

por las siguientes razones

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la

variabilidad de la poblacioacuten

b) Verificar la funcionalidad de un meacutetodo de muestreo

c) Estimar costos

d) Conocer la eficiencia de la organizacioacuten del trabajo de campo

e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten

Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones

necesarias para obtener la informacioacuten buscada

Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de

distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo

(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo

Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la

misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que

la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe

afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten

individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos

hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo

sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a

continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden

de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el

muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente

toda la poblacioacuten

El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y

2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros

aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario

para completar el tamantildeo de muestra requerido

Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten

que estamos manejando es muy grande

COMO SE SELECCIONA UNA MUESTRA ALEATORIO

El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital

importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de

la misma y la validez de la induccioacuten estadiacutestica

Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la

muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus

resultados

En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra

ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores

entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de

acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten

final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo

de muestreo probabiliacutestica que se piensa utilizar

En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos

tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio

podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra

aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin

sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos

restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma

probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas

vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin

ver) 20 papeles uno tras otro sin sustitucioacuten

En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la

manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o

nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se

colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen

sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de

figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de

computadoras

Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar

los siguientes

a) Seleccioacuten por sorteo

b) Uso de tablas de nuacutemeros aleatorios

a)- Seleccioacuten por Sorteo

Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos

similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el

universo y que son introducidas en una bolsa bombo globo etc las cuales deben

ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en

esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente

elaborada constituyendo los elementos de la muestra

b)- Uso de la Tabla de Nuacutemeros Aleatorios

El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de

constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos

complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la

caracteriacutestica en estudio

Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como

el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier

parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a

ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura

Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1

El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo

elementos ( n lt N) es el siguiente

1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la

poblacioacuten

2)- Se numeran todos los elementos de la poblacioacuten del 1 al N

3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier

lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras

4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1

y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se

consideran soacutelo una vez

OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo

N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20

la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos

la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede

con los diferentes caso que se presenten

EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una

muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los

individuo de la poblacioacuten Los nombres de los electos son

Juan Rojas

Luis Mata

Pedro Rodriacuteguez

Miguel Juaacuterez

Nicolaacutes Mata

Juan Mariacuten

Joseacute Mota

Maria Pentildea

Carlos Mata

Ligia Larez

Rauacutel Ron

Magdalys Mediacuteas

2)- Se enumeran los elementos de la poblacioacuten asiacute

01- Juan Rojas

02- Luis Mata

03- Pedro Rodriacuteguez

04- Miguel Juaacuterez

05- Nicolaacutes Mata

06- Juan Mariacuten

07- Joseacute Mota

08- Maria Pentildea

09- Carlos Mata

10- Ligia Larez

11- Rauacutel Ron

12- Magdalys Mediacuteas

Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por

ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten

de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas

seleccionadas son las siguientes

04- Miguel Juaacuterez

02- Luis Mata

03- Pedro Rodriacuteguez

12- Magdalys Mejias

Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas

seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra

requerida

TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

04433 80674 24520 18222 l0610 05794 37515

60298 47829 72648 37414 75755 04717 29899

67884 5965l 67533 68123 17730 95862 08034

32653 01895 12506 88535 36553 23757 34209

95913 15405 13772 76638 48423 25018 99041

55864 21694 13122 44115 01601 50541 00147

35334 49810 91601 40617 72876 33967 73830

57729 32196 76487 11622 96297 24160 09903

86648 13697 63677 70119 94739 25875 38829

30574 47609 07967 32422 76791 39725 53711

8l307 43694 83580 79974 45929 85113 26872

02410 54905 79007 54939 21410 86980 91772

18969 75274 52233 62319 08598 09066 95288

87863 82384 66860 62297 80198 19347 73234

68397 7l708 15438 62311 72844 60203 46412

28529 54447 58729 10854 99058 l8260 38765

44285 06372 l5867 70418 57012 72122 36634

86299 83430 33571 23309 57040 29285 67870

84842 68668 90894 61658 15001 94055 36308

56970 83609 52098 04184 54967 72938 56834

83125 71257 60490 44369 66130 72936 69848

55503 52423 02464 26141 68779 66388 75242

47019 76273 33203 29608 54553 25971 69573

84828 32592 79526 29554 84580 37859 28504

68921 08141 79227 05748 51276 57143 31926

36458 96045 30424 98420 72925 40729 22337

95752 59445 36847 87729 81679 59126 59437

26768 47323 58454 56958 20575 76746 49878

42613 37056 43636 58085 06766 60227 96414

95457 30566 65482 25596 02678 54592 63607

95276 17894 63564 95958 39150 64379 46059

66954 52324 64776 92345 95110 59448 77249

17457 18481 14113 62462 02798 54977 48349

03704 36872 83214 59337 01695 60666 97410

21538 86497 33210 60337 27976 70661 08250

57178 67619 98310 70348 11317 71623 55510

31048 97558 94953 55866 96283 46620 52087

69799 55380 16498 80733 96422 58078 99643

90595 61867 59231 17772 67831 33317 00520

33570 04981 98939 78784 09977 29398 93896

15340 93460 57477 13898 48431 72936 78160

64079 42483 36512 56186 99098 48850 72521

63491 05546 67118 62063 74958 20946 28147

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

92003 63868 41034 28260 79708 00770 88643

52360 46658 66511 04172 73085 11795 52594

74622 12142 68355 65635 21828 39539 18988

04157 50079 61343 64315 70836 82857 35335

86003 60070 66241 32836 27573 11479 94114

41268 80187 20351 09636 84668 42486 71303

Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport

Economici anll Statistic

TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE

ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente

relacioacuten

22

22

22

2

ZSdN

ZSNn

de donde

n = tamantildeo de la muestra

N = tamantildeo de la poblacioacuten

2Z = variable estandarizada de distribucioacuten normal

Ssup2 = varianza de la muestra

d(e) = precisioacuten del muestreo

= Nivel de significancia

Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera

estimacioacuten de Ssup2

Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la

media de la capacidad en centiacutemetros cuacutebicos de los mismos

A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros

cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo

debe de ser la muestra

DATOS

S = 2 cms3 N = 8000 d = 025 cms

3 = 005 (5)

2Z = 196

23937515

2122931

96122508000

96128000222

22

22

2

22

2

)()()(

)()(

ZSNd

ZSNn Frascos

Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos

TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE

ALEATORIO

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de

muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera

2

22

22

ZqpdN

ZqpNn

De donde

p = probabilidad de eacutexito

q = probabilidad de fracaso

d = precisioacuten expresada en porcentaje

En este caso para la estimacioacuten de la varianza tenemos dos opciones

a) hacer un premuestreo

b) asumir varianza maacutexima

Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman

leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un

nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra

DATOS

N = 1500 d = 10 = 01 α = 5

p = 05 y q = 05 (asumiendo varianza maacutexima)

Zα2 = 196

909615

61440

9615050101500

9615050150022

2

22

2

22

)))(()(

))()((

ZqpdN

ZqpNn

Se deben de muestrear 90 nintildeos

Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por

listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes

hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a

ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio

simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten

Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar

de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un

nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k

i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el

tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como

punto de partida seraacute un nuacutemero al azar entre 1 y k

El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que

al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una

homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre

listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un

muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no

podriacutea haber una representacioacuten de los dos sexos

Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la

muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por

ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en

la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos

y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas

tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se

puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil

etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la

poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos

principales para utilizar un muestreo aleatorio estratificado son los siguientes

a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras

del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son

homogeacuteneas

b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos

de la poblacioacuten en grupos convenientes

c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los

subgrupos deben de ser entonces estratos identificables

Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o

decidiendo en que forma se definiraacuten los estratos

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten

representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo

aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos

concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado

grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)

La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser

de diferentes tipos

Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales

Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en

cada estrato

Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se

considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la

desviacioacuten

Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la

reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos

una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos

escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios

semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten

representados todos los tipos de colegio realizamos un muestreo estratificado empleando como

variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos

de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues

hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten

supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra

Colegios puacuteblicos 600010000 = 060

Colegios semiprivados 300010000 = 030

Colegios privados 100010000 = 010

Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten

por el tamantildeo muestral

Colegios puacuteblicos 060x600 = 360 sujetos

Colegios semiprivados 030x600 =180 sujetos

Colegios privados 010x600 = 60 sujetos

TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO

ESTRATIFICADO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

22

22

ii

i

ii

SNDN

w

SN

n

De donde

Ni = tamantildeo del i eacutesimo estrato

N = tamantildeo de la poblacioacuten

Ssup2i = varianza del i eacutesimo estrato

wi = importancia o peso del i eacutesimo estrato

B

D4

2

Donde B = Precisioacuten

Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea

a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea

proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma

finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha

prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el

ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de

cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de

ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los

diferentes estratos

DATOS

ESTRATO Ni Si wi

1 558 35 558998 = 056

2 190 54 190998 = 019

3 250 62 250998 = 025

Total 998

con distribucioacuten proporcional

N = Σ Ni = 998

22

221

ii

i

i

SNDN

w

SN

n

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

81270987

521961487

21986249001

521961487

249001)250()998(

2504

1

4

1Pr

921985

96104554056835

)26(250)45(190)53(558

521961487

9610000554040056811087

250

2402500

190

1052676

560

3814209

250

)26()250(

190

)45()190(

560

)53()558(

22

22

22

22

2

2

2222

2

33

2

22

2

11

2

22

22

22

22222222

3

2

3

2

3

2

2

2

2

2

1

2

1

2

1

22

totalmuestrala

detamantildeoelesSNDN

w

SN

n

DN

BD

esBesisionLa

SN

SN

SN

SNSNSNSN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

w

SN

ii

i

ii

ii

ii

ii

ii

i

ii

i

ii

i

ii

i

ii

i

ii

Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra

n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20

Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten

pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades

muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es

un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las

unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son

conglomerados naturales

En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas

electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El

muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de

conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes

todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se

trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de

700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los

pasos a seguir seriacutean los siguientes

1 Recoger un listado de todos los institutos

2 Asignar un nuacutemero a cada uno de ellos

3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos

proporcionaraacuten los 700 profesores que necesitamos

Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico

CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES

Aleatorio

simple

Se selecciona una muestra de tamantildeo

n de una poblacioacuten de N unidades

cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN

Sencillo y de faacutecil comprensioacuten

Caacutelculo raacutepido de medias y

varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen

paquetes informaacuteticos para analizar

los datos

Requiere que se posea de

antemano un listado completo de

toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es

posible que no represente a la

poblacioacuten adecuadamente

Sistemaacutetico

Conseguir un listado de los N elementos de la poblacioacuten

Determinar tamantildeo muestral n

Definir un intervalo k=Nn Elegir un

nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los

elementos de la lista

Faacutecil de aplicar No siempre es necesario tener un listado de toda la

poblacioacuten Cuando la poblacioacuten estaacute

ordenada siguiendo una tendencia

conocida asegura una cobertura de unidades de todos los tipos

Si la constante de muestreo estaacute asociada con el fenoacutemeno de

intereacutes las estimaciones obtenidas

a partir de la muestra pueden

contener sesgo de seleccioacuten

Estratificado

En ciertas ocasiones resultaraacute

conveniente estratificar la muestra

seguacuten ciertas variables de intereacutes Para ello debemos conocer la

composicioacuten estratificada de la

poblacioacuten objetivo a muestrear Una

vez calculado el tamantildeo muestral apropiado este se reparte de manera

proporcional entre los distintos

estratos definidos en la poblacioacuten

usando una simple regla de tres

Tiende a asegurar que la muestra

represente adecuadamente a la

poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen

estimaciones maacutes precisa Su

objetivo es conseguir una muestra lo

mas semejante posible a la poblacioacuten en lo que a la o las variables

estratificadoras se refiere

Se ha de conocer la distribucioacuten en

la poblacioacuten de las variables

utilizadas para la estratificacioacuten

Conglomerados

Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad

de listados de las unidades de una

etapa se limita a aquellas unidades de

muestreo seleccionadas en la etapa anterior

Es muy eficiente cuando la poblacioacuten es muy grande y

dispersa No es preciso tener un

listado de toda la poblacioacuten soacutelo de

las unidades primarias de muestreo

El error estaacutendar es mayor que en el muestreo aleatorio simple o

estratificado El caacutelculo del error

estaacutendar es complejo

PLANES DE MUESTREO ALEATORIO

TIPO CARACTERIacuteSTICAS OBSERVACIONES

SIMPLE

Cada elemento de la poblacioacuten tiene la misma

probabilidad a priori de ser incluido en la muestra

Es el muestreo maacutes sencillo desde el punto de vista

matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones

ESTRATIFICADO

La poblacioacuten se divide en subpoblaciones (estratos)

identificados por niveles en los factores En cada estrato se realiza MAS

Se usa cuando se desea informacioacuten precisa para cada

estrato o cuando razones administrativas lo hacen conveniente

POR

CONGLOMERADO

La poblacioacuten se divide en subpoblaciones

(conglomerados) que se consideran a priori similares en los factores Se seleccionan

conglomerados y dentro de eacutestos unidades

secundarias

Se usa cuando es imposible o muy caro construir un

marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea

geograacutefica)

SISTEMAacuteTICO

La poblacioacuten se ordena con alguacuten criterio (puede ser

aleatorio) Se sortea un elemento primero para ser

muestreado y se continuacutea muestreando uno cada tantos (paso)

( Por ejemplo 5 15 2585)

Es faacutecil de realizar cuando no se dispone de

identificacioacuten de los elementos Puede introducir

variaciones ciacuteclicas en los resultados

Teacutecnicas de muestreo sobre una poblacioacuten

La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de

un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras

Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Coste reducido

Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la

poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando

se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su

intencioacuten de voto que a 30000000

Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas

electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones

muchas horas antes de que el recuento final de votos haya finalizado

Maacutes posibilidades

Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es

posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que

vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes

De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas

Eleccioacuten de la muestra (muestreo)

Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten

(inferencia)

El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la

poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el

objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados

Meacutetodos de muestreo no probabiliacutesticas

En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar

grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no

permiten realizar estimaciones inferenciales sobre la poblacioacuten

Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta

excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no

sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea

representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos

En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea

representativa Estos muestreos pueden ser

Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre

la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes

representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con

el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel

En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen

unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y

residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que

cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten

Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que

deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros

maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los

estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos

concretos se deberaacute entrevistar

Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de

obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente

tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores

votaciones han marcado tendencias de voto

Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el

utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad

emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta

conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios

con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc

SELECCIOacuteN ALEATORIA DE LAS MUESTRAS

A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los

meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y

escoger la muestra al azar

Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar

una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra

aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para

cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los

nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en

la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del

universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas

caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes

representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa

Esta es la prueba de estabilidad de la muestra

TAMANtildeO DE LA MUESTRA

A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios

factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza

poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del

tamantildeo muestral delimitemos estos factores

Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores

1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la

poblacioacuten total

2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten

3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los

resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe

ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos

de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser

praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza

menor Comuacutenmente en las investigaciones sociales se busca un 95

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa

como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual

que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0

entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo

de equivocarse

Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son

complementarios la confianza y el error

La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se

quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El

porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que

se rechazoacute se la hipoacutetesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la

finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de

observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se

refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede

considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es

menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una

muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para

que el nivel de confiabilidad sea el que se ha establecido previamente

middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar

caracteriacutesticas similares a las de la poblacioacuten o universo

Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes

son

middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo

(muestra tomada) y no por la totalidad de eacutel

middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables

middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor

tiempo

iquestCoacutemo obtener el tamantildeo de la muestra a utilizar

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar

sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que

el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la

decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean

en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la

variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de

precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes

1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a

dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente

2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le

denomina p)

3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta

probabilidad se le denomina q= 1 ndash p)

4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados

(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6

ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6

middot Determinamos el tamantildeo de la poblacioacuten o universo

5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o

universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera

infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito

si el nuacutemero de elementos es menor a esta cantidad)

Diferentes niveles de confianza utilizados en la praacutectica

Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50

Valores de Z 300 258 233 205 200 196 1645 128 100 06745

TAMANtildeO DE LA MUESTRA

Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es

iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los

objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse

en cuenta en la fase de planificacioacuten del estudio

El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para

reducir Costos se procura tomar una Muestra menor pero representativa y significativa

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier

investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una

muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de

recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El

tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho

del intervalo de confianza (e) o precisioacuten

El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la

Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o

universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial

(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede

emplear la foacutermula siguiente

e

pqZn

2

2

Si p = q = 50 entonces )1(42 2

22

e

Zn

e

Zn

Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de

confianza) y 2

Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de

confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes

grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase

(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute

cerca de 50 )

Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que

definir tres incoacutegnitas

1- El nivel de confianza (Z) deseado

2- El error muestral permitido e

3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina

el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal

apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la

proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el

paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas

l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que

permiten obtener un estimado o informacioacuten de p

2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un

valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor

de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto

cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado

previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para

determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una

sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir

PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas

existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el

tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la

estimacioacuten sea correcta

SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p

debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por

medio de la expresioacuten

2

22

42 e

Zn

e

Zn

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99

que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor

estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se

aplica la formula

070)0230(4

666

)150(4

)582(

42 2

2

2

22

e

Zn

e

Zn Por lo tanto el tamantildeo de la muestra seraacute de 74

2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas

entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute

tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99

SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que

practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una

estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica

para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502

Zyeqp

2

22

e

pqZn

sustituyendo los datos conocidos en esa formula se tiene

67230

230666

)150(

)350)(650()582(2

2

x

n El tamantildeo de la muestra es entonces 67

Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el

tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que

tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia

En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es

dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos

considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente

formula

Cuando Nlt30 la formula que se tiene que utilizar es

Donde

n es el tamantildeo de la muestra

Z es el nivel de confianza

p es la variabilidad positiva

q es la variabilidad negativa

N es el tamantildeo de la poblacioacuten

e es la precisioacuten o el error

Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten

y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten

Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una

investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un

cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar

la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa

30

2

2

2

2

2

Nparausaseformulaesta

qpZNe

qpNZn

)1(

2

2

2

2

2

qpZNe

qpNZn

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la

seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2

2

2

e

pqZn

Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)

por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una

prueba previa

Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un

valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196

De esta manera se aplica la formula 2

2

2

e

pqZn

se realiza la sustitucioacuten y se obtiene n asiacute

38400250

96040

00250

)250)(84163(

050

)50)(50()961(2

2

n Esto quiere decir que el tamantildeo de la muestra

es de 384 alumnos

Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se

aplicaraacute la foacutermula pqZNe

qNpZn

2

2

2

2

Utilizando los mismos paraacutemetros la sustitucioacuten queda

como

037053693425

99363

)50)(50()961()050)(9750(

)9750)(50)(50()961(22

2

n

Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la

investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para

la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el

resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es

conocida (370)

EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes

de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten

esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible

no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de

98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido

DATOS

N = 7000

e = 005

Z al 98 =233

P = 05

q = 05

n =

SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula

Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por

un muestreo del total

042780426366

452714

)50)(50()332()2000()050(

)50)(50)(2000()332(

22

2

2

2

2

2

2

qpZNe

qpNZn

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA

DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para

obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute

1

N

nN

n

ZSe

Los investigadores consideran que esta formula solo se utiliza cuando Nlt30

Se utiliza para Ngt30

Donde

n = es el tamantildeo de la muestra

Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido

Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)

N = es el tamantildeo de la poblacioacuten o universo muestral

e es la precisioacuten o el error

El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon

La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este

paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza

poblacional son

Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una

estimacioacuten de 2

Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes

EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una

serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un

nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una

varianza de 30

DATOS

N = 20

σ2 = 30

Z = 196

e = 5

SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por

poblacioacuten finita luego se aplica la formula asiacute

Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es

4 tubos por lote

2

2

22

2

2

2

)1(

ZNe

ZNn

0425590

962304

)961(30)19(5

)961(3020

)1( 22

2

2

2

22

2

2

2

ZNe

ZNn

2

2

22

2

2

2

ZNe

ZNn

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener

una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la

estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio

verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos

DATOS

N = 2000

e = 05

Z al 95 = 196

σ2 = 25

n =

SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se

aplicara la siguiente formula

Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo

)5050( con un nivel de confianza del 95 es de n = 38 obreros

Teorema Central del Liacutemite

El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y

todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se

distribuye seguacuten una distribucioacuten normal

Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y

varianza 2i se cumple que cuando n tiende a infinito el cociente

2i

iix tiende a

distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi

sean distintas entre si

Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda

al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una

distribucioacuten normal

Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros

de la distribucioacuten normal son

Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)

Varianza 2n

individuales)

Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor

0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con

media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60

caras

La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten

normal

Media = 100 x 05 = 50 Varianza = 100 x 025 = 25

Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada

equivalente

0386937604509

19208

6049500

19208

)961(522000)50(

)961)(52(200022

2

2

2

22

2

2

2

ZNe

ZNn

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228

XZ

5

5060

() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten

Por lo tanto

P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228

Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del

228