teorÍa de muestreo - … · en lo que sigue nos vamos a limitar a problemas de inferencia ......
TRANSCRIPT
TEORIacuteA DE MUESTREO
(HAMLET Mata Mata prof Del Tecnologico de El Tigre)
wwwmipaginacantvnethamletmatamata
POBLACIOacuteN Y MUESTRA
Una poblacioacuten estaacute determinada por sus caracteriacutesticas definitorias Por lo tanto el conjunto de
elementos que posea esta caracteriacutestica se denomina poblacioacuten o universo Poblacioacuten es la totalidad del
fenoacutemeno a estudiar donde las unidades de poblacioacuten poseen una caracteriacutestica comuacuten la que se
estudia y da origen a los datos de la investigacioacuten
Entonces una poblacioacuten es el conjunto de todas las cosas que concuerdan con una serie determinada de
especificaciones Un censo por ejemplo es el recuento de todos los elementos de una poblacioacuten
Cuando seleccionamos algunos elementos con la intencioacuten de averiguar algo sobre una poblacioacuten
determinada nos referimos a este grupo de elementos como muestra Por supuesto esperamos que lo
que averiguamos en la muestra sea cierto para la poblacioacuten en su conjunto La exactitud de la
informacioacuten recolectada depende en gran manera de la forma en que fue seleccionada la muestra
Cuando no es posible medir cada uno de los individuos de una poblacioacuten se toma una muestra
representativa de la misma
La muestra descansa en el principio de que las partes representan al todo y por tal refleja las
caracteriacutesticas que definen la poblacioacuten de la que fue extraiacuteda lo cual nos indica que es representativa
Por lo tanto la validez de la generalizacioacuten depende de la validez y tamantildeo de la muestra
Leyes del meacutetodo de muestreo
El meacutetodo de muestreo se basa en ciertas leyes que le otorgan su fundamento cientiacutefico las cuales son
Ley de los grandes nuacutemeros si en una prueba la probabilidad de un acontecimiento o suceso es
P y si eacuteste se repite una gran cantidad de veces la relacioacuten entre las veces que se produce el
suceso y la cantidad total de pruebas (es decir la frecuencia F del suceso) tiende a acercarse
cada vez maacutes a la probabilidad P
Caacutelculo de probabilidades La probabilidad de un hecho o suceso es la relacioacuten entre el nuacutemero
de casos favorables (p) a este hecho con la cantidad de casos posibles suponiendo que todos los
casos son igualmente posibles El meacutetodo de establecer la probabilidad es lo que se denomina
caacutelculo de probabilidad
De estas dos leyes fundamentales de la estadiacutestica se infieren aquellas que sirven de base maacutes
directamente al meacutetodo de muestreo
Ley de la regularidad estadiacutestica un conjunto de n unidades tomadas al azar de un conjunto N
es casi seguro que tenga las caracteriacutesticas del grupo maacutes grande
Ley de la inercia de los grandes nuacutemeros esta ley es contraria a la anterior Se refiere al hecho
de que en la mayoriacutea de los fenoacutemenos cuando una parte variacutea en una direccioacuten es probable
que una parte igual del mismo grupo variacutee en direccioacuten opuesta
Ley de la permanencia de los nuacutemeros pequentildeos si una muestra suficientemente grande es
representativa de la poblacioacuten una segunda muestra de igual magnitud deberaacute ser semejante a la
primera y si en la primera muestra se encuentran pocos individuos con caracteriacutesticas raras es
de esperar encontrar igual proporcioacuten en la segunda muestra
Inferencia Estadiacutestica
La Inferencia Estadiacutestica es la parte de la estadiacutestica matemaacutetica que se encarga del estudio de los
meacutetodos para la obtencioacuten del modelo de probabilidad (forma funcional y paraacutemetros que determinan
la funcioacuten de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten a traveacutes de
una muestra (parte de la poblacioacuten) obtenida de la misma
La inferencia estadiacutestica es el proceso a traveacutes del cual se extraen conclusiones relativas a una
poblacioacuten a partir de una muestra La expresioacuten inferencia se utiliza tambieacuten para designar su
resultado y la rama de la estadiacutestica que se ocupa de ella
Los estadiacutesticos son funciones de los valores observados en la muestra (ya se han visto algunos como
la media la desviacioacuten tiacutepica percentiles)
Por ser funciones de una variable aleatoria los estadiacutesticos son tambieacuten variables aleatorias y por lo
tanto a cada uno de ellos se le puede asociar una distribucioacuten de probabilidad llamada distribucioacuten
en el muestreo del estadiacutestico dado Es posible pasar de la Teoriacutea de la Probabilidad a la
Inferencia Estadiacutestica
En la mayor parte de las teacutecnicas que se describen aquiacute las inferencias (conclusiones) se refieren a
paraacutemetros poblacionales Sin embargo es posible realizar inferencias que no se relacionen con
paraacutemetros (ver anaacutelisis de frecuencias) Seguacuten la finalidad de la Inferencia Estadiacutestica se puede
dividir en
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
TEORIacuteA DE LA ESTIMACIOacuteN
Los dos problemas fundamentales que estudia la inferencia estadiacutestica son el Problema de la
estimacioacuten y el Problema del contraste de hipoacutetesis Cuando se conoce la forma funcional de la
funcioacuten de distribucioacuten que sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica parameacutetrica por el
contrario cuando no se conoce la forma funcional de la distribucioacuten que sigue la variable aleatoria
objeto de estudio estamos ante un problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica parameacutetrica donde la
variable aleatoria objeto de estudio sigue una distribucioacuten normal y soacutelo tendremos que tratar de
estimar los paraacutemetros que la determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional
de la distribucioacuten de probabilidad por consideraciones teoacutericas quedando uacutenicamente indeterminados
los paraacutemetros que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria son grandes
es muy caro o imposible estudiar a todos sus individuos lo que se hace es estudiar una muestra ( una
parte) de la poblacioacuten En todos estos problemas que estudia la inferencia estadiacutestica juega un papel
fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de las distribuciones de
probabilidad) y la Teoriacutea de Muestras (procedimientos para tomar muestras de manera apropiada)
TEORIacuteA DEL MUESTREO
La teoriacutea de muestreo frecuentemente es llamada teoriacutea de Nyquist o Shannon por los investigadores
del primer trabajo sobre el tema lo cual ocurrioacute en los antildeos cuarentaConceptualmente definida como
el estudio de las relaciones existentes entre una poblacioacuten y muestras extraiacutedas de la misma La teoriacutea
del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos
muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas
lo que nos lleva a los procesos denominados ensayos e hipoacutetesis de significacioacuten fundamental para
comprensioacuten de la teoriacutea de la decisioacuten en el aacuterea de la inferencia estadiacutestica Abarca el estudio de las
relaciones que existen entre una poblacioacuten y las muestras extraiacutedas de la misma Permite estimar los
paraacutemetros poblacionales (media varianza etc) a partir de los correspondientes valores muestrales
denominados estadiacutesticos La teoriacutea del muestreo tambieacuten permite determinar si las diferencias
observadas entre dos muestras son significativas o por el contrario debidas al azar lo que supone la
realizacioacuten de ensayos e hipoacutetesis de significacioacuten
Pues bien la teoriacutea del muestreo estudia las teacutecnicas y procedimientos que debemos emplear para que
las muestras sean representativas de la poblacioacuten que pretendemos estudiar de forma que los errores en
la determinacioacuten de los paraacutemetros de la poblacioacuten objeto de estudio sean miacutenimos Para conseguirlo
la muestra tiene que ser representativa de la poblacioacuten Para que la extraccioacuten de la muestra sea
representativa se deben cumplir dos principios baacutesicos
Que haya independencia en la seleccioacuten de los individuos que forman la muestra
Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra
El propoacutesito de un estudio estadiacutestico suele ser extraer conclusiones acerca de la naturaleza de una
poblacioacuten Al ser la poblacioacuten grande y no poder ser estudiada en su integridad en la mayoriacutea de los
casos las conclusiones obtenidas deben basarse en el examen de solamente una parte de eacutesta lo que
lleva en primer lugar a la justificacioacuten necesidad y definicioacuten de las diferentes teacutecnicas de muestreo
Los primeros teacuterminos obligados a los que se debe hacer referencia seraacuten los de estadiacutestico y
estimador
Dentro de este contexto seraacute necesario asumir un estadiacutestico o estimador como una variable aleatoria
con una determinada distribucioacuten y que seraacute la pieza clave en las dos amplias categoriacuteas de la
inferencia estadiacutestica la estimacioacuten y el contraste de hipoacutetesis
El concepto de estimador como herramienta fundamental se caracteriza mediante una serie de
propiedades que serviraacuten para elegir el ``mejor para un determinado paraacutemetro de una poblacioacuten asiacute
como algunos meacutetodos para la obtencioacuten de ellos tanto en la estimacioacuten puntual como por intervalos
iquestCoacutemo deducir la ley de probabilidad sobre determinado caraacutecter de una poblacioacuten cuando soacutelo se
conoce una muestra
Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacioacuten entre el
fumar y el caacutencer de pulmoacuten y se intenta extender las conclusiones obtenidas sobre una muestra al
resto de individuos de la poblacioacuten
La tarea fundamental de la estadiacutestica inferencial es hacer inferencias acerca de la poblacioacuten a partir
de una muestra extraiacuteda de la misma
Las teacutecnicas estadiacutesticas para ser utilizados requieren datos cuya adquisicioacuten es un compromiso difiacutecil
La teoriacutea de muestras o muestreo tiene por objeto proporcionar una metodologiacutea que guiacutee los
problemas de recogida de datos es decir coacutemo se hace para recoger esos datos Por lo tanto El
muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica es determinar que parte
de una realidad en estudio (poblacioacuten o universo) debe examinarse con la finalidad de hacer inferencias
sobre dicha poblacioacuten El error que se comete debido a hecho de que se obtienen conclusiones sobre
cierta realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error de muestreo
Obtener una muestra adecuada significa lograr una versioacuten simplificada de la poblacioacuten que
reproduzca de alguacuten modo sus rasgos baacutesicos
En el muestreo se utilizan por lo general las siguientes Terminologiacuteas
UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan
caracteriacutesticas comunes entre si
POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de
las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una
poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el
universo
MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya
seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o
elementos de anaacutelisis sacados del marco
UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que
mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las
partes que se van a analizar
UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la
informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que
obtener la informacioacuten
UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la
informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente
UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y
que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los
conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras
palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo
miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo
MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)
representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este
muestre puede ser No Probabiliacutestico y Probabiliacutestico
MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan
las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco
muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades
muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a
distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas
por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos
Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten
Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten
de los paraacutemetros
Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro
correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al
valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten
basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo
Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida
podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean
muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en
cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten
muestral de un estadiacutestico y su fiabilidad
Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier
informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)
asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un
estadiacutestico capte el verdadero valor del paraacutemetro
Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de
entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes
pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos
SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos
grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un
mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la
significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es
necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de
frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc
Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos
que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica
Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por
lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un
evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe
al azar sino a factores especiacuteficos
De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar
estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no
puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten
El disentildeo de muestras tiene dos procesos fundamentales
Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la
muestra
Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de
la muestra
El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es
maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de
encuestados
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores
1- Volumen de trabajo reducido
2- Puede existir mayor supervisioacuten en el trabajo
3- Se puede dar maacutes entrenamiento al personal
4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
Tipos de muestreo
Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo
aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y
meacutetodos de muestreo no probabiliacutesticas
Meacutetodos de muestreo probabiliacutesticas
Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad
El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y
dicha probabilidad no es nula para ninguacuten elemento
Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la
misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los
meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos
PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la
aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1 M2 y asiacute sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser
seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles
muestras Mi
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de
un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras
caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las
que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por
ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa
estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una
variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los
meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple
aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico
Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una
poblacioacuten de tamantildeo N
Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa
por las siguientes razones
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Inferencia Estadiacutestica
La Inferencia Estadiacutestica es la parte de la estadiacutestica matemaacutetica que se encarga del estudio de los
meacutetodos para la obtencioacuten del modelo de probabilidad (forma funcional y paraacutemetros que determinan
la funcioacuten de distribucioacuten) que sigue una variable aleatoria de una determinada poblacioacuten a traveacutes de
una muestra (parte de la poblacioacuten) obtenida de la misma
La inferencia estadiacutestica es el proceso a traveacutes del cual se extraen conclusiones relativas a una
poblacioacuten a partir de una muestra La expresioacuten inferencia se utiliza tambieacuten para designar su
resultado y la rama de la estadiacutestica que se ocupa de ella
Los estadiacutesticos son funciones de los valores observados en la muestra (ya se han visto algunos como
la media la desviacioacuten tiacutepica percentiles)
Por ser funciones de una variable aleatoria los estadiacutesticos son tambieacuten variables aleatorias y por lo
tanto a cada uno de ellos se le puede asociar una distribucioacuten de probabilidad llamada distribucioacuten
en el muestreo del estadiacutestico dado Es posible pasar de la Teoriacutea de la Probabilidad a la
Inferencia Estadiacutestica
En la mayor parte de las teacutecnicas que se describen aquiacute las inferencias (conclusiones) se refieren a
paraacutemetros poblacionales Sin embargo es posible realizar inferencias que no se relacionen con
paraacutemetros (ver anaacutelisis de frecuencias) Seguacuten la finalidad de la Inferencia Estadiacutestica se puede
dividir en
TEORIacuteA DE LA VERIFICACIOacuteN DE HIPOacuteTESIS
TEORIacuteA DE LA ESTIMACIOacuteN
Los dos problemas fundamentales que estudia la inferencia estadiacutestica son el Problema de la
estimacioacuten y el Problema del contraste de hipoacutetesis Cuando se conoce la forma funcional de la
funcioacuten de distribucioacuten que sigue la variable aleatoria objeto de estudio y soacutelo tenemos que estimar los
paraacutemetros que la determinan estamos en un problema de inferencia estadiacutestica parameacutetrica por el
contrario cuando no se conoce la forma funcional de la distribucioacuten que sigue la variable aleatoria
objeto de estudio estamos ante un problema de inferencia estadiacutestica no parameacutetrica
En lo que sigue nos vamos a limitar a problemas de inferencia estadiacutestica parameacutetrica donde la
variable aleatoria objeto de estudio sigue una distribucioacuten normal y soacutelo tendremos que tratar de
estimar los paraacutemetros que la determinan la media y la desviacioacuten tiacutepica
Esta situacioacuten se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional
de la distribucioacuten de probabilidad por consideraciones teoacutericas quedando uacutenicamente indeterminados
los paraacutemetros que determinan la funcioacuten de distribucioacuten
Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria son grandes
es muy caro o imposible estudiar a todos sus individuos lo que se hace es estudiar una muestra ( una
parte) de la poblacioacuten En todos estos problemas que estudia la inferencia estadiacutestica juega un papel
fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de las distribuciones de
probabilidad) y la Teoriacutea de Muestras (procedimientos para tomar muestras de manera apropiada)
TEORIacuteA DEL MUESTREO
La teoriacutea de muestreo frecuentemente es llamada teoriacutea de Nyquist o Shannon por los investigadores
del primer trabajo sobre el tema lo cual ocurrioacute en los antildeos cuarentaConceptualmente definida como
el estudio de las relaciones existentes entre una poblacioacuten y muestras extraiacutedas de la misma La teoriacutea
del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos
muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas
lo que nos lleva a los procesos denominados ensayos e hipoacutetesis de significacioacuten fundamental para
comprensioacuten de la teoriacutea de la decisioacuten en el aacuterea de la inferencia estadiacutestica Abarca el estudio de las
relaciones que existen entre una poblacioacuten y las muestras extraiacutedas de la misma Permite estimar los
paraacutemetros poblacionales (media varianza etc) a partir de los correspondientes valores muestrales
denominados estadiacutesticos La teoriacutea del muestreo tambieacuten permite determinar si las diferencias
observadas entre dos muestras son significativas o por el contrario debidas al azar lo que supone la
realizacioacuten de ensayos e hipoacutetesis de significacioacuten
Pues bien la teoriacutea del muestreo estudia las teacutecnicas y procedimientos que debemos emplear para que
las muestras sean representativas de la poblacioacuten que pretendemos estudiar de forma que los errores en
la determinacioacuten de los paraacutemetros de la poblacioacuten objeto de estudio sean miacutenimos Para conseguirlo
la muestra tiene que ser representativa de la poblacioacuten Para que la extraccioacuten de la muestra sea
representativa se deben cumplir dos principios baacutesicos
Que haya independencia en la seleccioacuten de los individuos que forman la muestra
Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra
El propoacutesito de un estudio estadiacutestico suele ser extraer conclusiones acerca de la naturaleza de una
poblacioacuten Al ser la poblacioacuten grande y no poder ser estudiada en su integridad en la mayoriacutea de los
casos las conclusiones obtenidas deben basarse en el examen de solamente una parte de eacutesta lo que
lleva en primer lugar a la justificacioacuten necesidad y definicioacuten de las diferentes teacutecnicas de muestreo
Los primeros teacuterminos obligados a los que se debe hacer referencia seraacuten los de estadiacutestico y
estimador
Dentro de este contexto seraacute necesario asumir un estadiacutestico o estimador como una variable aleatoria
con una determinada distribucioacuten y que seraacute la pieza clave en las dos amplias categoriacuteas de la
inferencia estadiacutestica la estimacioacuten y el contraste de hipoacutetesis
El concepto de estimador como herramienta fundamental se caracteriza mediante una serie de
propiedades que serviraacuten para elegir el ``mejor para un determinado paraacutemetro de una poblacioacuten asiacute
como algunos meacutetodos para la obtencioacuten de ellos tanto en la estimacioacuten puntual como por intervalos
iquestCoacutemo deducir la ley de probabilidad sobre determinado caraacutecter de una poblacioacuten cuando soacutelo se
conoce una muestra
Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacioacuten entre el
fumar y el caacutencer de pulmoacuten y se intenta extender las conclusiones obtenidas sobre una muestra al
resto de individuos de la poblacioacuten
La tarea fundamental de la estadiacutestica inferencial es hacer inferencias acerca de la poblacioacuten a partir
de una muestra extraiacuteda de la misma
Las teacutecnicas estadiacutesticas para ser utilizados requieren datos cuya adquisicioacuten es un compromiso difiacutecil
La teoriacutea de muestras o muestreo tiene por objeto proporcionar una metodologiacutea que guiacutee los
problemas de recogida de datos es decir coacutemo se hace para recoger esos datos Por lo tanto El
muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica es determinar que parte
de una realidad en estudio (poblacioacuten o universo) debe examinarse con la finalidad de hacer inferencias
sobre dicha poblacioacuten El error que se comete debido a hecho de que se obtienen conclusiones sobre
cierta realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error de muestreo
Obtener una muestra adecuada significa lograr una versioacuten simplificada de la poblacioacuten que
reproduzca de alguacuten modo sus rasgos baacutesicos
En el muestreo se utilizan por lo general las siguientes Terminologiacuteas
UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan
caracteriacutesticas comunes entre si
POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de
las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una
poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el
universo
MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya
seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o
elementos de anaacutelisis sacados del marco
UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que
mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las
partes que se van a analizar
UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la
informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que
obtener la informacioacuten
UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la
informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente
UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y
que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los
conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras
palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo
miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo
MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)
representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este
muestre puede ser No Probabiliacutestico y Probabiliacutestico
MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan
las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco
muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades
muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a
distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas
por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos
Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten
Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten
de los paraacutemetros
Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro
correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al
valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten
basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo
Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida
podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean
muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en
cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten
muestral de un estadiacutestico y su fiabilidad
Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier
informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)
asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un
estadiacutestico capte el verdadero valor del paraacutemetro
Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de
entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes
pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos
SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos
grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un
mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la
significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es
necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de
frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc
Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos
que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica
Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por
lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un
evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe
al azar sino a factores especiacuteficos
De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar
estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no
puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten
El disentildeo de muestras tiene dos procesos fundamentales
Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la
muestra
Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de
la muestra
El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es
maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de
encuestados
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores
1- Volumen de trabajo reducido
2- Puede existir mayor supervisioacuten en el trabajo
3- Se puede dar maacutes entrenamiento al personal
4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
Tipos de muestreo
Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo
aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y
meacutetodos de muestreo no probabiliacutesticas
Meacutetodos de muestreo probabiliacutesticas
Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad
El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y
dicha probabilidad no es nula para ninguacuten elemento
Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la
misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los
meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos
PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la
aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1 M2 y asiacute sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser
seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles
muestras Mi
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de
un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras
caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las
que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por
ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa
estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una
variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los
meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple
aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico
Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una
poblacioacuten de tamantildeo N
Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa
por las siguientes razones
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
fundamental la Teoriacutea de la Probabilidad (distintas formas funcionales de las distribuciones de
probabilidad) y la Teoriacutea de Muestras (procedimientos para tomar muestras de manera apropiada)
TEORIacuteA DEL MUESTREO
La teoriacutea de muestreo frecuentemente es llamada teoriacutea de Nyquist o Shannon por los investigadores
del primer trabajo sobre el tema lo cual ocurrioacute en los antildeos cuarentaConceptualmente definida como
el estudio de las relaciones existentes entre una poblacioacuten y muestras extraiacutedas de la misma La teoriacutea
del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos
muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas
lo que nos lleva a los procesos denominados ensayos e hipoacutetesis de significacioacuten fundamental para
comprensioacuten de la teoriacutea de la decisioacuten en el aacuterea de la inferencia estadiacutestica Abarca el estudio de las
relaciones que existen entre una poblacioacuten y las muestras extraiacutedas de la misma Permite estimar los
paraacutemetros poblacionales (media varianza etc) a partir de los correspondientes valores muestrales
denominados estadiacutesticos La teoriacutea del muestreo tambieacuten permite determinar si las diferencias
observadas entre dos muestras son significativas o por el contrario debidas al azar lo que supone la
realizacioacuten de ensayos e hipoacutetesis de significacioacuten
Pues bien la teoriacutea del muestreo estudia las teacutecnicas y procedimientos que debemos emplear para que
las muestras sean representativas de la poblacioacuten que pretendemos estudiar de forma que los errores en
la determinacioacuten de los paraacutemetros de la poblacioacuten objeto de estudio sean miacutenimos Para conseguirlo
la muestra tiene que ser representativa de la poblacioacuten Para que la extraccioacuten de la muestra sea
representativa se deben cumplir dos principios baacutesicos
Que haya independencia en la seleccioacuten de los individuos que forman la muestra
Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra
El propoacutesito de un estudio estadiacutestico suele ser extraer conclusiones acerca de la naturaleza de una
poblacioacuten Al ser la poblacioacuten grande y no poder ser estudiada en su integridad en la mayoriacutea de los
casos las conclusiones obtenidas deben basarse en el examen de solamente una parte de eacutesta lo que
lleva en primer lugar a la justificacioacuten necesidad y definicioacuten de las diferentes teacutecnicas de muestreo
Los primeros teacuterminos obligados a los que se debe hacer referencia seraacuten los de estadiacutestico y
estimador
Dentro de este contexto seraacute necesario asumir un estadiacutestico o estimador como una variable aleatoria
con una determinada distribucioacuten y que seraacute la pieza clave en las dos amplias categoriacuteas de la
inferencia estadiacutestica la estimacioacuten y el contraste de hipoacutetesis
El concepto de estimador como herramienta fundamental se caracteriza mediante una serie de
propiedades que serviraacuten para elegir el ``mejor para un determinado paraacutemetro de una poblacioacuten asiacute
como algunos meacutetodos para la obtencioacuten de ellos tanto en la estimacioacuten puntual como por intervalos
iquestCoacutemo deducir la ley de probabilidad sobre determinado caraacutecter de una poblacioacuten cuando soacutelo se
conoce una muestra
Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacioacuten entre el
fumar y el caacutencer de pulmoacuten y se intenta extender las conclusiones obtenidas sobre una muestra al
resto de individuos de la poblacioacuten
La tarea fundamental de la estadiacutestica inferencial es hacer inferencias acerca de la poblacioacuten a partir
de una muestra extraiacuteda de la misma
Las teacutecnicas estadiacutesticas para ser utilizados requieren datos cuya adquisicioacuten es un compromiso difiacutecil
La teoriacutea de muestras o muestreo tiene por objeto proporcionar una metodologiacutea que guiacutee los
problemas de recogida de datos es decir coacutemo se hace para recoger esos datos Por lo tanto El
muestreo es una herramienta de la investigacioacuten cientiacutefica Su funcioacuten baacutesica es determinar que parte
de una realidad en estudio (poblacioacuten o universo) debe examinarse con la finalidad de hacer inferencias
sobre dicha poblacioacuten El error que se comete debido a hecho de que se obtienen conclusiones sobre
cierta realidad a partir de la observacioacuten de soacutelo una parte de ella se denomina error de muestreo
Obtener una muestra adecuada significa lograr una versioacuten simplificada de la poblacioacuten que
reproduzca de alguacuten modo sus rasgos baacutesicos
En el muestreo se utilizan por lo general las siguientes Terminologiacuteas
UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan
caracteriacutesticas comunes entre si
POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de
las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una
poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el
universo
MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya
seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o
elementos de anaacutelisis sacados del marco
UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que
mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las
partes que se van a analizar
UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la
informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que
obtener la informacioacuten
UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la
informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente
UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y
que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los
conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras
palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo
miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo
MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)
representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este
muestre puede ser No Probabiliacutestico y Probabiliacutestico
MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan
las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco
muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades
muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a
distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas
por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos
Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten
Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten
de los paraacutemetros
Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro
correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al
valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten
basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo
Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida
podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean
muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en
cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten
muestral de un estadiacutestico y su fiabilidad
Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier
informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)
asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un
estadiacutestico capte el verdadero valor del paraacutemetro
Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de
entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes
pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos
SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos
grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un
mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la
significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es
necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de
frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc
Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos
que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica
Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por
lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un
evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe
al azar sino a factores especiacuteficos
De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar
estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no
puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten
El disentildeo de muestras tiene dos procesos fundamentales
Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la
muestra
Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de
la muestra
El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es
maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de
encuestados
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores
1- Volumen de trabajo reducido
2- Puede existir mayor supervisioacuten en el trabajo
3- Se puede dar maacutes entrenamiento al personal
4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
Tipos de muestreo
Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo
aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y
meacutetodos de muestreo no probabiliacutesticas
Meacutetodos de muestreo probabiliacutesticas
Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad
El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y
dicha probabilidad no es nula para ninguacuten elemento
Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la
misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los
meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos
PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la
aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1 M2 y asiacute sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser
seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles
muestras Mi
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de
un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras
caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las
que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por
ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa
estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una
variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los
meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple
aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico
Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una
poblacioacuten de tamantildeo N
Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa
por las siguientes razones
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
En el muestreo se utilizan por lo general las siguientes Terminologiacuteas
UNIVERSO Se define como un conjunto finito o infinito de elementos seres o cosas que presentan
caracteriacutesticas comunes entre si
POBLACIOacuteN Estaacute constituida por el conjunto de medidas de las variables en estudio en cada una de
las unidades que conforman el universo Es decir cada una de las variables en estudio constituye una
poblacioacuten que viene dada por el conjunto de valores que ella toma de la realidad que conforman el
universo
MUESTRA Es un subconjunto del universo o de la poblacioacuten dependiendo de que se haya
seleccionado a un grupo de elementos o a un grupo de mediciones Es el conjunto de unidades o
elementos de anaacutelisis sacados del marco
UNIDADES ESTADIacuteSTICAS O UNIDAD DE INVESTIGACIOacuteN Es la unidad miacutenima que
mantiene la integridad de los datos que interesan estudiar y analizar Es decir el ente que contiene las
partes que se van a analizar
UNIDAD DE ANAacuteLISIS Estaacute definida como el elemento que se examina y del que se busca la
informacioacuten dentro de la unidad de investigacioacuten Es por lo tanto el objeto o individuo del que hay que
obtener la informacioacuten
UNIDAD DE OBSERVACIOacuteN Se denomina a la unidad a traveacutes de la cual se obtiene la
informacioacuten esta puede o no coincidir con el elemento Tambieacuten se denomina unidad respondiente
UNIDADES DE MUESTREO Son aquellas que contienen las unidades de anaacutelisis de la poblacioacuten y
que se utilizaraacuten para confeccionar o seleccionar la muestra En general es la seleccioacuten de los
conjuntos que seraacuten tomados en cuenta para la conformar la muestra final en la investigacioacuten En otras
palabras es un nuacutemero de elementos de la poblacioacuten no reservados que se van a estudiar Todo
miembro de la poblacioacuten perteneceraacute a una y soacutelo una unidad de muestreo
MUESTREO Es la teacutecnica empleada para la seleccioacuten de elementos (unidades de investigacioacuten)
representativos de la calidad y condiciones medias de un todo que conformaraacuten una muestra Este
muestre puede ser No Probabiliacutestico y Probabiliacutestico
MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan
las inferencias estadiacutesticas en el muestreo probabiliacutestica Es importante la construccioacuten de un marco
muestral lo maacutes perfecto posible a fin de que exista una correspondencia biuniacutevoca entre las unidades
muestrales poblacionales y las listas fiacutesicas que lo conforman Entre los factores que contribuyen a
distorsionar la calidad de un buen marco muestral estaacuten a) Elementos faltantes b) Unidades ocultas
por estar pareadas con otras c) Unidades muestrales repetidas y d) Elementos extrantildeos
Paraacutemetro Son las medidas o datos que se obtienen sobre la poblacioacuten
Estadiacutestico Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacioacuten
de los paraacutemetros
Error Muestral de Estimacioacuten o Estaacutendar Es la diferencia entre un estadiacutestico y su paraacutemetro
correspondiente Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al
valor de la poblacioacuten nos da una nocioacuten clara de hasta doacutende y con queacute probabilidad una estimacioacuten
basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo
Siempre se comete un error pero la naturaleza de la investigacioacuten nos indicaraacute hasta queacute medida
podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que variacutean
muestra a muestra) Variacutea seguacuten se calcule al principio o al final Un estadiacutestico seraacute maacutes preciso en
cuanto y tanto su error es maacutes pequentildeo Podriacuteamos decir que es la desviacioacuten de la distribucioacuten
muestral de un estadiacutestico y su fiabilidad
Nivel de Confianza Probabilidad de que la estimacioacuten efectuada se ajuste a la realidad Cualquier
informacioacuten que queremos recoger estaacute distribuida seguacuten una ley de probabilidad (Gauss o Student)
asiacute llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un
estadiacutestico capte el verdadero valor del paraacutemetro
Varianza Poblacional Cuando una poblacioacuten es maacutes homogeacutenea la varianza es menor y el nuacutemero de
entrevistas necesarias para construir un modelo reducido del universo o de la poblacioacuten seraacute maacutes
pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos
SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos
grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un
mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la
significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es
necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de
frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc
Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos
que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica
Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por
lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un
evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe
al azar sino a factores especiacuteficos
De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar
estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no
puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten
El disentildeo de muestras tiene dos procesos fundamentales
Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la
muestra
Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de
la muestra
El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es
maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de
encuestados
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores
1- Volumen de trabajo reducido
2- Puede existir mayor supervisioacuten en el trabajo
3- Se puede dar maacutes entrenamiento al personal
4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
Tipos de muestreo
Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo
aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y
meacutetodos de muestreo no probabiliacutesticas
Meacutetodos de muestreo probabiliacutesticas
Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad
El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y
dicha probabilidad no es nula para ninguacuten elemento
Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la
misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los
meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos
PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la
aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1 M2 y asiacute sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser
seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles
muestras Mi
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de
un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras
caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las
que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por
ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa
estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una
variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los
meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple
aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico
Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una
poblacioacuten de tamantildeo N
Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa
por las siguientes razones
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
pequentildeo Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios
previos
SIGNIFICANCIA ESTADIacuteSTICA- Este concepto es una forma de expresar matemaacuteticamente si dos
grupos son o no diferentes dentro de una muestra o si dos variables tienen diferencias dentro de un
mismo grupo y esas diferencias no son debidas a factores aleatorios El meacutetodo utilizado para hallar la
significacioacuten estadiacutestica es un tipo especial de meacutetodo matemaacutetico que se llama anaacutelisis estadiacutestico Es
necesario crear una unidad de medida para lo cual se usa el valor de p al estudiar distribucioacuten de
frecuencias o el estudio de las colas de las distribuciones o el aacuterea bajo una determinada curva etc
Por lo tanto p es la probabilidad de error al comparar dos o maacutes muestras o grupos cuando aseguramos
que ambos son diferentes O sea que p es la probabilidad en el sentido de la significacioacuten estadiacutestica
Obtener una p lt 005 significa que tenemos un 5 de probabilidades de error en las conclusiones por
lo cual la probabilidad de equivocarnos es baja En otras palabras en la estadiacutestica se dice que un
evento suceso o valor es significativo cuando es poco probable y por lo tanto seguramente no se debe
al azar sino a factores especiacuteficos
De forma maacutes estricta significacioacuten estadiacutestica hace referencia a la cuestioacuten de determinar
estadiacutesticamente si un valor o resultado obtenido de una muestra es poco probable de modo que no
puede explicarse por las fluctuaciones propias de esa muestra en cuestioacuten
El disentildeo de muestras tiene dos procesos fundamentales
Proceso de seleccioacuten Reglas y operaciones mediante las cuales se incluyen algunas unidades de la
muestra
Proceso de estimacioacuten A partir de los datos seleccionados se estiman ciertos valores desconocidos de
la muestra
El uso de una encuesta por muestreo tiene una serie de ventajas como que su coste es mucho menor es
maacutes raacutepida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de
encuestados
VENTAJAS DEL MUESTREO
a) Costos reducidos
b) Mayor rapidez para obtener resultados
c) Mayor exactitud o mejor calidad de la informacioacuten debido a los siguientes factores
1- Volumen de trabajo reducido
2- Puede existir mayor supervisioacuten en el trabajo
3- Se puede dar maacutes entrenamiento al personal
4- Menor probabilidad de cometer errores durante el procesamiento de la informacioacuten
d) Factibilidad de hacer el estudio cuando la toma de datos implica teacutecnicas destructivas por ejemplo
- Pruebas de germinacioacuten
- Anaacutelisis de sangre
- Control de calidad
Tipos de muestreo
Los investigadores proponen diversos criterios de clasificacioacuten para los diferentes tipos de muestreo
aunque en general pueden dividirse en dos grandes grupos meacutetodos de muestreo probabiliacutesticas y
meacutetodos de muestreo no probabiliacutesticas
Meacutetodos de muestreo probabiliacutesticas
Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad
El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y
dicha probabilidad no es nula para ninguacuten elemento
Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la
misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los
meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos
PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la
aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1 M2 y asiacute sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser
seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles
muestras Mi
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de
un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras
caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las
que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por
ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa
estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una
variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los
meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple
aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico
Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una
poblacioacuten de tamantildeo N
Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa
por las siguientes razones
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Los meacutetodos de muestreo probabiliacutesticos son aquellos que se basan en el principio de equiprobabilidad
El meacutetodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacioacuten y
dicha probabilidad no es nula para ninguacuten elemento
Es decir aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y consiguientemente todas las posibles muestras de tamantildeo n tienen la
misma probabilidad de ser elegidas Soacutelo estos meacutetodos de muestreo probabiliacutesticos nos aseguran la
representatividad de la muestra extraiacuteda y son por tanto los maacutes recomendables Dentro de los
meacutetodos de muestreo probabiliacutesticos encontramos los siguientes tipos
PROPIEDADES DEL MUESTREO PROBABILIacuteSTICO
a) Existe la posibilidad de definir inequiacutevocamente un conjunto de muestras M1 M2 Mt mediante la
aplicacioacuten del procedimiento a una poblacioacuten Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1 M2 y asiacute sucesivamente
b) A cada posible muestra Mi se le asigna un probabilidad conocida de seleccioacuten Pi
c) Seleccionamos una de las Mi por un proceso mediante el cual cada Mi tiene una probabilidad Pi de ser
seleccionada
d) El meacutetodo de estimacioacuten se realiza en base a la muestra siendo uacutenico para cualquiera de las posibles
muestras Mi
PRINCIPALES ETAPAS DE UN ESTUDIO POR MUESTREO
Definicioacuten de objetivos Esta etapa comprende la identificacioacuten del problema y el establecimiento de las
metas del estudio
Definicioacuten del marco de muestreo El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacioacuten Este generalmente puede ser de dos tipos
a) Marco lista Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo Por ejemplo una lista que contenga el nombre de todos los proveedores de cantildea de azuacutecar de
un ingenio Es recomendable que ademaacutes de identificar a cada unidad muestral incluya algunas otras
caracteriacutesticas de intereacutes por ejemplo tamantildeo de la finca de cada proveedor
b) Es un plano o mapa que permite identificar pequentildeas aacutereas usadas como unidades de muestreo en las
que se ha dividido el aacuterea total
Variables a medir y Meacutetodos de medicioacuten Es importante considerar el tipo de variable a medir por
ejemplo si se va a estudiar el rendimiento de cantildea de azuacutecar la variable es de tipo continuo si interesa
estimar la proporcioacuten de agricultores que utilizan herbicidas para el control de malezas se mediraacute una
variable de tipo binomial El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo Los
meacutetodos de medicioacuten deben de tener las siguientes caracteriacutesticas
a) uniformidad
b) practicabilidad
c) deber ser comprensibles para el grupo de trabajo
Tipo o Esquema de Muestreo Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones entre los maacutes usados estaacuten muestreo simple
aleatorio muestreo aleatorio estratificado muestreo sistemaacutetico
Determinacioacuten del tamantildeo de muestra (n) Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado
Seleccioacuten de las unidades de muestreo Consiste en extraer un nuacutemero n de unidades muestrales de una
poblacioacuten de tamantildeo N
Premuestreo y pruebas de campo En un estudio es conveniente someter el meacutetodo a un prueba previa
por las siguientes razones
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
a) Algunas veces es imprescindible realizar un Premuestreo para tener una estimacioacuten preliminar de la
variabilidad de la poblacioacuten
b) Verificar la funcionalidad de un meacutetodo de muestreo
c) Estimar costos
d) Conocer la eficiencia de la organizacioacuten del trabajo de campo
e) Captar la aceptacioacuten rechazo o dificultad para obtener la informacioacuten
Organizacioacuten del trabajo de campo Incluye la capacitacioacuten de personal y todas las operaciones
necesarias para obtener la informacioacuten buscada
Anaacutelisis y Edicioacuten de resultados Puede consistir soacutelo en la presentacioacuten e interpretacioacuten de
distribuciones simples tabulaciones graacuteficas o puede considerar un anaacutelisis estadiacutestico maacutes complejo
(Estimacioacuten pruebas de hipoacutetesis etc) esto depende baacutesicamente de los objetivos del trabajo
Muestreo aleatorio simple (es el maacutes importante) cada elemento de la poblacioacuten tiene la
misma probabilidad de ser elegido las observaciones se realizan con reemplazamiento de manera que
la poblacioacuten es ideacutentica en todas las extracciones o sea que la seleccioacuten de un individuo no debe
afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que alguacuten
individuo pueda ser elegido maacutes de una vez ( se hacen tantas papeletas numeradas como individuos
hay se coge una y se devuelve se vuelve a coger otra y se devuelve etc ) En el muestreo
sistemaacutetico los elementos de la poblacioacuten estaacuten ordenados por listas Se elige un individuo al azar y a
continuacioacuten a intervalos constantes se eligen todos los demaacutes hasta completar la muestra Si el orden
de los elementos es tal que los individuos proacuteximos tienden a ser maacutes semejantes que los alejados el
muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio simple al cubrir maacutes homogeacuteneamente
toda la poblacioacuten
El procedimiento empleado es el siguiente 1) se asigna un nuacutemero a cada individuo de la poblacioacuten y
2) a traveacutes de alguacuten medio mecaacutenico (bolas dentro de una bolsa tablas de nuacutemeros aleatorios nuacutemeros
aleatorios generados con una calculadora u ordenador etc) se eligen tantos sujetos como sea necesario
para completar el tamantildeo de muestra requerido
Este procedimiento atractivo por su simpleza tiene poca o nula utilidad praacutectica cuando la poblacioacuten
que estamos manejando es muy grande
COMO SE SELECCIONA UNA MUESTRA ALEATORIO
El procedimiento o sistema utilizado para la seleccioacuten de las unidades de la muestra reviste vital
importancia ya que de dicha meacutetodo depende baacutesica y fundamentalmente el caraacutecter representativo de
la misma y la validez de la induccioacuten estadiacutestica
Si el meacutetodo de seleccioacuten no esta suficientemente ajustado a la condicioacuten casual de las unidades la
muestra estariacutea expuesta a una inclinacioacuten viciada perjuicio o preferencia que desvirtuariacutea sus
resultados
En la seleccioacuten no pueden intervenir fuerzas especiales que efectuacuteen la Composicioacuten de la muestra
ya que la extraccioacuten de las unidades deben ser resultado de una combinacioacuten de factores
entremezclados y exentos de propensioacuten es decir que la seleccioacuten antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar Es necesario recalcar que la seleccioacuten
final de los elementos de la muestra habraacute de estar basada en un meacutetodo de azar sea cual fuere el tipo
de muestreo probabiliacutestica que se piensa utilizar
En relacioacuten con la pregunta coacutemo tomamos una muestra aleatoria en la praacutectica por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles En cambio
podemos citar los N elementos individuales de una poblacioacuten finita y despueacutes tomar una muestra
aleatoria mediante la seleccioacuten de los elementos que se incluiraacuten en la muestra uno a la vez sin
sustitucioacuten aseguraacutendonos que en cada una de las elecciones sucesivas cada uno de los elementos
restantes de la poblacioacuten tenga la misma oportunidad de ser seleccionado Esto nos conduce a la misma
probabilidad de cada muestra posible Por ejemplo para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo se pudiese escribir cada nuacutemero de cuenta en un
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
pedazo de papel colocar los papeles en una caja y mezclarlos vigorosamente luego tomariacuteamos (sin
ver) 20 papeles uno tras otro sin sustitucioacuten
En la praacutectica a menudo este procedimiento relativamente simple resulta innecesario ya que la
manera maacutes simple de tomar una muestra aleatoria consiste en utilizar una tabla de cifras aleatorias (o
nuacutemeros aleatorios) Las tablas publicadas de nuacutemeros aleatorios constan de paginas en las cuales se
colocan los nuacutemeros 0 1 2 helliphellipy 9 casi de la misma manera en que podriacutean figurar si hubiesen
sido generadas por un dispositivo o juego de oportunidad que deacute a cada cifra la misma probabilidad de
figurar en cualquier sitio dado de la tabla Hoy en diacutea estas tablas se elaboran mediante uso de
computadoras
Existen diferentes meacutetodos de seleccioacuten al azar de uso frecuente entre 1os que se pueden considerar
los siguientes
a) Seleccioacuten por sorteo
b) Uso de tablas de nuacutemeros aleatorios
a)- Seleccioacuten por Sorteo
Bajo este meacutetodo se enumera correlativamente la totalidad del universo y se procede maacutes o menos
similarmente a como se realiza un sorteo de loteriacutea preparaacutendose bolitas o similares que representan el
universo y que son introducidas en una bolsa bombo globo etc las cuales deben
ser mezcladas y extraiacutedas al azar tal como se efectuacutea un sorteo cualquiera Los numeras extraiacutedos en
esa forma se confrontan con las unidades cuyos nuacutemeros concuerdan en la lista previamente
elaborada constituyendo los elementos de la muestra
b)- Uso de la Tabla de Nuacutemeros Aleatorios
El objeto de las tablas de nuacutemeros aleatorios es facilitar la obtencioacuten de los elementos que han de
constituir la muestra sin tener que usar bombos cajas para bolas u otros utensilios maacutes o menos
complicados pero consiguiendo que el procedimiento de seleccioacuten no esteacute influenciado por la
caracteriacutestica en estudio
Las tablas de numeras al azar son tablas con miles de nuacutemeros obtenidos por un procedimiento como
el de la loteriacutea es decir por un procedimiento al azar La tabla puede empezarse a leer en cualquier
parte pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura
Un Ejemplo de una tabla aleatoria es la presentada en el cuadro Ndeg 1
El procedimiento para seleccionar una muestra al azar de tamantildeo ldquonrdquo de una poblacioacuten de ldquoNrdquo
elementos ( n lt N) es el siguiente
1)- Se obtiene un listado de todos los ldquoNrdquo elementos (unidades de muestreo) que componen a la
poblacioacuten
2)- Se numeran todos los elementos de la poblacioacuten del 1 al N
3)- En una tabla de nuacutemeros aleatorios se elige al azar una columna (o fila) comenzando en cualquier
lugar Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras
4)- Una vez elegida la columna se procede a seleccionar los nuacutemeros que esteacuten comprendidos entre 1
y N Desechando aquellos que esteacuten fuera de este intervalo y los nuacutemeros que aparezcan repetidos se
consideran soacutelo una vez
OBSERVACIONES Si el tamantildeo de la poblacioacuten es un nuacutemero de un digito como por ejemplo
N = 8 la numeracioacuten seria asiacute 1 2 3 4 5 6 7 8 Si fueran de dos diacutegitos como por ejemplo N = 20
la numeracioacuten seriacutea 01 02 03 04 helliphellip19 20 Si la muestra fuese de N = 250 es decir de tres diacutegitos
la numeracioacuten seriacutea 001 002 003 004hellip012hellip099 100helliphellip250 y asiacute sucesivamente se procede
con los diferentes caso que se presenten
EJEMPLO Supongamos que tenemos una poblacioacuten hipoteacutetica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos mediante el uso de una tabla de nuacutemeros aleatorios
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Para realizar este problema se siguen los pasos dados anteriormente1)- Obtencioacuten del listado de los
individuo de la poblacioacuten Los nombres de los electos son
Juan Rojas
Luis Mata
Pedro Rodriacuteguez
Miguel Juaacuterez
Nicolaacutes Mata
Juan Mariacuten
Joseacute Mota
Maria Pentildea
Carlos Mata
Ligia Larez
Rauacutel Ron
Magdalys Mediacuteas
2)- Se enumeran los elementos de la poblacioacuten asiacute
01- Juan Rojas
02- Luis Mata
03- Pedro Rodriacuteguez
04- Miguel Juaacuterez
05- Nicolaacutes Mata
06- Juan Mariacuten
07- Joseacute Mota
08- Maria Pentildea
09- Carlos Mata
10- Ligia Larez
11- Rauacutel Ron
12- Magdalys Mediacuteas
Aplicando la tabla Ndeg 1 de nuacutemeros aleatorios se seleccionan las n = 4 personas Elegimos por
ejemplo la primera y segunda columna (aquiacute se tienen que tomarse dos columnas ya que la numeracioacuten
de los elementos estaacute hecha con dos diacutegitos) y comenzando en la primera fila se tiene que las personas
seleccionadas son las siguientes
04- Miguel Juaacuterez
02- Luis Mata
03- Pedro Rodriacuteguez
12- Magdalys Mejias
Si sucediera que el nuacutemero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas se continuacutea con las dos siguientes columnas hasta completar el tamantildeo de la muestra
requerida
TABLA Ndeg 1 DE NUacuteMEROS ALEATORIOS
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
04433 80674 24520 18222 l0610 05794 37515
60298 47829 72648 37414 75755 04717 29899
67884 5965l 67533 68123 17730 95862 08034
32653 01895 12506 88535 36553 23757 34209
95913 15405 13772 76638 48423 25018 99041
55864 21694 13122 44115 01601 50541 00147
35334 49810 91601 40617 72876 33967 73830
57729 32196 76487 11622 96297 24160 09903
86648 13697 63677 70119 94739 25875 38829
30574 47609 07967 32422 76791 39725 53711
8l307 43694 83580 79974 45929 85113 26872
02410 54905 79007 54939 21410 86980 91772
18969 75274 52233 62319 08598 09066 95288
87863 82384 66860 62297 80198 19347 73234
68397 7l708 15438 62311 72844 60203 46412
28529 54447 58729 10854 99058 l8260 38765
44285 06372 l5867 70418 57012 72122 36634
86299 83430 33571 23309 57040 29285 67870
84842 68668 90894 61658 15001 94055 36308
56970 83609 52098 04184 54967 72938 56834
83125 71257 60490 44369 66130 72936 69848
55503 52423 02464 26141 68779 66388 75242
47019 76273 33203 29608 54553 25971 69573
84828 32592 79526 29554 84580 37859 28504
68921 08141 79227 05748 51276 57143 31926
36458 96045 30424 98420 72925 40729 22337
95752 59445 36847 87729 81679 59126 59437
26768 47323 58454 56958 20575 76746 49878
42613 37056 43636 58085 06766 60227 96414
95457 30566 65482 25596 02678 54592 63607
95276 17894 63564 95958 39150 64379 46059
66954 52324 64776 92345 95110 59448 77249
17457 18481 14113 62462 02798 54977 48349
03704 36872 83214 59337 01695 60666 97410
21538 86497 33210 60337 27976 70661 08250
57178 67619 98310 70348 11317 71623 55510
31048 97558 94953 55866 96283 46620 52087
69799 55380 16498 80733 96422 58078 99643
90595 61867 59231 17772 67831 33317 00520
33570 04981 98939 78784 09977 29398 93896
15340 93460 57477 13898 48431 72936 78160
64079 42483 36512 56186 99098 48850 72521
63491 05546 67118 62063 74958 20946 28147
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
92003 63868 41034 28260 79708 00770 88643
52360 46658 66511 04172 73085 11795 52594
74622 12142 68355 65635 21828 39539 18988
04157 50079 61343 64315 70836 82857 35335
86003 60070 66241 32836 27573 11479 94114
41268 80187 20351 09636 84668 42486 71303
Fuente Basada en partes de Table of 105 000 Random Decimal Digits (Washingtonp9 1nterstate Coacuternmerce Commission Bureau oacutef Transport
Economici anll Statistic
TAMANtildeO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE
ALEATORIO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacioacuten
22
22
22
2
ZSdN
ZSNn
de donde
n = tamantildeo de la muestra
N = tamantildeo de la poblacioacuten
2Z = variable estandarizada de distribucioacuten normal
Ssup2 = varianza de la muestra
d(e) = precisioacuten del muestreo
= Nivel de significancia
Generalmente es necesario hacer un premuestreo de 30 elementos con el objetivo de hacer una primera
estimacioacuten de Ssup2
Ejemplo En un lote de frascos para medicina con una poblacioacuten de 8000 unidades se desea estimar la
media de la capacidad en centiacutemetros cuacutebicos de los mismos
A traveacutes de un premuestreo de tamantildeo 35 se ha estimado que la desviacioacuten estaacutendar es de 2 centiacutemetros
cuacutebicos Si queremos tener una precisioacuten 025 cms3 y un nivel de significancia del 5 iquestDe que tamantildeo
debe de ser la muestra
DATOS
S = 2 cms3 N = 8000 d = 025 cms
3 = 005 (5)
2Z = 196
23937515
2122931
96122508000
96128000222
22
22
2
22
2
)()()(
)()(
ZSNd
ZSNn Frascos
Solo faltariacutea muestrear 204 frascos pues los datos de los 35 frascos del premuestreo siguen siendo vaacutelidos
TAMANtildeO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE
ALEATORIO
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
En bastantes ocasiones la variable bajo estudio es de tipo binomial en ese caso para calcular el tamantildeo de
muestra bajo el muestreo simple aleatorio se hariacutea de la siguiente manera
2
22
22
ZqpdN
ZqpNn
De donde
p = probabilidad de eacutexito
q = probabilidad de fracaso
d = precisioacuten expresada en porcentaje
En este caso para la estimacioacuten de la varianza tenemos dos opciones
a) hacer un premuestreo
b) asumir varianza maacutexima
Ejemplo En una investigacioacuten se desea determinar en que proporcioacuten los nintildeos de una regioacuten toman
leche en el desayuno Si se sabe que existen 1500 nintildeos y deseamos tener una precisioacuten del 10 con un
nivel de significancia del 5 iquestDe que tamantildeo debe de ser la muestra
DATOS
N = 1500 d = 10 = 01 α = 5
p = 05 y q = 05 (asumiendo varianza maacutexima)
Zα2 = 196
909615
61440
9615050101500
9615050150022
2
22
2
22
)))(()(
))()((
ZqpdN
ZqpNn
Se deben de muestrear 90 nintildeos
Muestreo aleatorio sistemaacutetico es cuando los elementos de la poblacioacuten estaacuten ordenados por
listas Se elige un individuo al azar y a continuacioacuten a intervalos constantes se eligen todos los demaacutes
hasta completar la muestra Si el orden de los elementos es tal que los individuos proacuteximos tienden a
ser maacutes semejantes que los alejados el muestreo sistemaacutetico tiende a ser maacutes preciso que el aleatorio
simple al cubrir maacutes homogeacuteneamente toda la poblacioacuten
Este procedimiento exige como el anterior numerar todos los elementos de la poblacioacuten pero en lugar
de extraer n nuacutemeros aleatorios soacutelo se extrae uno Se parte de ese nuacutemero aleatorio i que es un
nuacutemero elegido al azar y los elementos que integran la muestra son los que ocupan los lugares i i + k
i + 2k i + 3ki + (n-1) k es decir se toman los individuos de k en k siendo k el resultado de dividir el
tamantildeo de la poblacioacuten entre el tamantildeo de la muestra k = Nn El nuacutemero i que empleamos como
punto de partida seraacute un nuacutemero al azar entre 1 y k
El riesgo se este tipo de muestreo estaacute en los casos en que se dan periodicidades en la poblacioacuten ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacioacuten Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 uacuteltimos mujeres si empleamos un
muestreo aleatorio sistemaacutetico con k =10 siempre seleccionariacuteamos o soacutelo hombres o soacutelo mujeres no
podriacutea haber una representacioacuten de los dos sexos
Muestreo aleatorio estratificado es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicioacuten a la de la poblacioacuten la cual se divide en clases o estratos Si por
ejemplo en la poblacioacuten el 20 son mujeres y el 80 hombres se mantendraacute la misma proporcioacuten en
la muestra Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamantildeo dado de la muestra Consiste en considerar categoriacuteas
tiacutepicas diferentes entre siacute (estratos) que poseen gran homogeneidad respecto a alguna caracteriacutestica (se
puede estratificar por ejemplo seguacuten la profesioacuten el municipio de residencia el sexo el estado civil
etc) Una muestra aleatoria estratificada es la obtenida mediante la separacioacuten de los elementos de la
poblacioacuten en grupos que no se oculten maliciosamente (traslapen) llamados estratos y la seleccioacuten
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
posterior de una muestra irrestrictamente aleatoria simple en cada estrato En resumen los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes
a) La estratificacioacuten puede producir un error de estimacioacuten maacutes pequentildeo que el que generariacutea una muestras
del mismo tamantildeo Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogeacuteneas
b) El costo por observacioacuten en la encuesta puede ser reducido mediante la estratificacioacuten de los elementos
de la poblacioacuten en grupos convenientes
c) Se pueden obtener estimaciones de paraacutemetros poblacionales para subgrupos de la poblacioacuten Los
subgrupos deben de ser entonces estratos identificables
Lo anterior debe de tomarse en cuenta cuando se estaacute planeando estratificar o no una poblacioacuten o
decidiendo en que forma se definiraacuten los estratos
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de intereacutes estaraacuten
representados adecuadamente en la muestra Cada estrato funciona independientemente pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formaraacuten parte de la muestra En ocasiones las dificultades que plantean son demasiado
grandes pues exige un conocimiento detallado de la poblacioacuten (tamantildeo geograacutefico sexos edades)
La distribucioacuten de la muestra en funcioacuten de los diferentes estratos se denomina afijacioacuten y puede ser
de diferentes tipos
Afijacioacuten Simple A cada estrato le corresponde igual nuacutemero de elementos muestrales
Afijacioacuten Proporcional La distribucioacuten se hace de acuerdo con el peso (tamantildeo) de la poblacioacuten en
cada estrato
Afijacioacuten Oacuteptima Se tiene en cuenta la previsible dispersioacuten de los resultados de modo que se
considera la proporcioacuten y la desviacioacuten tiacutepica Tiene poca aplicacioacuten ya que no se suele conocer la
desviacioacuten
Supongamos que estamos interesados en estudiar el grado de aceptacioacuten que la implantacioacuten de la
reforma educativa ha tenido entre los padres de una determinada provincia A tal efecto seleccionamos
una muestra de 600 sujetos Conocemos por los datos del ministerio que de los 10000 nintildeos
escolarizados en las edades que nos interesan 6000 acuden a colegios puacuteblicos 3000 a colegios
semiprivados y 1000 a colegios privados Como estamos interesados en que en nuestra muestra esteacuten
representados todos los tipos de colegio realizamos un muestreo estratificado empleando como
variable de estratificacioacuten el tipo de centro Si empleamos una afijacioacuten simple elegiriacuteamos 200 nintildeos
de cada tipo de centro pero en este caso parece maacutes razonable utilizar una afijacioacuten proporcional pues
hay bastante diferencia en el tamantildeo de los estratos Por consiguiente calculamos que proporcioacuten
supone cada uno de los estratos respecto de la poblacioacuten para poder reflejarlo en la muestra
Colegios puacuteblicos 600010000 = 060
Colegios semiprivados 300010000 = 030
Colegios privados 100010000 = 010
Para conocer el tamantildeo de cada estrato en la muestra no tenemos maacutes que multiplicar esa proporcioacuten
por el tamantildeo muestral
Colegios puacuteblicos 060x600 = 360 sujetos
Colegios semiprivados 030x600 =180 sujetos
Colegios privados 010x600 = 60 sujetos
TAMANtildeO DE MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO ALEATORIO
ESTRATIFICADO
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacioacuten
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
22
22
ii
i
ii
SNDN
w
SN
n
De donde
Ni = tamantildeo del i eacutesimo estrato
N = tamantildeo de la poblacioacuten
Ssup2i = varianza del i eacutesimo estrato
wi = importancia o peso del i eacutesimo estrato
B
D4
2
Donde B = Precisioacuten
Ejemplo En un Ingenio se desea hacer una estimacioacuten del promedio de grados Brix con que llega la cantildea
a la faacutebrica Para tal el efecto se desea realizar un muestreo aleatorio estratificado puesto que la cantildea
proviene de tres tipos de proveedores Proveedor tipo A (estrato 1) la cantildea proviene de lotes de la misma
finca Proveedor tipo B (estrato 2) la cantildea proviene de fincas de particulares en donde el ingenio ha
prestado servicios Proveedor tipo C (estrato 3) la cantildea proviene de fincas de particulares en donde el
ingenio no ha tenido ninguacuten servicio De estudios anteriores se conoce el tamantildeo y desviacioacuten estaacutendar de
cada estrato y ademaacutes se desea tener una precisioacuten de un grado brix en el estudio iquestDe que tamantildeo debe de
ser la muestra total y de cada estrato En es siguiente cuadro se presentan los datos de Ni Si y Wi de los
diferentes estratos
DATOS
ESTRATO Ni Si wi
1 558 35 558998 = 056
2 190 54 190998 = 019
3 250 62 250998 = 025
Total 998
con distribucioacuten proporcional
N = Σ Ni = 998
22
221
ii
i
i
SNDN
w
SN
n
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
81270987
521961487
21986249001
521961487
249001)250()998(
2504
1
4
1Pr
921985
96104554056835
)26(250)45(190)53(558
521961487
9610000554040056811087
250
2402500
190
1052676
560
3814209
250
)26()250(
190
)45()190(
560
)53()558(
22
22
22
22
2
2
2222
2
33
2
22
2
11
2
22
22
22
22222222
3
2
3
2
3
2
2
2
2
2
1
2
1
2
1
22
totalmuestrala
detamantildeoelesSNDN
w
SN
n
DN
BD
esBesisionLa
SN
SN
SN
SNSNSNSN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
w
SN
ii
i
ii
ii
ii
ii
ii
i
ii
i
ii
i
ii
i
ii
i
ii
Como se utilizoacute distribucioacuten proporcional a cada estrato le tocariacutea el siguiente tamantildeo de muestra
n1 = 81(558998) = 45 n2 = 81(190998) = 15 n3 = 81(250998) = 20
Muestreo polietaacutepico o por conglomerados Los meacutetodos presentados hasta ahora estaacuten
pensados para seleccionar directamente los elementos de la poblacioacuten es decir que las unidades
muestrales son los elementos de la poblacioacuten En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacioacuten que forman una unidad a la que llamamos conglomerado Las
unidades hospitalarias los departamentos universitarios una caja de determinado producto etc son
conglomerados naturales
En otras ocasiones se pueden utilizar conglomerados no naturales como por ejemplo las urnas
electorales Cuando los conglomerados son aacuterea geograacutefica suele hablarse de muestreo por aacutereas El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamantildeo muestral establecido) y en investigar despueacutes
todos los elementos pertenecientes a los conglomerados elegidos En una investigacioacuten en la que se
trata de conocer el grado de satisfaccioacuten laboral los profesores de instituto necesitamos una muestra de
700 sujetos Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
por conglomerados Sabiendo que el nuacutemero de profesores por instituto es aproximadamente de 35 los
pasos a seguir seriacutean los siguientes
1 Recoger un listado de todos los institutos
2 Asignar un nuacutemero a cada uno de ellos
3 Elegir por muestreo aleatorio simple o sistemaacutetico los 20 institutos (70035=20) que nos
proporcionaraacuten los 700 profesores que necesitamos
Ventajas e inconvenientes de los distintos tipos de muestreo Probabiliacutestico
CARACTERIacuteSTICAS VENTAJAS INCONVENIENTES
Aleatorio
simple
Se selecciona una muestra de tamantildeo
n de una poblacioacuten de N unidades
cada elemento tiene una probabilidad de inclusioacuten igual y conocida de nN
Sencillo y de faacutecil comprensioacuten
Caacutelculo raacutepido de medias y
varianzas Se basa en la teoriacutea estadiacutestica y por tanto existen
paquetes informaacuteticos para analizar
los datos
Requiere que se posea de
antemano un listado completo de
toda la poblacioacuten Cuando se trabaja con muestras pequentildeas es
posible que no represente a la
poblacioacuten adecuadamente
Sistemaacutetico
Conseguir un listado de los N elementos de la poblacioacuten
Determinar tamantildeo muestral n
Definir un intervalo k=Nn Elegir un
nuacutemero aleatorio r entre 1 y k (r =arranque aleatorio) Seleccionar los
elementos de la lista
Faacutecil de aplicar No siempre es necesario tener un listado de toda la
poblacioacuten Cuando la poblacioacuten estaacute
ordenada siguiendo una tendencia
conocida asegura una cobertura de unidades de todos los tipos
Si la constante de muestreo estaacute asociada con el fenoacutemeno de
intereacutes las estimaciones obtenidas
a partir de la muestra pueden
contener sesgo de seleccioacuten
Estratificado
En ciertas ocasiones resultaraacute
conveniente estratificar la muestra
seguacuten ciertas variables de intereacutes Para ello debemos conocer la
composicioacuten estratificada de la
poblacioacuten objetivo a muestrear Una
vez calculado el tamantildeo muestral apropiado este se reparte de manera
proporcional entre los distintos
estratos definidos en la poblacioacuten
usando una simple regla de tres
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacioacuten en funcioacuten de unas variables seleccionadas Se obtienen
estimaciones maacutes precisa Su
objetivo es conseguir una muestra lo
mas semejante posible a la poblacioacuten en lo que a la o las variables
estratificadoras se refiere
Se ha de conocer la distribucioacuten en
la poblacioacuten de las variables
utilizadas para la estratificacioacuten
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietaacutepico) La necesidad
de listados de las unidades de una
etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior
Es muy eficiente cuando la poblacioacuten es muy grande y
dispersa No es preciso tener un
listado de toda la poblacioacuten soacutelo de
las unidades primarias de muestreo
El error estaacutendar es mayor que en el muestreo aleatorio simple o
estratificado El caacutelculo del error
estaacutendar es complejo
PLANES DE MUESTREO ALEATORIO
TIPO CARACTERIacuteSTICAS OBSERVACIONES
SIMPLE
Cada elemento de la poblacioacuten tiene la misma
probabilidad a priori de ser incluido en la muestra
Es el muestreo maacutes sencillo desde el punto de vista
matemaacutetico Es costoso y no provee informacioacuten respecto a subpoblaciones
ESTRATIFICADO
La poblacioacuten se divide en subpoblaciones (estratos)
identificados por niveles en los factores En cada estrato se realiza MAS
Se usa cuando se desea informacioacuten precisa para cada
estrato o cuando razones administrativas lo hacen conveniente
POR
CONGLOMERADO
La poblacioacuten se divide en subpoblaciones
(conglomerados) que se consideran a priori similares en los factores Se seleccionan
conglomerados y dentro de eacutestos unidades
secundarias
Se usa cuando es imposible o muy caro construir un
marco de muestreo o cuando los elementos estaacuten conglomerados en forma natural (pej cercaniacutea
geograacutefica)
SISTEMAacuteTICO
La poblacioacuten se ordena con alguacuten criterio (puede ser
aleatorio) Se sortea un elemento primero para ser
muestreado y se continuacutea muestreando uno cada tantos (paso)
( Por ejemplo 5 15 2585)
Es faacutecil de realizar cuando no se dispone de
identificacioacuten de los elementos Puede introducir
variaciones ciacuteclicas en los resultados
Teacutecnicas de muestreo sobre una poblacioacuten
La teoriacutea del muestreo tiene por objetivo el estudio de las relaciones existentes entre la distribucioacuten de
un caraacutecter en dicha poblacioacuten y las distribuciones de dicho caraacutecter en todas sus muestras
Las ventajas de estudiar una poblacioacuten a partir de sus muestras son principalmente
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Coste reducido
Si los datos que buscamos los podemos obtener a partir de una pequentildea parte del total de la
poblacioacuten los gastos de recogida y tratamiento de los datos seraacuten menores Por ejemplo cuando
se realizan encuestas previas a un refereacutendum es maacutes barato preguntar a 4000 personas su
intencioacuten de voto que a 30000000
Mayor rapidez Estamos acostumbrados a ver coacutemo con los resultados del escrutinio de las primeras mesas
electorales se obtiene una aproximacioacuten bastante buena del resultado final de unas elecciones
muchas horas antes de que el recuento final de votos haya finalizado
Maacutes posibilidades
Para hacer cierto tipo de estudios por ejemplo el de duracioacuten de cierto tipo de bombillas no es
posible en la praacutectica destruirlas todas para conocer su vida media ya que no quedariacutea nada que
vender Es mejor destruir soacutelo una pequentildea parte de ellas y sacar conclusiones sobre las demaacutes
De este modo se ve que al hacer estadiacutestica inferencial debemos enfrentarnos con dos problemas
Eleccioacuten de la muestra (muestreo)
Extrapolacioacuten de las conclusiones obtenidas sobre la muestra al resto de la poblacioacuten
(inferencia)
El tipo de muestreo maacutes importante es el muestreo aleatorio en el que todos los elementos de la
poblacioacuten tienen la misma probabilidad de ser extraiacutedos Aunque dependiendo del problema y con el
objetivo de reducir los costes o aumentar la precisioacuten otros tipos de muestreo pueden ser considerados
Meacutetodos de muestreo no probabiliacutesticas
En los muestreos no probabiliacutesticos no se usa el azar sino el criterio del investigador suele presentar
grandes sesgos y es poco fiable no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacioacuten
Se utilizan a veces para estudios exploratorios ya que el muestreo Probabiliacutestico resulta
excesivamente costoso y se acude a meacutetodos no probabiliacutesticos aun estando conscientes de que no
sirven para realizar generalizaciones pues no se tiene certeza de que la muestra extraiacuteda sea
representativa ya que no todos los sujetos de la poblacioacuten tienen la misma probabilidad de se elegidos
En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa Estos muestreos pueden ser
Muestreo por cuotas Tambieacuten denominado en ocasiones accidental Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacioacuten yo de los individuos maacutes
representativos o adecuados para los fines de la investigacioacuten Mantiene por tanto semejanzas con
el muestreo aleatorio estratificado pero no tiene el caraacutecter de aleatoriedad de aqueacutel
En este tipo de muestreo se fijan unas cuotas que consisten en un nuacutemero de individuos que reuacutenen
unas determinadas condiciones por ejemplo 20 individuos de 25 a 40 antildeos de sexo femenino y
residentes en Gijoacuten Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caracteriacutesticas Este meacutetodo se utiliza mucho en las encuestas de opinioacuten
Por ejemplo la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia Lo que
deberiacuteamos hacer seriacutea conocer por los informes de la Consejeriacutea de Educacioacuten cuales son los centros
maacutes afectados por el problema fijar un nuacutemero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deberaacute entrevistar
Muestreo opinaacutetico o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras representativas mediante la inclusioacuten en la muestra de grupos supuestamente
tiacutepicos Es muy frecuente su utilizacioacuten en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto
Muestreo casual o incidental Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la poblacioacuten El caso maacutes frecuente de este procedimiento el
utilizar como muestra los individuos a los que se tiene faacutecil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos) Un caso particular es el de los voluntarios
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Bola de nieve Se localiza a algunos individuos los cuales conducen a otros y estos a otros y asiacute hasta
conseguir una muestra suficiente Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones marginales delincuentes sectas determinados tipos de enfermos etc
SELECCIOacuteN ALEATORIA DE LAS MUESTRAS
A veces no es faacutecil lograr una muestra aleatoria Si la poblacioacuten de que se trata es pequentildea uno de los
meacutetodos maacutes sencillos para obtenerla es formular una lista de integrantes (en pequentildeas tiras de papel) y
escoger la muestra al azar
Cuando se trata de poblaciones maacutes grandes se puede asignar un nuacutemero entero a cada miembro y usar
una tabla de nuacutemeros aleatorios integrada por diacutegitos escogidos al azar Para lograr la muestra
aleatoria se comienzan a leer los nuacutemeros de la tabla en un lugar tambieacuten escogido al azar asiacute para
cada nuacutemero seleccionado el miembro de la poblacioacuten consta de 100 miembros se pueden asignar los
nuacutemeros de 10 al 99 Si en la tabla se leen los nuacutemeros 2 7 22 34 etc se incluiacutean dichos nuacutemeros en
la muestra aleatoria La muestra en estudio en cualquier investigacioacuten debe ser representativa del
universo estadiacutestico (poblacioacuten ideal que abarca a todos los individuos que posean las mismas
caracteriacutesticas y en la misma proporcioacuten del colectivo) Cuando maacutes grande sea la muestra maacutes
representativa resultaraacute sin embargo no necesita ser maacutes grande cuando es suficiente representativa
Esta es la prueba de estabilidad de la muestra
TAMANtildeO DE LA MUESTRA
A la hora de determinar el tamantildeo que debe alcanzar una muestra hay que tomar en cuenta varios
factores el tipo de muestreo el paraacutemetro a estimar el error muestral admisible la varianza
poblacional y el nivel de confianza Por ello antes de presentar algunos casos sencillos de caacutelculo del
tamantildeo muestral delimitemos estos factores
Para calcular el tamantildeo de una muestra hay que tomar en cuenta tres factores
1 El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacioacuten total
2 El porcentaje de error que se pretende aceptar al momento de hacer la generalizacioacuten
3 El nivel de variabilidad que se calcula para comprobar la hipoacutetesis
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos Esto quiere decir que un porcentaje del 100 equivale a decir que no existe
ninguna duda para generalizar tales resultados pero tambieacuten implica estudiar a la totalidad de los casos
de la poblacioacuten Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
praacutecticamente imposible el estudio de todos los casos entonces se busca un porcentaje de confianza
menor Comuacutenmente en las investigaciones sociales se busca un 95
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipoacutetesis que sea falsa
como si fuera verdadera o la inversa rechazar a hipoacutetesis verdadera por considerarla falsa Al igual
que en el caso de la confianza si se quiere eliminar el riesgo del error y considerarlo como 0
entonces la muestra es del mismo tamantildeo que la poblacioacuten por lo que conviene correr un cierto riesgo
de equivocarse
Comuacutenmente se aceptan entre el 4 y el 6 como error tomando en cuenta de que no son
complementarios la confianza y el error
La variabilidad es la probabilidad (o porcentaje) con el que se aceptoacute y se rechazoacute la hipoacutetesis que se
quiere investigar en alguna investigacioacuten anterior o en un ensayo previo a la investigacioacuten actual El
porcentaje con que se aceptoacute tal hipoacutetesis se denomina variabilidad positiva y el porcentaje con el que
se rechazoacute se la hipoacutetesis es la variabilidad negativa
El muestreo es el proceso de tomar una proporcioacuten o parte de un universo de elementos con la
finalidad de analizar en dichos elementos caracteriacutesticas sujetas a estudio o fenoacutemenos factibles de
observacioacuten y en base al anaacutelisis de la muestra o proporcioacuten tomada obtener conclusiones que se
refieran no soacutelo a la muestra sino a todo el universo Para fines estadiacutesticos el universo puede
considerarse finito o infinito Se considera finito si el nuacutemero de elementos que lo constituyen es
menor a 500000 e infinito si es igual o mayor a este nuacutemero Siempre que hagamos la eleccioacuten de una
muestra debemos tener cuidado de que eacutesta reuacutena las siguientes caracteriacutesticas
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
middot Que sea suficiente es decir que la cantidad de elementos seleccionados sea el que se requiere para
que el nivel de confiabilidad sea el que se ha establecido previamente
middot Que sea representativa esto quiere decir que los elementos seleccionados deberaacuten presentar
caracteriacutesticas similares a las de la poblacioacuten o universo
Al utilizar muestras en lugar de universos tenemos grandes ventajas algunas de las maacutes importantes
son
middot El costo se reduce pues los gastos seraacuten uacutenicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de eacutel
middot Si la muestra es representativa las deducciones resultantes sobre el universo seraacuten confiables
middot Como solamente se estudia una parte del universo la informacioacuten obtenida se realiza en menor
tiempo
iquestCoacutemo obtener el tamantildeo de la muestra a utilizar
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacioacuten y difiacutecil de contestar
sobre todo por falta de informacioacuten del problema es iquestcuaacutentas observaciones se deben obtener para que
el tamantildeo de la muestra sea realmente representativo del universo estadiacutestico En este sentido -la
decisioacuten del tamantildeo de la muestra de una poblacioacuten - es necesario considerar que las muestras variacutean
en su composicioacuten de una a otra La magnitud de la variacioacuten depende del tamantildeo de la muestra y de la
variabilidad original de la poblacioacuten Asiacute el tamantildeo de la muestra queda determinada por el grado de
precisioacuten que se desea obtener y por variabilidad inicial de la poblacioacuten
La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes
1 Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza un nivel de confianza igual o mayor al 92 es aceptable estadiacutesticamente
2 Evaluar la probabilidad a favor de que suceda un evento o situacioacuten esperada (esta probabilidad se le
denomina p)
3 Evaluar la probabilidad en contra de que suceda en un evento o situacioacuten esperada (a esta
probabilidad se le denomina q= 1 ndash p)
4 Determinar el error (e) maacuteximo para el nivel de precisioacuten que vayamos a permitir en los resultados
(error maacuteximo de estimacioacuten) comuacutenmente se trabaja con errores de estimacioacuten entre el 2 y el 6
ya que la validez de la informacioacuten se reduce demasiado para valores mayores del 6
middot Determinamos el tamantildeo de la poblacioacuten o universo
5- Se elige la foacutermula a utilizar para calcular el tamantildeo de la muestra dependiendo de si la poblacioacuten o
universo sujeto a estudio se va a considerar infinito oacute infinito (Una poblacioacuten o universo se considera
infinito si el nuacutemero de elementos de los que consta es igual o mayor a 500000 y es considerado finito
si el nuacutemero de elementos es menor a esta cantidad)
Diferentes niveles de confianza utilizados en la praacutectica
Nivel de Confianza 9973 99 98 96 9545 95 90 80 6827 50
Valores de Z 300 258 233 205 200 196 1645 128 100 06745
TAMANtildeO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es
iquestqueacute tamantildeo de muestra necesito La respuesta dependeraacute del disentildeo del estudio es decir de los
objetivos naturaleza y alcance del mismo y del resultado previsto del mismo Todo esto deberaacute tenerse
en cuenta en la fase de planificacioacuten del estudio
El tamantildeo de la Muestra es importante porque tiene relacioacuten estrecha con el costo de la Muestra Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
La cuestioacuten de que tan grande tomar una muestra surge inmediatamente en la planificacioacuten de cualquier
investigacioacuten o experimento Esto es muy importante y no debe tratarse con ligereza Tomar una
muestra maacutes grande de lo necesario para alcanzar los resultados deseados es un desperdicio de
recursos y tiempo mientras que muestras muy pequentildeas pueden conducir a conclusiones erroacuteneas El
tamantildeo de la muestra depende de la desviacioacuten estaacutendar (S) del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e) o precisioacuten
El tamantildeo de la Muestra se calcula mediante procedimientos estadiacutesticos Vamos a presentar la
Foacutermula que se aplican en el caso de que no se conozca con precisioacuten el tamantildeo de la poblacioacuten o
universos considerados infinitos o desconocido o Cuando se trata de medir una variable binomial
(acierto-error) es decir una proporcioacuten y que el tamantildeo de la poblacioacuten estudiada es grande se puede
emplear la foacutermula siguiente
e
pqZn
2
2
Si p = q = 50 entonces )1(42 2
22
e
Zn
e
Zn
Donde n nuacutemero de puntos de muestreo p y q son la confiabilidad e = error (medio intervalo de
confianza) y 2
Z = 196 para = 005 Como se puede observa en la ecuacioacuten (1) el intervalo de
confianza del estimado de esta confiabilidad depende del nuacutemero de unidades de muestreo (maacutes
grande el tamantildeo de muestra maacutes pequentildeo el intervalo de confianza) y de la confiabilidad de la clase
(con el mismo nuacutemero de unidades de muestreo la confiabilidad se estima con menos precisioacuten si estaacute
cerca de 50 )
Cuando se requiere determinar el tamantildeo de la muestra para estimar una proporcioacuten se tienen que
definir tres incoacutegnitas
1- El nivel de confianza (Z) deseado
2- El error muestral permitido e
3-La proporcioacuten real de eacutexito p y la proporcioacuten de fracaso q = 1 ndash p En la praacutectica con frecuencia resulta difiacutecil seleccionar estas tres cantidades Una vez que se determina
el nivel de confianza deseado se estaraacute en posibilidad de obtener el valor Z de la distribucioacuten normal
apropiado El error muestral e sentildeala la cantidad de error queacute se estaacute dispuesto a aceptar al estimar la
proporcioacuten de la poblacioacuten La tercera cantidad la proporcioacuten real de eacutexito p en realidad es el
paraacutemetro de la poblacioacuten que se esta intentando determinar Para ello hay dos alternativas
l-En muchas situaciones se cuenta con informacioacuten anterior o con experiencias relevantes que
permiten obtener un estimado o informacioacuten de p
2- Si no se cuenta con informacioacuten anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamantildeo de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto pq sea lo mayor posible alcanzaacutendose el maacuteximo producto
cuando p = q = 050 entonces pq = 025 Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcioacuten real de p se debe utilizar un p = 05 como la forma mas conservadora para
determinar el tamantildeo de la muestra Sin embargo la utilizacioacuten de p puede dar como resultado una
sobrestimacioacuten en el tamantildeo de la muestra pero es un riego que se debe asumir
PROBLEMAS 1- Un investigador social pretende que al investigar la proporcioacuten de deportistas
existentes actualmente en una universidad no se cometa un error mayor del 15 iquestCuaacutel deberaacute ser el
tamantildeo de la muestra para poder tener la certeza con un grado de confianza del 99 de que la
estimacioacuten sea correcta
SOLUCIOacuteN Se puede observar que ante el desconocimiento por cualquier medio del paraacutemetro p
debemos obtener el tamantildeo de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresioacuten
2
22
42 e
Zn
e
Zn
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Donde se tendraacute que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99
que no es otro que 258 como el error maacuteximo admitido que es 015 y como no se conoce un valor
estimado para p y q se tomara el maacuteximo valor para este producto es decir p = q = 05 Luego se
aplica la formula
070)0230(4
666
)150(4
)582(
42 2
2
2
22
e
Zn
e
Zn Por lo tanto el tamantildeo de la muestra seraacute de 74
2- Supoacutengase que por estudios anteriores se tenga el conocimiento de que la proporcioacuten de deportistas
entre los estudiantes de una universidad es de 065 Se pregunta iquestQueacute tamantildeo de muestra deberaacute
tomarse si se quiere que el error no exceda del 15 Y con un grado de confianza del 99
SOLUCIOacuteN Tomando en cuenta que se tiene conocimiento de que la proporcioacuten de estudiantes que
practican alguacuten deporte en esa universidad es de 065 se puede utilizar este valor como una
estimacioacuten de la proporcioacuten verdadera en cuyo caso nos valdremos de la siguiente formula matemaacutetica
para obtener el tamantildeo de la muestra necesaria Entonces 5821503506502
Zyeqp
2
22
e
pqZn
sustituyendo los datos conocidos en esa formula se tiene
67230
230666
)150(
)350)(650()582(2
2
x
n El tamantildeo de la muestra es entonces 67
Puede observarse como el conocimiento de alguna estimacioacuten del paraacutemetro p ha hecho disminuir el
tamantildeo de la muestra necesaria para satisfacer la misma precisioacuten Esto demuestra que el valor que
tiene la informacioacuten de experiencias pasadas sobre el hecho que se estudia
En el caso de que siacute se conozca el tamantildeo de la poblacioacuten cuando la variable criacutetica es
dicotomica o Binomial para la estimacioacuten de proporciones poblacionales o Universos
considerados finitos entonces el tamantildeo de la muestra se determina con la siguiente
formula
Cuando Nlt30 la formula que se tiene que utilizar es
Donde
n es el tamantildeo de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamantildeo de la poblacioacuten
e es la precisioacuten o el error
Al conocer exactamente el tamantildeo de la poblacioacuten el tamantildeo de la muestra resulta con mayor precisioacuten
y se pueden incluso ahorrarse recursos y tiempo para la aplicacioacuten y desarrollo de una investigacioacuten
Ejemplo 1 En los Colegios de Curas extendido por todo Ameacuterica del sur se desea realizar una
investigacioacuten sobre los alumnos inscritos en primer y segundo antildeos para lo cual se aplicaraacute un
cuestionario de manera aleatoria a una muestra pues los recursos econoacutemicos y el tiempo para procesar
la informacioacuten resultariacutea insuficiente en el caso de aplicaacutersele a la poblacioacuten estudiantil completa
30
2
2
2
2
2
Nparausaseformulaesta
qpZNe
qpNZn
)1(
2
2
2
2
2
qpZNe
qpNZn
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
En primera instancia suponiendo que no se conoce el tamantildeo exacto de la poblacioacuten pero con la
seguridad de que eacutesta se encuentra cerca de los diez millardo se aplicaraacute la formula 2
2
2
e
pqZn
Se consideraraacute una confianza del 95 un porcentaje de error del 5 y la maacutexima variabilidad (pq)
por no existir antecedentes en la institucioacuten sobre la investigacioacuten y porque no se puede aplicar una
prueba previa
Primero habraacute que obtener el valor de Z de tal forma que la confianza sea del 95 es decir buscar un
valor de Z tal que P(-ZltzltZ) = 095 Utilizando las tablas resulta que Z = 196
De esta manera se aplica la formula 2
2
2
e
pqZn
se realiza la sustitucioacuten y se obtiene n asiacute
38400250
96040
00250
)250)(84163(
050
)50)(50()961(2
2
n Esto quiere decir que el tamantildeo de la muestra
es de 384 alumnos
Supongamos ahora que siacute se conoce el tamantildeo de la poblacioacuten estudiantil y es de 9750 entonces se
aplicaraacute la foacutermula pqZNe
qNpZn
2
2
2
2
Utilizando los mismos paraacutemetros la sustitucioacuten queda
como
037053693425
99363
)50)(50()961()050)(9750(
)9750)(50)(50()961(22
2
n
Con lo que se tiene una cota miacutenima de 370 alumnos para la muestra y asiacute poder realizar la
investigacioacuten sin maacutes costo del necesario pero con la seguridad de que las condiciones aceptadas para
la generalizacioacuten (confiabilidad variabilidad y error) se mantienen Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370)
EJEMPLO 2 El jefe del Departamento de Control de Estudio del IUTJAA quiere comprobar a traveacutes
de una muestra aleatoria la proporcioacuten de estudiantes que han desertado del IUTJAA cuya poblacioacuten
esta constituida por 7000 alumnos El jefe del departamento especifica que el error maacuteximo admisible
no debe ser maacutes de 5 de la verdadera proporcioacuten para el trabajo se requiere un nivel de confianza de
98 y el valor de p es estimado en 50 Encuentre el tamantildeo de la muestra requerido
DATOS
N = 7000
e = 005
Z al 98 =233
P = 05
q = 05
n =
SOLUCIOacuteN Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula
Luego el tamantildeo de la muestra necesario para el estudio es de 427 alumnos que tendraacute que Tamar por
un muestreo del total
042780426366
452714
)50)(50()332()2000()050(
)50)(50)(2000()332(
22
2
2
2
2
2
2
qpZNe
qpNZn
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
Cuando el muestreo es sin reemplazo a partir de una poblacioacuten finita SUPONIENDO UNA
DISTRIBUCIOacuteN NORMAL se requiere la correccioacuten por poblacioacuten finita entonces la ecuacioacuten para
obtener el TAMANtildeO DE LA MUESTRA para la estimacioacuten de la media poblacional queda asiacute
1
N
nN
n
ZSe
Los investigadores consideran que esta formula solo se utiliza cuando Nlt30
Se utiliza para Ngt30
Donde
n = es el tamantildeo de la muestra
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacioacuten tiacutepica muestral (S)
N = es el tamantildeo de la poblacioacuten o universo muestral
e es la precisioacuten o el error
El grado de confiabilidad se toma de la tabla de t de Student si 3030 nsiZdeon
La formula para el tamantildeo de la muestra requiere que se conozca 2 pero generalmente este
paraacutemetro no se conoce entonces hay que estimarla Las fuentes de estimacioacuten para la varianza
poblacional son
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacioacuten de 2
Puede contarse con estimaciones de 2 obtenidas de estudios previos o semejantes
EJEMPLO 1 Se desea determinar el tamantildeo de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto con una precisioacuten de 5 cm en la longitud de cada tubo y un
nivel de confianza de 95 Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30
DATOS
N = 20
σ2 = 30
Z = 196
e = 5
SOLUCIOacuteN Como se sabe que nuacutemero de tubos por lotes es de 20 se requiere la correccioacuten por
poblacioacuten finita luego se aplica la formula asiacute
Se concluye que con la variacioacuten observada y la precisioacuten escogida el tamantildeo de muestra adecuada es
4 tubos por lote
2
2
22
2
2
2
)1(
ZNe
ZNn
0425590
962304
)961(30)19(5
)961(3020
)1( 22
2
2
2
22
2
2
2
ZNe
ZNn
2
2
22
2
2
2
ZNe
ZNn
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228
EJEMPLO 2 Sea una poblacioacuten de obreros de tamantildeo N = 2000 de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio para estimar el sueldo promedio Se quiere que la
estimacioacuten muestral no se aparte en maacutes de 05 puntos (error maacuteximo admisible) del promedio
verdadero con un nivel de confianza de 95 La varianza poblacional es de 25 puntos
DATOS
N = 2000
e = 05
Z al 95 = 196
σ2 = 25
n =
SOLUCIOacuteN Como se trata de la estimacioacuten de la media poblacional mediante muestreo aleatorio se
aplicara la siguiente formula
Entonces el nuacutemero de obreros que hay que seleccionar para que la estimacioacuten esteacute en el intervalo
)5050( con un nivel de confianza del 95 es de n = 38 obreros
Teorema Central del Liacutemite
El Teorema Central del Liacutemite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucioacuten (cualquiera que eacuteste sea) la suma de ellas se
distribuye seguacuten una distribucioacuten normal
Es decir Si x1 x2en son variables aleatorias independientes cada una con media i y
varianza 2i se cumple que cuando n tiende a infinito el cociente
2i
iix tiende a
distribuirse normalmente con media = 0 y varianza 2 =1 aunque las distribuciones de las xi
sean distintas entre si
Ejemplo La variable tirar una moneda al aire sigue la distribucioacuten Binomial Si lanzamos la moneda
al aire 50 veces la suma de estas 50 variables (cada una independiente entre si) se distribuye seguacuten una
distribucioacuten normal
Este teorema se aplica tanto a suma de variables discretas como de variables continuas Los paraacutemetros
de la distribucioacuten normal son
Media nmicro (media de la variable individual multiplicada por el nuacutemero de variables independientes)
Varianza 2n
individuales)
Ejemplo Se lanza una moneda al aire 100 veces si sale cara le damos el valor 1 y si sale sello el valor
0 Cada lanzamiento es una variable independiente que se distribuye seguacuten el modelo Binomial con
media 05 y varianza 025 Calcular la probabilidad de que en estos 100 lanzamientos salgan maacutes de 60
caras
La variable suma de estas 100 variables independientes se distribuye por tanto seguacuten una distribucioacuten
normal
Media = 100 x 05 = 50 Varianza = 100 x 025 = 25
Para ver la probabilidad de que salgan maacutes de 60 caras calculamos la variable normal tipificada
equivalente
0386937604509
19208
6049500
19208
)961(522000)50(
)961)(52(200022
2
2
2
22
2
2
2
ZNe
ZNn
XZ
5
5060
() 5 es la raiacutez cuadrada de 25 o sea la desviacioacuten tiacutepica de esta distribucioacuten
Por lo tanto
P (X gt 60) = P (Z gt 20) = 1- P (Z lt 20) = 1 - 09772 = 00228
Es decir la probabilidad de que al tirar 100 veces la moneda salga maacutes de 60 caras es tan soacutelo del
228