apuntes de estadÍstica para … · jorge eduardo mina rizo facultad de contaduría pública....
TRANSCRIPT
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
1
ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA
ÍNDICE
Capítulo 1 Muestreo
1.1 Propósito
1.2 Introducción
1.3 Muestras y Poblaciones
1.4 Muestreo a partir de una población finita
1.5 Muestra y censo
1.6 Muestreo Aleatorio
1.6.1 Obtención de una muestra aleatoria
1.6.2 Tablas de números aleatorios
1.7 Otros métodos de muestreo
1.8 Probabilidad y muestreo probabilístico
1.9 Muestreo de Juicios
1.10 Muestreo probabilístico
1.10.1 Muestreo sistemático
1.10.2 Muestreo estratificado
1.10.3 Muestreo de acumulación.
Capítulo 2 DISTRIBUCIONES DE MUESTREO
2.1 Objetivos del capítulo
2.2 Introducción
2.3 Esbozo del capítulo
2.4 Efecto de los parámetros de población sobre una distribución de muestreo
2.5 Efecto del tamaño de la muestra sobre una distribución de muestreo.
2.6 Distribuciones de medias muestrales
2.7 El teorema del límite central
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
2
2.8 Distribución de proporciones muestrales
2.9 Distribuciones de muestreo del número de ocurrencias.
2.10 Muestreo a partir de una población finita.
Capítulo 3.- ESTIMACIÓN
3.1 Introducción
3.2 Estimaciones de Punto y de intervalo
3.2.1 Explicación de la estimación
3.3 Características de los buenos estimadores
3.3.1 Insesgadura
3.3.2 Consistencia
3.3.3 Eficiencia
3.3.4 Suficiencia
3.4 Estimación de la media de la población con varianza conocida.
3.5 Obtención de intervalos de confianza útiles para poblaciones
normalmente distribuidas
3.6 Componentes de un intervalo de confianza
3.7 Selección del coeficiente de confianza
3.8 Interpretación del intervalo de confianza
3.9 Precisión
3.10 Intervalos de confianza para medias de poblaciones no normalmente
distribuidas
3.11 Análisis computarizado.
ESTADÍSTICA PARA
ADMINISTRACIÓN Y ECONOMÍA
Propósito: Aprender a diferenciar un
muestreo, un censo y viceversa.
Identificar los términos “muestra” y
“población”. Qué significa “muestreo
aleatorio simple”?. Aplicar los métodos
para obtener muestra aleatorias.
Descripción de tablas numéricas
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
3
aleatorias. Identificar las diferencias entre
muestreo de probabilidad y muestreo de
juicio. Analizar y utilizar variantes del
muestreo aleatorio simple y manejar
ejemplos de cada tema.
INTRODUCCIÓN.
Al salir con una persona por primera vez
o ver un programa de televisión durante
unos minutos antes de tomar la decisión
de cambiar de canal, al ofrecer una
“probadita” de equis o zeta producto en
un supermercado, al probar la sopa para
ver si necesita de una pizca más de sal o
simplemente probar un pastel en casa para
saber si ya está frío, se realiza una
actividad que se le denomina Muestreo.
Cada uno de los ejemplos anteriores
conforman el muestreo estadístico,
aunque los métodos son formales y
precisos y generalmente incluyen una
proposición de probabilidad.
De hecho, la probabilidad y el muestreo
están estrechamente relacionados y juntos
constituyen la base de la teoría de la
inferencia.
En estos apuntes viajaremos por los
conceptos básicos que comprenden el
muestreo. Exploraremos las razones para
el muestreo y planes de muestreo
alternativos. Nos detendremos
particularmente en el muestreo aleatorio,
debido a su importancia en el análisis
estadístico..
Ningún plan de muestreo puede
garantizar que una muestra sea
exactamente igual a la población de la
que se ha tomado. Una muestra aleatoria
permite estimar la cantidad de error
posible (es decir, “cuan próxima” está la
muestra en términos de su
representatividad). Las muestras no
aleatorias carecen de esta característica.
MUESTRAS Y POBLACIONES
Un censo comprende el examen de todos
los elementos de un determinado grupo.
Una muestra comprende el análisis de una
pequeña parte de ellos. El objeto del
muestreo es establecer generalizaciones
con respecto a un grupo total de
elementos sin tener que examinarlos uno
por uno.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
4
La parte del grupo de elementos que se
examinan recibe el nombre de muestra y
el grupo total a partir del cual se
seleccionó la muestra se conoce como
población o universo. Los elementos que
forman una población pueden ser
personas, empresas, productos
manufacturados, inventarios, escuelas,
ciudades, calificaciones escolares, precios
o cualquier otra cosas que se pueda
medir, contar o jerarquizar.
Los términos “población” y “muestra”
están relacionados con un conjunto
específico de circunstancias. Es decir, en
un ejemplo, los alumnos de un salón de
clases se pueden considerar como una
población y de ésta se puede obtener una
muestra de estudiantes.
En el caso de otro problema, estos
mismos alumnos se pueden considerar
como una muestra de todos los
estudiantes de una escuela de ingeniería o
bien, como una muestra de la población
de estudiantes de esa universidad en
particular.
Como el fin del muestreo es generalizar
con respecto a la población fundamental,
es evidente que la población objetivo se
deba establecer de manera que se puedan
hacer generalizaciones significativas.
Las poblaciones de tamaño limitado se
conocen como poblaciones finitas, en
tanto que las que tienen tamaño ilimitado
se conocen como poblaciones infinitas.
Los alumnos de una clase determinada,
los productos de un supermercado, los
libros de una biblioteca y los automóviles
del Estado de Chiapas son ejemplos de
población finitas.
Por otro lado, las poblaciones infinitas
generalmente son de cierto tipo de
proceso que produce elementos o
resultados, como la tirada de monedas, en
la cual el número de resultados (caras o
cruces) que se pueden obtener es
ilimitado. Otros ejemplos de procesos de
poblaciones infinitas son la producción
futura de una máquina. La extracción de
canicas de una urna regresando cada
canica a su lugar antes de sacar otra, y el
nacimiento de insectos (o de cualquier
otra especie).
Desde un punto de vista práctico, la
consideración importante es, si separar
uno o un pequeño número de elementos
de la población, influirá de manera
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
5
considerable en las probabilidades
relativas.
MUESTREO A PARTIR DE UNA
POBLACIÓN FINITA
El problema de regresar o no un elemento
muestreado a una población antes de
sacar otro de ésta, surge cuando se
muestrea de una población finita, ya que
la probabilidad de incluir elementos de
una población en una muestra dependerá
de si estamos muestreando con reposición
o sin reposición.
Si el tamaño de una muestra es pequeño
en relación con el de la población, el no
regresar los objetos muestreados a la
población tendrá un efecto insignificante
sobre las probabilidades de los elementos
restantes, y muestrear sin reposición no
causará serias dificultades.
Por otra parte, las muestras relativamente
grandes tienden a distorsionar las
probabilidades de los elementos restantes
cuando se muestrea sin reposición.
Una regla generalmente aceptada es
sustituir unidades si el tamaño de la
muestra excede del 5% del tamaño de la
población. El seleccionar una muestra
completa de inmediato equivale a
muestrear sin reposición.
Cuando se muestrea con reposición es
posible obtener el mismo resultado más
de una vez, en tanto que tomando la
muestra total de una vez, sería imposible
que eso sucediera.
Existen varias razones del por qué el
muestreo sin reposición se lleva a cabo en
la práctica real:
1.- Los efectos suelen ser insignificantes
y puede ser más conveniente hacerlo así.
2.- Si se realizan ensayos destructivos,
será imposible regresar los elementos
muestreados a la población.
3.- En el muestreo industrial será difícil
persuadir a los inspectores carentes de
adiestramiento en estadística de que
regresen los elementos muestreados a la
población, particularmente si éstos están
defectuosos.
4.- Cuando se regresa un objeto
muestreado a la población, existe una
posibilidad de que sea incluido en un
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
6
ensayo subsecuente. Así, algunos
elementos pueden ser muestreados más de
una vez.
Si el procedimiento de muestreo
comprende u ensayo o una entrevista
costosos, es deseable evitar examinar un
objeto más de una vez.
El muestreo sin reposición es necesario o
deseable, cuando el tamaño de la muestra
es relativamente grande en comparación
con el tamaño de la población y el cálculo
de probabilidades importantes se funda en
la distribución hipergeométrica.
Los cálculos pueden ser bastante
complejos, por lo que únicamente se
mencionarán y en otros apuntes se
profundizará más en lo referente a la
distribución hipergeométrica.
MUESTRA Y CENSO
Una muestra generalmente comprende el
examen de una parte de los elementos de
una población, mientras que un censo
consiste en estudiar todos los elementos
de ésta.
Aunque el enfoque en la estadística
inductiva se apoya en las muestras, es
útil, sin embargo, considerar la alternativa
de muestreo.
Puede parecer más conveniente
inspeccionar de manera completa todos
los elementos de una población que
estudiar una muestra de éstos.
En la práctica, sucede lo contrario: es
mejor hacer un muestreo que efectuar un
censo. Esta última proposición se
considerará en términos de las situaciones
en las que el muestreo resulta útil.
1.- La población puede ser infinita, en
cuyo caso será imposible efectuar un
censo. Son procesos que nunca terminan.
Sería evidentemente imposible examinar
cada elemento de la población.
2.- Una muestra puede ser más oportuna
que un censo. Si se requiere rápidamente
de información acerca de una población,
el estudio de una completa – en particular
si hay muchos elementos, o si están muy
dispersos – puede consumir tanto tiempo
que no sería utilizable.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
7
En el tiempo que necesitaríamos para
examinar cada caja de un cargamento de
fresas frescas, a fruta se podría deteriorar
hasta el punto que no pudieran venderse.
Además si una población tiende a
cambiar con el tiempo, un censo completo
puede combinar realmente varias
poblaciones.
Encuestar personas de una gran
comunidad para descubrir el porcentaje
de individuos que contrajeron cierta
enfermedad contagiosa puede tardarse
tanto que, cuando se obtengan los
resultados y se tomen las medidas de
sanidad convenientes, el padecimiento
puede haberse extendido en tal grado que
sería necesario tomar otras disposiciones.
De hecho, los encuestadores pueden ser
un factor que contribuya a la propagación
de la enfermedad. Así, el estudio puede
indicar que localmente se dispone de la
suficiente vacuna para hacer frente a la
enfermedad pero, para ese momento, ésta
se encontrará fuera de control y requerirá
dosis masivas de la vacuna.
3.- Pueden intervenir ensayos
destructivos. Es decir, en el proceso de
examinar los objetos, éstos quedan
destruidos. Cosas como lámparas de
destello, fusibles, etc., generalmente se
destruyen durante el proceso de prueba.
Así un censo puede proporcionar una
imagen más exacta de una población
inexistente.
4.- El costo de efectuar un censo puede
ser excesivo, particularmente cuando
resulta caro examinar cada elemento y
son muchos los que forman la población.
El costo de efectuar un censo de la
población enorme y sólo se lleva a cabo
cada 10 años.
Otro ejemplo sería tratar de obtener un
censo de los peces de la población
piscícola de una laguna, o contar el
número total de peces en un lago. La
población es tan grande y cambiante y los
problemas de medición (como contar una
vez cuidadosamente cada pez, sin que
sufra daño alguno) son tan complejos, que
esto excluye claramente el censo.
5.- La exactitud puede verse afectada
cuando se hace un censo de una gran
población. El muestreo comprende menos
observaciones y, por tanto, menos
recopiladores de datos. Cuando hay
muchos de ellos existe una menor
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
8
coordinación y control que si hay pocos,
por lo que aumenta la posibilidad de
cometer errores. Así, el muestreo
generalmente puede dar lugar a mayor
uniformidad en los métodos de
recopilación de datos y mayor
comparación entre los mismos, que un
censo.
6.- El tipo de información puede depender
de si se utiliza una muestra o un censo.
Los gastos de recopilación de datos están
sujetos a limitaciones presupuestales.
Asimismo, suele establecerse un límite de
tiempo. Si se utiliza un censo, las
consideraciones de tiempo y costo pueden
significar que esta operación debe
restringirse a medir una o unas cuantas
características por elemento.
Una muestra tomada con las mismas
restricciones de tiempo y dinero, podría
dar lugar a un estudio más profundo de un
pequeño número de objetos. Obsérvese
que si todos los elementos de una
población fueran idénticos, entonces una
muestra de uno solo proporcionaría toda
la información respecto a la población
total y muy poco se ganaría si se efectuara
un censo.
Aunque esta situación sería extrema, hay,
de hecho, muchos ejemplos en los que los
elementos de una población son muy
semejantes. En estos ejemplos, un censo
total contribuiría muy poco en
comparación con lo que lo haría una
muestra relativamente pequeña.
Existen ciertas situaciones en las que es
más ventajoso inspeccionar todos los
elementos de una población (es decir,
efectuar un censo):
1.- La población puede ser tan pequeña
que quizá sea un poco más costoso y
largo efectuar un censo que hacer una
muestra?????????. Si la población está
formada por un grupo de 20 estudiantes,
indudablemente lo mejor sería llevar a
cabo un censo????????.
2.- Si el tamaño de la muestra es
relativamente grande con respecto al
tamaño de la población, el esfuerzo
adicional requerido para hacer un censo
puede ser pequeño.
Por ejemplo si existe mucha variabilidad
entre los elementos de una población,
puede ser necesario considerar una
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
9
muestra muy grande para obtener una que
sea representativa.
Si la población no es mucho más grande
que la muestra, un censo puede eliminar
la variabilidad del muestreo.
3.- Si se requiere una exactitud completa,
un censo es la única forma de alcanzarla.
Debido a la variabilidad del muestreo,
nunca se tendrá la seguridad de cuáles son
los verdaderos parámetros de la
población.
Un censo puede proporcionar esta
información, aunque los errores en la
recopilación de datos entre otros, quizás
afecten obviamente la exactitud de éste.
Un gerente bancario no tomaría una
muestra al azar del dinero en las cajas
para saber de cuánto efectivo dispone el
banco, sino que contaría todo el dinero
(efectuaría un censo) depositado en todas
ellas.
Esto hace que no se cometan errores y
fallas aritméticas al sumar las cantidades,
pero evita los problemas que se
presentarían si se tomara alguna caja
como representativa de todas las demás
4.- Ocasionalmente se dispone de la
información completa, por lo que no es
necesario muestrear.
MUESTREO ALEATORIO
Existen varios métodos para tomar una
muestra. Y quizá el más importante de
ellos es el “muestreo Aleatorio”. La
mayoría de las pruebas estadísticas que
consideraremos se basan en el muestreo
al azar.
Algunas veces de le conoce como
“muestreo aleatorio simple” para
diferenciarlo de otros tipos de muestreo
en que intervienen elementos del
muestreo al azar. En términos generales,
el muestreo aleatorio requiere que cada
“elemento” de una población tenga la
misma oportunidad de ser incluido en la
muestra.
Esto se puede interpretar de la siguiente
manera:
En el caso de poblaciones discretas, una
muestra aleatoria es aquella en la que
cada elemento de la población tiene la
misma oportunidad de ser incluido en la
muestra.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
10
En lo referente a poblaciones continuas,
una muestra aleatoria es aquella en que la
probabilidad de incluir cualquier intervalo
de valores en la muestra es igual al
porcentaje de la población que está
comprendida en dicho intervalo.
Una muestra aleatoria de una población
discreta sería entonces una muestra en la
que la probabilidad de obtener cualquiera
de los N elementos de la población en una
sola inspección es 1/N.
Esto también significa que grupos de
elementos tienen la misma oportunidad de
ser incluidos en la muestra que otros del
mismo tamaño. Por ejemplo, la
probabilidad de incluir dos elementos
cualesquier debe ser igual para todos los
grupos posibles de dos de ellos. Una
extensión de esto es que la probabilidad
de incluir un elemento que es miembro de
un subgrupo de la población en una
muestra aleatoria, es proporcional al
tamaño del subgrupo.
Los subgrupos grandes tendrán una
mayor probabilidad de contar con uno o
más elementos en una muestra que los
subgrupos pequeños, mientras que los de
igual tamaño tendrán probabilidades
iguales. Por tanto, el muestreo aleatorio
tiende a producir muestras
representativas.
Cabe observar que cuando se selecciona
una muestra al azar, el proceso de
selección es el que es aleatorio y no los
elementos de la muestra. Además, el
proceso no es de tanteo, el azar no debe
relacionarse con la casualidad, ya que esta
última no puede satisfacer necesariamente
una situación igual de probable.
OBTENCIÓN DE UNA MUESTRA
ALEATORIA.
Si una población objetivo es infinita,
como la producción futura de una
máquina, se puede considerar como un
proceso probabilístico. Anotando los
elementos en el orden en que ocurren, es
posible obtener una muestra que sea
representativa del proceso (es decir, una
muestra aleatoria).
En tanto que el proceso en consideración
se mantiene estable durante el periodo en
el que se hacen las observaciones. (de
manera que la probabilidad de cada
resultado posible permanece constante.),
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
11
es posible considerar el proceso y la
muestra resultante como aleatorias. Así es
exactamente como se consideran las
tiradas sucesivas de una moneda normal y
las de dados no cargados.
Algunos ejemplos de procesos que
generalmente se consideran aleatorios son
los tiempos de llegada de autos a una
caseta de cobro, llamadas telefónicas que
se reciben en un enorme conmutador, los
clientes en las cajas de un supermercado,
los tiempo de servicio en casetas de
cobro, conmutadores telefónicos y cajas
registradoras y la producción de cualquier
proceso mecánico
Si la población objetiva es finita,
esencialmente hay dos formas de
seleccionar una muestra aleatoria simple.
Un método consiste en elaborar una lista,
o “marco de referencia” de cada uno de
los elementos de la población, y aplicar
después un método aleatorio a la lista,
para seleccionar los elementos que se
habrán de muestrear.
El segundo método se utiliza cuando los
objetos que forman la población no se
identifican claramente, lo que imposibilita
un listado. Por ejemplo, en el
procesamiento de alimentos, eliminación
de desperdicios y control de la
contaminación suele no haber una idea
clara acerca de los elementos que se
pueden muestrear.
Una alternativa sería muestrear
situaciones en lugar de objetos, como “4
cm arriba y 17 cm abajo”. Esto se puede
llevar a cabo imaginando que la
población está compuesta de cubos y
posteriormente muestreándolos.
Otra posibilidad sería emplear cierto tipo
de proceso de mezclado, semejante al de
canicas en una urna. Claramente existe el
peligro de que este proceso no sea
completo, por lo que al final una muestra
no puede ser representativa. De este modo
es importante observar cuidadosamente
cómo se seleccionan los elementos y si
éstos son igual de probables.
La posibilidad de obtener una muestra
aleatoria verdadera es mucho mayor
cuando se puede listar cada uno de los
elementos. Ejemplos de los que se pueden
listar son los empleados de una compañía,
los inventarios de una fábrica, los
vehículos registrados en un Estado, los
alumnos de tercer año, los periódicos
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
12
disponibles en una biblioteca, los
miembros de una asociación, los registros
de la temperatura a las 6 de la mañana en
varias zonas del país, los anuncios
publicitarios, los cines de una ciudad, etc.
Cabe observar que una lista de los
elementos de una población generalmente
no se considera como un censo de ésta, ya
que sólo se indica un medio de
identificación de los elementos. Las
características de interés se deberán
obtener mediante el muestreo.
Así, una lista de periódicos no dice lo que
éstos contienen; una lista de los cines no
indica la cantidad de dinero recibido en
sus taquillas en la tercera semana de
Junio; una lista de alumnos de tercer año
no revela quienes de ellos tienen empleo
durante el verano; y una lista de
inventarios no establece los activos netos
de diversas compañías.
El único fin de la lista es el permitir
seleccionar elementos de una población
para su estudio subsecuente.
El proceso de selección consiste en
asignar números consecutivos a los
elementos listados y designar
aleatoriamente los números de aquellos
que serán incluidos en la muestra.
Conceptualmente, se pueden utilizar
cartas, dados o bolas numeradas para
generar números aleatorios que
correspondan a los números de nuestra
lista. Por ejemplo, si nuestra población
consta de 46 objetos, se pueden colocar
en una urna, bolas numeradas del 1 al 46
convenientemente mezcladas, y
seleccionar después una cada vez hasta
que el número de bolas seleccionadas
igualen el tamaño de muestra deseado.
Los números en éstas indicarán qué
elementos de la población serán incluidos
en la muestra.
En la práctica rara vez se utilizan tales
técnicas aleatorias, por múltiples razones.
Una razón es que cada idea deja algo que
desear; los métodos no son
completamente al azar. Las cartas, por
ejemplo, pueden pegarse, de manera que
al barajarse no se puede garantizar que
cada carta tiene una igual probabilidad de
ser sacada.
Las aristas de un par de dados pueden
estar gastadas, por lo que pueden influir
en el resultado a la hora de tirarlos.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
13
Además, siempre existe el peligro de que
en una urna con bolas, éstas no estén
perfectamente mezcladas. Sin embargo,
si se escoge una muestra grande, o si a
menudo surge la necesidad de seleccionar
muestras aleatorias de las listas, los
procedimientos en los que intervienen
naipes, dados o bolas numeradas tienden
a ser tediosos y tardados. Debido a estos
problemas y a que el muestreo aleatorio
es muy importante para la inferencia
estadística, se han elaborado tablas
especiales denominadas tablas de
números aleatorios, a fin de que sean
utilizadas en conjunción con algunas
formas de muestreo aleatorio.
TABLAS DE NÚMEROS
ALEATORIOS
Las tablas de números aleatorios
contienen los 10 dígitos 0, 1, 2,....., 7, 8,
9. Tales dígitos se pueden leer
individualmente o en grupos y en
cualquier orden, en columnas hacia abajo,
columnas hacia arriba, en fila,
diagonalmente, etc., y es posible
considerarlos como aleatorios.
Las tablas se caracterizan por dos cosas
que las hacen particularmente útiles para
el muestreo al azar. Una característica es
que los dígitos están ordenados de tal
manera que la probabilidad de que
aparezca cualquiera en un punto dado de
una secuencia es igual a la probabilidad
de que ocurra cualquier otro. La otra es
que las combinaciones de dígitos tienen la
misma probabilidad de ocurrir que las
otras combinaciones de un número igual
de dígitos.
Estas dos condiciones satisfacen los
requisitos necesarios para el muestreo
aleatorio, establecidos anteriormente. La
primera condición significa que en una
secuencia de números, la probabilidad de
que aparezca cualquier dígito en cualquier
punto de la secuencia es 1/10.
La segunda condición significa que todas
las combinaciones de dos dígitos son
igualmente probables, del mismo modo
que todas las combinaciones de tres
dígitos, y así sucesivamente.
Conceptualmente, las tablas de números
aleatorios se pudieron elaborar
numerando 10 bolas con los dígitos 0 –9
y sacándolas una por una de una urna,
anotando el resultado, regresándola a ésta,
sacando otra, etc., hasta que se haya
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
14
anotado un considerable número de
dígitos.
Realmente, existen métodos más eficaces
para generar números aleatorios, en
muchos de los cuales se utilizan
calculadoras u otra clase de aparatos
electrónicos. Las tablas elaboradas
mediante estos métodos son verificadas
completamente para asegurarse de que en
realidad sean aleatorias. Sin embargo, el
interés no radica en elaborar estas tablas
sino en utilizarlas.
Para ilustrar el uso de una tabla de
números aleatorios, supóngase que una
gran tienda desea seleccionar una gran
muestra aleatoria de 5 clientes, de una
lista de 830 personas que gozan de crédito
en esa tienda. El propósito de la muestra
cereal de estimar la frecuencia de
compras, para comprobar por qué las
personas abren cuentas de crédito, para
determinar la cantidad vendida en
promedio, o para descubrir los problemas
que podría generar el sistema.
Los clientes se pueden listar en orden
alfabético o por la fecha en que abrieron
sus cuentas. En realidad esto no tienen
importancia. Se pueden asignar
consecutivamente los números 000 a 829
a la lista, de arriba hacia abajo. Como la
identificación del elemento es un número
de tres dígitos, será necesario tomar
números de tres cifras de una tabla de
números aleatorios, de manera que se
puede establecer una correspondencia
entre ellos y los números listados.
Cualquier secuencia de tres dígitos
tomada de una tabla de números
aleatorios servirá. Si se utiliza la tabla
“6.1”................. y se toman los primeros
tres dígitos de la última columna de la
tabla, en sentido descendente estos dígitos
será, 473, 828, 920, 923, 380, 272,.....
Cuando se llega a un número como 920,
simplemente se descarta, ya que la
población escogida sólo alcanza hasta el
número 829. Asimismo, no se tomará en
cuenta cualquier número seleccionado
que aparezca más de una mes. El proceso
continúa hasta que se hayan obtenido 15
números, los cuales corresponderán a 15
elementos de la población. Una vez que
se tienen los 15 números, es posible
consultar nuevamente la lista y
seleccionar los 15 para un estudio
ulterior. (0,00,000, etc.)
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
15
Para hacer una tabla de números
aleatorios:
1.- Hacer una lista de los elementos de la
población.
2.- Numerar consecutivamente los
elementos de la lista, empezando con el
cero (ejemplo: 0, 00, 000, etc.)
3.- Tome los números de una tabla de
números aleatorios, de manera que la
cantidad de dígitos de cada uno sea igual
a la del último elemento numerado de su
lista. De ese modo, si el último número
fue 18, 56 ó 72, se deberá tomar un dígito
de dos números.
4.- Omita cualquier dígito que no
corresponda con los números de la lista o
que repita cifras seleccionadas
anteriormente de la tabla. Continúe hasta
obtener el número de observaciones
deseado.
5.- Utilice dichos números aleatorios para
identificar los elementos de la lista que se
habrán de incluir en la muestra.
Si se cuenta con una lista exacta de los
elementos de la población, entonces es
relativamente sencillo seleccionar una
muestra aleatoria utilizando una tabla de
números aleatorios. De hecho, la lista no
necesariamente debe estar constituida
sólo por elementos.
Las situaciones o localizaciones de los
elementos pueden servir como una
posible alternativa. Así, a veces la
localización sobre una cuadrícula o un
mapa de secciones de una ciudad o de un
Estado, y el archivo de la oficina se puede
utilizar en lugar de los objetos en sí.
Existen ciertas situaciones en que puede
ser engañoso el uso de listas,
particularmente si son incompletas o
anticuadas. Cuando alguno de los
elementos de la población no se encuentra
en la lista, todos los que forman la
población no tienen la misma
probabilidad de ser incluidos en la
muestra ( los excluidos tienen cero
probabilidades de ser incluidos en la
muestra). Lo anterior, viola un requisito
del muestreo aleatorio.
En ocasiones no se puede disponer de una
lista y sería muy costoso y tardado hacer
una completa. Por ejemplo, no existe una
lista de cada mexicano o una lista de cada
fumador de cigarros que hay en
Tapachula o una lista de cada cliente de
un gran Centro Comercial en la Ciudad de
México. En ejemplos como éstos, se
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
16
puede utilizar otros tipos de técnicas de
muestreo.
TABLA DE NÚMEROS ALEATORIOS
Se hace en excel (anexar)
Ejercicios de muestreo aleatorio:
1.- Los directivos del torneo de futbol
quieren poner aleatoriamente en pares 20
equipos para empezar el campeonato.
Describir cómo utilizar una tabla de
números aleatorios para determinar las
parejas para los juegos iniciales. ¿podría
utilizarse la tabla para subsecuentes
emparejamientos? ¿cómo?.
2.- Una lista contiene 8000 nombres y
direcciones, están numerados
consecutivamente empezando del número
1. Describir cómo utilizar una tabla de
números aleatorios para obtener una
muestra de 28 nombres.
a) ¿Cuántos dígitos por nombre debe
leer?
b) ¿Cómo decidir en dónde empezar?
c) ¿Qué efecto, de haberlo,
provocaría en el planteamiento el
hecho de que los nombres fueran
numerados sólo por pares?
(2,4,6,.....)?
3.- Una empresa desea conocer el sentir
público hacía cierto producto que vende.
En una sección de la ciudad hay 48
cuadras o manzanas de casas con 13 casas
cada una.
a) Formular un método de dos
etapas para muestrear
aleatoriamente, seleccionando
primero 10 cuadras y después una
casa de cada una de las 13.
b) Suponer que se utiliza un plan de
una etapa, (esto es, se seleccionan
directamente 13 casas)
1) ¿Qué problema surgiría al
selecciona las casas?
2) ¿Cómo cambiaría el uso de
la tabla de números
aleatorios?
4.- Los alumnos de una Universidad
tienen matrículas numeradas en forma
consecutiva del 301 al 2,375. Seleccionar
aleatoriamente un comité de orden y
limpieza formado por 15 alumnos.
Utilizar la tabla de números aleatorios
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
17
para seleccionar los números de las
matrículas.
OTROS METODOS DE MUESTREO
Existen numerosos procedimientos de
muestreo, diferentes a los del muestreo
aleatorio simple, que resultan útiles al
reunir información de muestras. Algunos
de éstos se mencionarán a continuación
para ilustrar ciertas extensiones del
muestreo aleatorio al azar. Se advierte
que se requiere de una planificación
cuidadosa y de un conocimientos amplio
para emplear correctamente éstas técnicas
de muestreo , especialmente para
determinar qué elementos de una
población muestrear y decidir cómo
interpretar los resultados muestrales.
PROBABILIDAD Y MUESTREO
PROBABILÍSTICO
Los procedimientos de muestreo
probabilístico están diseñados de manera
que se conozca la probabilidad de todas
las combinaciones muestrales posibles.
Por lo anterior, se puede determinar la
cantidad de variabilidad del muestreo
aleatorio.
En estas condiciones el muestreo es
objetivo y se puede obtener rápidamente
una estimación de los errores de éste. El
muestreo al azar es un ejemplo del
muestreo probabilístico. El no
probabilístico se refiere a un muestreo
subjetivo o de juicios, en el que no se
puede establecer la variabilidad del
muestreo con exactitud.
Por consecuencia, no es posible estimar el
error de muestreo (es decir, la
variabilidad de la muestra. Lo importante
es que el muestreo probabilístico se debe
emplear siempre que sea posible. Sin
embargo, existen algunos ejemplos en los
que el muestreo no probabilístico
proporciona una cruda pero útil
alternativa para el muestreo de
probabilidad.
MUESTREO DE JUICIOS
Si el tamaño de la muestra es muy
pequeño, digamos cinco elementos, el
muestreo aleatorio puede producir
resultados que no sean representativos,
mientras que una persona que esté
familiarizada con la población puede ser
capaz de especificar qué elementos son
los más representativos de ésta.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
18
Por ejemplo, una cadena de restaurantes
desea introducir una nueva técnica de
servicio, utilizando bandejas de servicio
especiales. Las consideraciones de costos
pueden indicar que sólo dos restaurantes
se utilizarán en el estudio.
Estos pueden diferir considerablemente
en términos del tamaño, localización,
clientela y rentabilidad. En lugar de hacer
pruebas para determinar cuál de los
restaurantes utilizar, resulta más prudente
basarse en el conocimiento de sus
administradores sobre las condiciones de
los restaurantes, para elegirlos.
De vez en cuando los elementos de la
muestra se agrupan convenientemente.
Las investigaciones médicas se deben
llevar a cabo con pacientes dispuestos o
quizá individuos que se presenten
voluntariamente al estudio. Ningún
grupo se puede considerar como una
muestra aleatoria del público en general y
sería peligroso intentar deducir
conclusiones con respecto a éste con base
en dicho estudio.
Sin embargo, los resultados pueden
proporcionar alguna idea que se puede
utiliza al llevar a cabo una muestra de
probabilidad para hacer válidos los
resultados básicos. Los peligros
inherentes en la investigación médica, así
como en otros tipos de investigación, a
menudo requieren que se limite la
investigación inicial a un pequeño grupo
de voluntarios.
Otros ejemplos semejantes pueden ser
pacientes con enfermedades mortales,
cadáveres, animales, etc. Finalmente, el
muestreo mediante juicio deberá ser muy
rápido y menos costoso que el muestreo
aleatorio ya que no es necesario elaborar
una lista de elementos de la población.
Será conveniente tener en mente que el
muestreo de juicio no permite una
afirmación objetiva del error de muestreo,
por lo que es necesario utilizar el
muestreo de probabilidad siempre que sea
posible.
MUESTREO PROBABILÍSTICO
Definiremos tres tipo de muestreo
probabilístico: El sistemático, es
estratificado y el de agrupación.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
19
El muestreo sistemático es muy semejante
al muestreo aleatorio simple. Requiere del
uso de una lista de los elementos de la
población y por tanto, presenta los
mismos tipos de problemas que se
mencionaron anteriormente, en lo que
respecta a las listas del muestreo aleatorio
simple.
Si los elementos de la lista no están
dispuestos en un orden particular, el
muestreo sistemático puede dar lugar a un
muestreo aleatorio, muestreando cada
elemento k-ésimo de la lista, en el cual se
obtiene k, dividiendo el tamaño el tamaño
de la población entre el tamaño de la
muestra (esto es, k = N /n).
De este modo, si N es igual a 200 y n es
igual a 10, entonces K = 200/10 = 20.
Esto significa que se muestreará un
elemento de cada secuencia de 20. Se
puede consultar una tabla de números
aleatorios para determina dónde empezar
en el primer grupo, y posteriormente cada
uno de los elementos k-ésimo será
muestreado.
Por ejemplo, si la tabla de números
aleatorios indica 09, entonces se deberá
seleccionar el noveno elemento, después
el elemento 29º (esto es, 9 + 20), 49 (es
decir, 29 + 20), el 69º , etc. Es
conveniente asegurarse de que los
elementos de la lista no aparezcan en ésta
en forma agrupada o periódica. De este
modo, los nombres seleccionados
alfabéticamente pueden agruparse, dado
que diversos nombres étnicos empiezan
con ciertas letras o combinaciones de
ellas.
Por otra parte puede ser arriesgado
seleccionar casas para hacer una muestra,
cuando la lista se basa en el orden en que
están ubicadas en una calle, ya que un
número igual de éstas en cada manzana
puede significar que la casa de la esquina
o la que está a la mitad de la cuadra se
encontrará cada k-ésimo elemento.
Una casa de una esquina puede tener un
valor catastral muy alto, impuestos más
elevados, más ruido, etc., lo que quiere
decir que sus ocupantes podrían tener
mayor salario, estar más preocupados por
los impuestos, ser más duros de oído, etc.,
mientras que los que viven en casas del
interior pueden mostrar características un
poco diferentes.
El muestreo estratificado: comprende el
dividir la población en subgrupos
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
20
(estratos) de elementos semejantes y
muestrear después en cada subgrupo. El
razonamiento es que mediante el
ordenamiento de los elementos de la
población en subgrupos homogéneos, la
variabilidad es menor que la de la
población total, y por ello se necesitará un
tamaño de muestra más pequeño. Este
concepto se puede visualizar fácilmente al
considerar un caso extremo: supóngase
que los elementos de cada estrato son
idénticos. En ese evento, una sola
observación de cada subgrupo señalará
cómo es cada subgrupo.
De esta manera, cuanto más semejantes
sean los elementos en cada estrato, tanto
menor será el tamaño de la muestra
requerida.
El muestreo dentro de cada estrato
generalmente es al azar, pero a veces es
útil un censo para algunos de los
subgrupos. Ejemplo: en un estudio de
sistemas de inventario, no es difícil
descubrir que el 10% de los objetos que
se manejan en el almacén de una
compañía constituyen más de 60% del
valor del inventario, y que el otro 90%
comprende menos del 40% del valor de
éste.
Dado que son pocos los artículos que
pertenecen a la clase de valor alto, es
comprensible levantar un censo completo
de ellos, pero tomar solamente una
muestra aleatoria de los otros subgrupos
que presentan gran cantidad de artículos
de menor valor.
Otros ejemplos del uso del muestreo
estratificado pueden se el estudio de la
cantidad de tiempo que individuos de
diferentes categorías de ingreso dedican a
diversas actividades en sus ratos de ocio,
o quizá el porcentaje de dinero que gastan
en actividades recreativas, o el tipo de
vacaciones que prefieren, o la frecuencia
con las que las toman. Un estudio del
volumen de ventas y gastos de publicidad
puede también da lugar a un muestreo
estratificado si son muchas las compañías
que intervienen.
El muestreo de acumulación comprende
el ordenar los elementos de una población
en subgrupos heterogéneos que sean
representativos de la población total.
Idealmente, cada acumulación se puede
considerar como una minipoblación. De
hecho, si fuese perfecta y cada
acumulación exactamente igual a la otra
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
21
(y así la población principal), sería
necesario examinar solamente una
acumulación individual para saber cómo
es la población.
Sin embargo, esto rara vez ocurre en la
práctica, ya que las acumulaciones suelen
ser grupos de elementos estrechamente
relacionados entre sí, como unidades
familiares, manzanas de casas, ciudades,
etc. Con mucha frecuencia, tales
subgrupos son casi homogéneos y son
escogidos más por facilidades
administrativas y ahorro de costos que
por sus características heterogéneas.
Generalmente es poco práctico o
imposible ordenar los elementos en
subgrupos heterogéneos. En
consecuencia, se debe muestrear un
mayor número de acumulaciones para
superar esta limitación.
El muestreo de acumulación presenta dos
ventajas muy diferentes con respecto al
muestreo aleatorio. Una de ellas es que si
los elementos de una población están
ampliamente dispersos, una muestra
aleatoria puede comprender viajes y
costos considerables para llevarse a cabo
adecuadamente, mientras que los
elementos en cada acumulación están
muy cercanos entre sí.
Ejemplo: suponer que la población de
interés son los dueños de automóviles del
estado de México. Sin duda que una
muestra aleatoria simple incluiría
propietarios que estarían completamente
dispersos por todo el Estado. Sería muy
difícil coordinar y estandarizar la
recopilación de datos. Las acumulaciones
de Estados o ciudades, por otra parte,
presentan propietarios de automóviles en
un área concentrada y la recopilación de
datos sería muy costosa y la coordinación
mucho más sencilla. Además mediante
acumulaciones de todo el Estado,
seleccionadas al azar se podría obtener
una muestra que quizá fuera
representativa de la población.
El muestreo dentro de cada acumulación
podría comprender el muestreo aleatorio,
estratificado o de más acumulaciones, ya
que el número de propietarios, aún dentro
del Estado o ciudad, sería demasiado
grande como para intentar un censo.
Una adicional ventaja del muestreo de
acumulación es que no se requiere de una
lista de los elementos de la población.
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
22
Bastará con tener una lista de las
acumulaciones. De este modo, no se
podría obtener fácilmente una lista de
todos los propietarios de casas de México,
no así una lista por Estados o ciudades o
aún de pueblos. O bien, se podrían
realizar las acumulaciones por manzanas
o cuadras de cada ciudad.
En tanto que no se podría disponer de
listas de las casas de una ciudad, a
menudo se pueden identificar y
seleccionar mediante mapas las diferentes
manzanas de éstas. Así es posible visitar
las manzanas escogidas e identificar las
casas para el muestreo.
Frecuentemente, un método de muestreo
incorpora varios de estos procedimientos.
Ejemplo: los elementos de una población
pueden ser personas que viven en cierto
Estado el cual puede estar dividido en
municipios (acumulaciones), y es posible
realizar una selección aleatoria de ellos
para un estudio ulterior.
Los municipios seleccionados se pueden
dividir en áreas metropolitanas y rurales
(estatificadas). Las zonas metropolitanas
se pueden estratificar posteriormente en
zonas comerciales y residenciales o en
áreas interiores y suburbanas. Los
diferentes estratos se pueden seleccionar
al azar, dividirlos en acumulaciones o
estratificarlos aún más y después efectúa
un muestreo o un censo. Evidentemente,
el proceso se puede tornar muy
complicado.
RESUMEN
El objetivo del muestreo es poder hacer
inferencias con respecto a una población
después de inspeccionar solamente una
parte de ésta. Factores como el costo, el
tiempo, los ensayos destructivos y las
poblaciones infinitas hacen que se
prefiera más el muestreo que llevar a cabo
un estudio completo (censo) de la
población.
Se espera que una muestra sea
representativa de la población de la cual
ha sido tomada. El potencial para llevar a
cabo este fin es bueno cuando la muestra
es aleatoria. En el caso de poblaciones
discretas, el término “aleatorio” significa
que cada elemento de la población tienen
la misma probabilidad de ser incluido en
una muestra, para poblaciones continuas,
significa que la probabilidad de incluir
cualquier valor en un intervalo dado es
Jorge Eduardo Mina Rizo Facultad de Contaduría Pública. Campus IV
23
igual a la proporción de la población que
presenta valores en ese intervalo.
Las muestras al azar se pueden obtener
mediante a) un proceso de mezclado,
como el de barajar cartas, b) el uso de la
producción de cierto proceso mecánico, o
bien c) el empleo de una tabla de números
aleatorios para seleccionar elementos de
una lista.
En ciertas condiciones las variantes del
muestreo aleatorio simple, como el
muestreo sistemático (periódico),
estratificado (subgrupos homogéneos) y
de acumulación (subgrupos
convenientes), pueden ser más eficaces.
La principal ventaja del muestreo al azar
es que se puede determinar el grado de
variabilidad del muestreo, lo cual es
esencial para la inferencia estadística. El
muestreo no probabilístico carece de esta
característica, aunque a veces se le utiliza
por otros motivos.
TEMAS DE REPASO:
1.- En qué circunstancias es preferible un
muestreo a un censo completo?
2.- Cuando es preferible un censo a una
muestra?
3.- Definir “muestra aleatoria”
4.- Escribir los diferentes métodos para
obtener una muestra aleatoria.
Como se sabría qué métodos utilizar
en determinada situación?
5.- Qué es la tabla de números aleatorios?
Cómo se utiliza junto con el muestreo
al azar?
6.- Explicar brevemente las características
principales de cada uno de los
siguientes tipos de muestreo
a) Muestreo de acumulación
b) Muestreo estratificado
c) Muestreo sistemático
7.- Qué es el muestreo de juicio y en qué
tipo de circunstancias se debe utilizar?
8.- Que es el muestreo de la probabilidad,
y cuando se debe utilizar?