tema-4 (79).pdf
TRANSCRIPT
Parte 11
EVALUACIÓN DE LAS PROPIEDADES MÉTRICAS DE LOS INSTRUMENTOS
DE MEDICIÓN PSICOLÓGICA
ITEMA 4
LA FIABILIDAD DE LAS PUNTUACIONES
Enrique Vila Abad
¡suMARIO
1. Orientaciones didácticas 2. El problema del error de medida 3. El modelo lineal de Spearman 4. Tests paralelos. Condiciones de paralelismo 5. Interpretación teórica del coeficiente de fiabilidad 6. Tipos de errores de medida 7. Factores que afectan a la fiabilidad
7.1. Longitud del test 7.2. Variabilidad de la muestra
8. La fiabilidad como equivalencia y como estabilidad de las medidas 8.1. Método de las formas paralelas 8.2. Método test-retest
9. La fiabilidad como consistencia interna 9.1. Métodos basados en la división del test en dos mitades
9.1 .1 . Spearman-Brown 9.1.2. Rulan 9.1.3. Guttman-Fianagan
9.2. Métodos basados en la covariación entre los ítems 9.2.1. Coeficiente alfa (a) de Cronbach
9.2.1.1. Estimador insesgado de a 9.2.1.2. El coeficiente a como límite inferior del coeficiente
de fiabilidad 9.2.1.3. Inferencias sobre a
9.2 .2. Casos particulares del coeficiente a 9.3. Coeficientes basados en el análisis factorial de los ítems : Theta (8) y
Omega (Q)
9.4 . El coeficiente beta(~) de Raju 1 O. Estimación de la puntuación verdadera de los sujetos en el atributo de in-
terés 11. Fiabilidad de una batería de tests 12. Ejercicios de autoevaluación 13. Soluciones a los ejercicios de autoevaluación 14. Apéndice 15 . Bibliografía complementaria
d
ad de las medidas
mitades
inferior del coeficiente
de los ítems: Theta (8) y
jetos en el atributo de in-
1. ORIENTACIONES DIDÁCTICAS
En los temas anteriores se han expuesto los principios básicos para la construcción de tests y las principales técnicas de construcción de escalas de actitudes; se cumple así la primera etapa de la construcción de los instrumentos de medición psicológica. Hasta el momento, se cuenta con una prueba piloto que se ha aplicado a una muestra de sujetos a los que se les han asignado sus puntuaciones correspondientes. Vamos a comenzar ahora el estudio de la segunda parte del proceso, la evaluación de la calidad métrica de la prueba piloto y la construcción del instrumento de medición definitivo.
Hemos intentado aclarar, en cierta medida, los distintos términos utilizados en relación con estos instrumentos: tests, escalas, cuestionarios, etc.; sin embargo, a partir de este momento, y teniendo en cuenta que la forma de llevar a cabo la evaluación de la calidad métrica es la misma, vamos a seguir las mismas normas que en los Standards for Educational and Psychological Testing (AERAIAPAINCME/ 1999) que utilizan el término test para referirse a todos estos instrumentos de evaluación.
Esta fase de evaluación de la calidad del test debería comenzar por el análisis de la calidad de los ítems ya que, como se ha comentado con anterioridad, dado que los ítems son las unidades elementales del test, difícilmente se podrá contar con un buen test si los ítems que lo forman son de mala calidad. Durante el proceso de construcción de la prueba inicial se ha explicado la forma de llevar a cabo una parte del análisis de los ítems a partir de la revisión crítica del contenido de los mismos por un grupo de expertos o jueces; sin embargo, quedaría por hacer otro tipo de análisis que no estuviera basado en juicios subjetivos, sino un análisis objetivo basado en las respuestas que han emitido los suje-
171
1 PSICOMETRÍA
tos a los ítems. Dado que para llevar a cabo este tipo de análisis es necesario que nuestros alumnos se hayan familiarizado con los conceptos de validez y fiabilidad, entre otros, el tema dedicado al análisis de los ítems se expondrá más adelante.
Una vez evaluada la calidad de los ítems del test y eliminados aquellos que no se consideran adecuados, el paso siguiente será la evaluación de la calidad global del test que incluye, entre otras cosas, la evaluación de la precisión y estabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas a partir de las puntuaciones obtenidas (validez).
En este tema se analiza el problema de la fiabilidad y precisión de la medida, tratando de encontrar respuesta a la pregunta de hasta qué punto las puntuaciones obtenidas por los sujetos en la prueba que se les ha aplicado están afectadas por errores de medida y en qué cuantía. El tema siguiente está dedicado al estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).
Comenzamos el tema con una alusión al problema del error de medida, centrándonos en los errores aleatorios y en cómo el modelo lineal propuesto por Spearman intenta buscar soluciones a esta cuestión. Seguidamente presentamos los distintos tipos de errores aleatorios con los que nos podemos encontrar al aplicar un instrumento de medición.
A continuación, introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente de fiabilidad, haciendo mención de los distintos factores que pueden influir en su cuantía como pueden ser la longitud del test y las características de la muestra a la que se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos permitan estimarlo: el método de las formas paralelas, el método test-retest y los métodos basados en la consistencia interna del test; indicando cómo se deben interpretar los coeficientes obtenidos. A continuación se presentan tres procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o característica que mide el test (su puntuación verdadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapié en los si-guientes puntos básicos:
172
Conocer los supuestos básicos del modelo lineal de Spearman así como las deducciones que se puedan hacer a partir de esos supuestos .
Tener muy claros los conceptos de error de medida y fiabilidad .
Saber diferenciar los distintos tipos de error de medida.
Conocer la influencia que pueden tener en el coeficiente de fiabilidad
2. E -Ur
fiabil carac be me medi1 un ce
Si termi puntL obser por e1 pacid del in sible, rea l s
1 PSICOMETRÍA
tos a los ítems. Dado que para llevar a cabo este tipo de análisis es necesario que nuestros alumnos se hayan familiarizado con los conceptos de validez y fiabilidad, entre otros, el tema dedicado al análisis de los ítems se expondrá más adelante.
Una vez evaluada la calidad de los ítems del test y eliminados aquellos que no se consideran adecuados, el paso siguiente será la evaluación de la calidad
global del test que incluye, entre otras cosas, la evaluación de la precisión y estabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas a partir de las puntuaciones obtenidas (validez) .
En este tema se analiza el problema de la fiabilidad y precisión de la medida, tratando de encontrar respuesta a la pregunta de hasta qué punto las puntuaciones obtenidas por los sujetos en la prueba que se les ha aplicado están afectadas por errores de medida y en qué cuantía. El tema siguiente está dedicado al estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).
Comenzamos el tema con una alusión al problema del error de medida, centrándonos en los errores aleatorios y en cómo el modelo lineal propuesto por
Spearman intenta buscar soluciones a esta cuestión. Seguidamente presentamos los distintos tipos de errores aleatorios con los que nos podemos encontrar al aplicar un instrumento de medición.
A continuación, introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente de fiabilidad, haciendo mención de los distintos factores que pueden influir en su cuantía como pueden ser la longitud del test y las características de la muestra a la que se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos permitan estimarlo: el método de las formas paralelas, el método test-retest y los métodos basados en la consistencia interna del test; indicando cómo se deben interpretar los coeficientes obtenidos.
A continuación se presentan tres procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o característica que mide el test (su puntuación verdadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapié en los si-guientes puntos básicos:
172
Conocer los supuestos básicos del modelo lineal de Spearman así como las deducciones que se puedan hacer a partir de esos supuestos.
Tener muy claros los conceptos de error de medida y fiabilidad .
Saber diferenciar los distintos tipos de error de medida.
Conocer la influencia que pueden tener en el coeficiente de fiabilidad
2. 1
f iab car< ben
un
ter pu ob pe pa dE sil re
1 PSICOMETRÍA
tos a los ítems. Dado que para llevar a cabo este tipo de análisis es necesario que nuestros alumnos se hayan familiarizado con los conceptos de validez y fia
bilidad, entre otros, el tema dedicado al análisis de los ítems se expondrá más adelante.
Una vez evaluada la calidad de los ítems del test y eliminados aquellos que no se consideran adecuados, el paso siguiente será la evaluación de la calidad global del test que incluye, entre otras cosas, la evaluación de la precisión y estabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas a partir de las puntuaciones obtenidas (validez).
En este tema se analiza el problema de la fiabilidad y precisión de la medida,
tratando de encontrar respuesta a la pregunta de hasta qué punto las puntuaciones obtenidas por los sujetos en la prueba que se les ha aplicado están afectadas por errores de medida y en qué cuantía. El tema siguiente está dedicado al estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).
Comenzamos el tema con una alusión al problema del error de medida, centrándonos en los errores aleatorios y en cómo el modelo lineal propuesto por Spearman intenta buscar soluciones a esta cuestión. Seguidamente presentamos los distintos tipos de errores aleatorios con los que nos podemos encontrar al aplicar un instrumento de medición.
A continuación, introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente de fiabilidad, haciendo mención de los distintos factores que pueden influir en su cuantía como pueden ser la longitud del test y las características de la muestra a la que se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos permitan estimarlo: el método de las formas paralelas, el método test-retest y los métodos basados en la consistencia interna del test; indicando cómo se deben interpretar los coeficientes obtenidos. A continuación se presentan tres procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o característica que mide el test (su puntuación verdadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapié en los siguientes puntos básicos:
172
Conocer los supuestos básicos del modelo lineal de Spearman así como las deducciones que se puedan hacer a partir de esos supuestos.
' Tener muy claros los conceptos de error de medida y fiabilidad .
Saber diferenciar los distintos tipos de error de medida.
Conocer la influencia que pueden tener en el coeficiente de fiabilidad
~ e p p d si rE
de análisis es necesario
'"""'L'"''"' de validez y fiaítems se expondrá más
eliminados aquellos que evaluación de la calidad ción de la precisión y eslas inferencias realizadas
y precisión de la medida, qué punto las puntuacio-
aplicado están afecta
iguiente está dedicado al referidos al criterio (TRC).
del error de medida, ceno lineal propuesto por idamente presentamos podemos encontrar al
de la Teoría Clásica de los de los distintos factores
longitud del test y las cado la necesidad de estamaria: el método de las sados en la consistencia coeficientes obtenidos. rmitirán estimar el nivel test (su puntuación ver-
hagan hincapié en los si-
al de Spearman así como
esos supuestos.
ida y fiabilidad.
coeficiente de fiabilidad
LA FIABILIDAD DE LAS PUNTUACIONES 1
factores como la longitud del test y la variabilidad de la muestra de sujetos a los que se aplica.
Conocer los procedimientos empíricos para estimar el coeficiente de fiabilidad.
Diferenciar entre la fiabilidad como estabilidad temporal de las puntuaciones obtenidas en el test y como consistencia interna de los ítems del
test.
Diferenciar entre los distintos procedimientos para estimar la puntuación verdadera de un sujeto en un test.
Nota: Para aquellos lectores interesados, al final del tema se incluye un Apéndice en el que se ofrecen las demostraciones de las fórmulas que irán apareciendo a lo largo del mismo.
2. EL PROBLEMA DEL ERROR DE MEDIDA
Uno de los requisitos fundamentales en cualquier teoría de la medición es la fiabilidad y precisión de los instrumentos utilizados para medir una determinada característica. La medición en Psicología no está exenta de este requisito y debemos contar con instrumentos que sean fiables y, por consiguiente libres, en la medida de lo posible, de errores de medida. El concepto de error de medida es un concepto básico en Psicometría.
Se define el error de medida como la diferencia entre la puntuación empírica
obtenida por un sujeto en un test y su puntuación verdadera, entendiendo por test
cualquier instrumento de medición psicológica.
Si aplicáramos «n » veces un test a un mismo sujeto, con la finalidad de determinar su capacidad en una determinada característica, es casi seguro que las puntuaciones obtenidas por ese sujeto serían muy parecidas pero nunca iguales observándose que, en algunos casos, el valor de la puntuación empírica estará por encima de la puntuación verdadera del sujeto, la que realmente indica la capacidad que tiene, y en otros por debajo. En cualquier caso será responsabilidad del investigador construir pruebas que den lugar al mínimo error de medida posible, y que la puntuación obtenida proporcione el mayor grado de información real sobre la característica objeto de estudio.
1 PSICOMETRÍA
A veces, los errores de medida no son debidos al propio instrumento de medición sino a cambios que operan en el propio sujeto y que pueden ser atribuidos a diversas razones: su motivación cuando realiza la prueba, que conteste al azar algunos de los ítems, las condiciones físicas en que se encuentre, etc. Éstos son errores de carácter aleatorio e impredecibles, con los que hay que contar y tratar de controlar para que no interfieran de manera significativa en las predicciones que podamos hacer acerca de su capacidad. Son los errores de los que se va a ocupar la fiabilidad. En el apartado 6 veremos con más detalle los distintos tipos de errores de medida que existen .
De lo dicho hasta ahora se puede deducir, en primer lugar, que si aplicamos repetidas veces un mismo test a un sujeto, lo más probable es que obtengamos puntuaciones distintas en las diferentes aplicaciones y, en segundo lugar, que cuando un sujeto obtiene una puntuación en un test, dicha puntuación estará afectada por errores de medida. Este hecho nos lleva a plantearnos la siguiente pregunta: ¿cómo podemos saber cuál es el valor real del sujeto en la característica que estamos estudiando? Para ello, hay que acudir a alguna de las teorías que se han ido desarrollando y que nos van a proporcionar los medios para hacer estimaciones acerca de la cuantía de error que afecta a las puntuaciones empíricas y acerca del verdadero nivel del sujeto (o sujetos) en la característica que se está midiendo.
Dado que este texto está dedicado, fundamentalmente, a la Teoría Clásica de los Tests, el modelo (teoría) que se estudiará es el modelo lineal propuesto por Spearman. Este modelo establece que la puntuación empírica obtenida por los sujetos cuando se les aplica un test es función lineal de su puntuación verdadera en el rasgo que se intenta medir y un componente de error, tal y como se especificará en el siguiente apartado.
3. El MODELO LINEAL DE SPEARMAN
El modelo lineal de Spearman, establece que la puntuación empírica obtenida por un sujeto en un test (X) puede considerarse como una combinación lineal de dos componentes: por una parte, la puntuación verdadera (V) de ese sujeto en el rasgo que mide el test, y por otra, el error de medida (f) que la afecta. Así pues, podemos establecer la ecuación del modelo en los siguientes términos:
X= V+ E [4 .1]
174
)pío instrumento de me, que pueden ser atribui
l prueba, que conteste al 2 se encuentre, etc. Éstos
los que hay que contar y gnificativa en las predic)n los errores de los que con más detalle los dis-
r lugar, que si aplicamos )able es que obtengamos
y, en segundo lugar, que dicha puntuación estará plantearnos la siguiente 1 sujeto en la caracterís
alguna de las teorías que los medios para hacer eslas puntuaciones empíri
la característica que se
nte, a la Teoría Clásica de lo lineal propuesto por pírica obtenida por los
su puntuación verdadera , tal y como se espe-
ación empírica obtenida na combinación lineal de
ra (V) de ese sujeto en
ida (f ) que la afecta. Así
los siguientes términos:
[4.1]
LA FIABILIDAD DE LAS PUNTUACIONES 1
Como se puede deducir de esta expresión, si aplicamos un test a un sujeto la puntuación que obtenga en el test, no coincidirá con el valor de la puntuación verdadera . Como en cualquier proceso de medición hemos de tener en cuenta la presencia del error de medida cometido.
El modelo asume una serie de supuestos:
Primer supuesto. La puntuación verdadera (V) es la esperanza matemática de la puntuación empírica (X). Esto quiere decir que si a un sujeto se le pasara un número infinito de veces un mismo test, y suponiendo que las aplicaciones fueran independientes entre sí de manera que la puntuación obtenida por dicho sujeto en una de las aplicaciones no estuviera influyendo en la obtenida en las demás, la media de todas las puntuaciones observadas (X) sería la puntuación verdadera del sujeto.
V= E(X) [4.2]
Segundo supuesto. La correlación existente entre las puntuaciones verdaderas de «n» sujetos en un test y los errores de medida es igual a cero. Es decir, no existe relación entre los errores de medida y las puntuaciones verdaderas.
[4.3]
Tercer supuesto. La correlación entre los errores de medida (re1e) que afectan
a las puntuaciones de los sujetos en dos tests diferentes (X 7 y X2 ) es igual a cero. Si «e 7» representa los errores de medida de las puntuaciones de «n » sujetos en el test 1 y «e2 » representa los errores de medida de las puntuaciones de los mismos sujetos en el test 2 el supuesto implica que no existe ninguna razón para presuponer que los errores de medida cometidos en un test vayan a influir, positiva o negativamente, en el otro test, siempre y cuando los tests se apliquen correctamente.
[4.4]
A partir de estos tres supuestos del modelo se pueden hacer las siguientes deducciones:
a) El error de medida se define como la diferencia entre la puntuación empírica obtenida por un sujeto y su puntuación verdadera.
175
1 PSICOMETRÍA
[4.5]
b) La esperanza matemática de los errores de medida es cero.
E(e) =O [4.6]
e) La media de las puntuaciones empíricas es igual a la media de las puntuaciones verdaderas.
X=V [4.7]
d) La covarianza entre las puntuaciones verdaderas y los errores es igual a cero.
Cov (V, E)= O [4.8]
e) La varianza de las puntuaciones empíricas es igual a la suma de la varianza de las puntuaciones verdaderas más la varianza de los errores.
[4.9]
f) La covarianza entre las puntuaciones empíricas y las verdaderas es igual a la varianza de las puntuaciones verdaderas.
[4.1 O]
g) La correlación entre las puntuaciones empíricas y los errores es igual al cociente entre la desviación típica de los errores y la desviación típica de las puntuaciones empíricas.
[4.11]
176
[4.5]
a es cero.
[4.6]
a la media de las pun-
[4.7]
os errores es igual a cero.
[4.8]
gual a la suma de la vari anza de los errores.
[4.9]
las verdaderas es igual a
[4 .10]
y los errores es igual al y la desviación típica de
[4 .11]
LA FIABILIDAD DE LAS PUNTUACIONES 1
h) La covarianza entre las puntuaciones empíricas de dos tests es igual a la covarianza entre las puntuaciones verdaderas.
Cov (X 7, X2) = Cov (V7, V2) J [4.12]
=·~ :;n:~::;:::::_-~-~:;,;:;""" ·
4. TESTS PARALELOS. CONDICIONES DE PARALELISMO
Si a una misma muestra de sujetos se le aplican dos tests, X y X', podemos considerar que son paralelos si, además de cumplirse los supuestos anteriores, se cumplen las dos condiciones siguientes:
1. Las puntuaciones verdaderas de los sujetos son iguales en ambos tests.
Según el modelo lineal podemos establecer:
X= V+ E X'= V+ E'
2. La varianza de los errores de medida es la misma en ambos tests:
De las condiciones de paralelismo enunciadas podemos sacar una serie de deducciones importantes dentro del modelo clásico.
a) La media de las puntuaciones empíricas obtenidas en dos tests supuestamente paralelos es la misma.
Teniendo en cuenta que la esperanza matemática de los errores de medida es cero y que las puntuaciones verdaderas de los sujetos son iguales en ambos tests, podemos concluir la existencia de igualdad entre las medias de las puntuaciones empíricas.
- - - -X=V+E=V
x' = v + fi= v
177
1 PSICOMETRÍA
b) Las varianzas de las puntuaciones empíricas obtenidas en dos tests paralelos son iguales.
S~ = S~. 52 =52 + 52
X V e
Teniendo en cuenta, por definición de tests paralelos, que la varianza de
los errores es la misma, podemos concluir que las varianzas de las puntuaciones empíricas snn iguales.
e) La correlación entre las puntuaciones empíricas obtenidas en dos tests
paralelos (rxx'l es igual al cuadrado de la correlación entre las puntuaciones empíricas y las puntuaciones verdaderas (r~vl o bien, al cociente entre la varia11za de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas.
[4.13]
d) Dados dos o más tests paralelos, las intercorrelaciones entre cada dos de ellos son iguales.
[4.14]
5. INTERPRETACIÓN TEÓRICA DEL COEFICIENTE DE FIABILIDAD
Definimos el coeficiente de fiabilidad de un test, como:
... la correlación entre las puntuaciones empíricas obtenidas por una muestra
de sujetos en dos formas paralelas del test.
Se puede expresar también como el cociente entre la varianza de las pun
tuaciones verdaderas y la varianza de las puntuaciones empíricas.
178
enidas en dos tests para-
lelos, que la varianza de las varianzas de las pun-
obtenidas en dos tests n entre las puntuaciones ien, al cociente entre la nza de las puntuaciones
[4.13]
iones entre cada dos de
[4.14]
ICIENTE DE
m o:
obtenidas por una muestra
la varianza de las pun
empíricas.
LA FIABILIDAD DE LAS PUNTUACIONES 1
[4.15]
y se pude interpretar, por lo tanto, como la proporción de la varianza de las puntuaciones empíricas de los sujetos que se debe a la varianza de las puntuaciones verdaderas, o lo que es lo mismo, la proporción de varianza verdadera que hay en la varianza empírica. A medida que dicha proporción aumenta, disminuye el error
de medida. Si rxx' = 1, el error de medida es cero lo que implica una fiabilidad perfecta del test. Sin embargo, a medida que dicha proporción disminuye se produce un incremento en el error de medida. En el caso de que rxx' =O, la varianza de los errores de medida sería igual a la varianza de las puntuaciones empíricas.
EJEMPLO:
Calcular el coeficiente de fiabilidad de un test de razonamiento abstracto, sabiendo que la varianza verdadera de dicho test es el 80% de su varianza empírica.
r _ S~ = O, 805~ = 0 80 XX' - -2 52 1
Sx x
es decir el 80% de la varianza de las puntuaciones empíricas es verdadera medida del rasgo.
A partir de la expresión (4.13) se puede inferir que:
[4.16]
Al término rxv se le denomina índice de fiabilidad de un test.
El coeficiente de fiabilidad de un test se puede expresar también en función de la varianza de los errores:
[4.17]
Así mismo, es fácilmente deducible que:
179
1 PSICOMETRÍA
[4.18]
Es decir, la correlación entre las puntuaciones empíricas y los errores de medida se puede obtener a partir de la correlación entre las puntuaciones obteni-
das por los sujetos en las dos formas paralelas de un test. El término 5
e repre-5x
senta la proporción de la desviación típica de las puntuaciones de los sujetos en el test que se debe a la desviación típica de los errores y, como vemos, esa proporción se puede estimar a partir del coeficiente de fiabilidad del test.
Resumiendo, podemos decir que el coeficiente de fiabilidad definido según el modelo clásico de Spearman como la correlación entre las puntuaciones obtenidas por una muestra de sujetos en dos tests paralelos, nos proporciona información para poder estimar la cuantía del error de medida.
6. TIPOS DE ERRORES DE MEDIDA
En este apartado haremos alusión a diferentes tipos de errores: el de medida, el de estimación, el de sustitución y el de predicción.
- Error de medida .
Como ya se ha dicho, el error de medida es la diferencia entre la puntuación empírica de un sujeto y su puntuación verdadera.
E=X-V
A la desviación típica de los errores de medida se le denomina error típico de medida y se expresa como:
15e =5x~ ~ , S t ··~A
[4 .19]
Cuando se calcula el error de medida obtenemos una medida individual del error que se comete; es decir, una medida individual de la precisión del test. Esta medida nos indica la diferencia que existe entre la puntuación que un sujeto ha obtenido en un test y el nivel real de dicho sujeto en la variable que medimos
180
[4.18]
y los errores de me
. as puntuaciones obteni -
EI término Se repre-5x
·0 nes de los sujetos en
como vemos, esa pro
ilidad del test.
abilidad definido según las puntuaciones ob
os, nos proporciona in
edida.
de errores: el de medida,
cia entre la puntuación
denomina error típico de
[4.19]
na medida individual del
la precisión del test. Esta
ntuación que un sujeto ha la variable que medimos
LA FIABILIDAD DE LAS PUNTUACIONES 1
con dicho test; es decir, su puntuación verdadera. Cuando calculamos el error
típico de medida estamos llevando a cabo una medida grupal del error puesto
que se calcula para todos los sujetos de la muestra.
Este mismo razonamiento es válido para los distintos tipos de error que se ex
ponen a continuación .
- Error de estimación de la puntuación verdadera.
Se denomina error de estimación de la puntuación verdadera a la diferencia
entre la puntuación verdadera de un sujeto y la puntuación verdadera pronosti
cada mediante el modelo de regresión.
E= V- V'
Definimos el error típico de estimación de la puntuación verdadera, como la
desviación típica de los errores de estimación y viene expresado como:
[4.20]
- Error de sustitución
Se define el error de sustitución como la diferencia entre las puntuaciones
obtenidas por un sujeto en un test y las obtenidas en otro test paralelo. Es decir,
el error que se cometería al sustituir las puntuaciones obtenidas en un test X1
por las obtenidas en un test paralelo X2 .
e= x,- x2
Definimos el error típico de sustitución, como la desviación típica de los erro
res de sustitución y viene expresado como:
[4 .21]
- Error de predicción.
Se define el error de predicción como la diferencia entre las puntuaciones
obtenidas por un sujeto en un test (X1) y las puntuaciones pronosticadas en ese
mismo test (Xí) a partir de una forma paralela X2 .
181
1 PSICOMETRÍA
e= X1 - Xí
La puntuación Xí se obtiene mediante la recta de regresión de X1 sobre X2 :
[4.22]
Definimos el error típico de predicción, como la desviación típica de los errores de predicción y viene expresado como:
[4.23]
7. FACTORES QUE AFECTAN A LA FIABILIDAD
La fiabilidad de un test depende de factores como la variabilidad del grupo al que se aplica, la longitud del propio test, las características de los ítems que lo configuran, etc. En este apartado estudiaremos los dos primeros aspectos y el tercero será abordado más adelante en otro tema dedicado específicamente al estudio de la calidad métrica de los ítems.
7 .1. Longitud del test
Uno de los factores que influyen en la fiabilidad de un test es su longitud, es decir, el número de ítems que lo componen. Cuantos más ítems representativos del rasgo a medir se utilicen mayor será la información que obtengamos acerca del atributo que estemos estudiando. Cabe pensar que también será menor el error que cometamos al tratar de estimar la puntuación verdadera de un sujeto y, por lo tanto, la fiabilidad del test tenderá a incrementarse. Entonces, una forma de intentar aumentar la fiabilidad del test es aumentar su longitud. A veces, si un test es demasiado largo puede ser interesante averiguar cuál sería su fiabilidad si se le disminuyera el número de ítems. Si esta disminución de la fiabilidad no es muy elevada puede ser más aconsejable utilizar el test más corto.
La relación existente entre la fiabilidad de un test y su longitud, siempre y cuando los ítems a añadir sean paralelos a los que ya tenía el test original, se puede evaluar mediante la ecuación de Spearman-Brown.
182
gresión de X1 sobre Xi
[4.22]
·ación típica de los erro-
[4.23]
DAD
a variabilidad del grupo ísticas de los ítems que primeros aspectos y el
cado específicamente al
un test es su longitud, es ás ítems representativos que obtengamos acerca también será menor el verdadera de un sujeto
Entonces, una forma longitud. A veces, si un
r cuál sería su fiabilidad ución de la fiabilidad no
su longitud, siempre y tenía el test original, se
donde:
LA FIABILIDAD DE LAS PUNTUACIONES 1
nrxx =---""-----
1 + (n -1)rxx [4.24]
Rxx =coeficiente de fiabilidad del test alargado o acortado.
rxx =coeficiente de fiabilidad del test inicial.
n = número de veces que se ha alargado o acortado el test.
n = EF, siendo EF el número de elementos finales del test y El el número de El
elementos iniciales del test.
Esta expresión (4.24), es la que definimos como ecuación general de SpearmanBrown y hace referencia al caso en que se quiera aumentar o disminuir la longitud del test inicial «n» veces.
Todo lo que acabamos de decir, es igual de válido en el caso de reducir la longitud del test, con la salvedad de que «n» será siempre menor que 1.
Nota: Téngase en cuenta que <<n» no es el número de ítems que se añaden o se eliminan del test original, sino que hace referencia al número de veces que se aumenta o disminuye la longitud del test.
~---~--.~--~. ~~---- ~- • -~- ----~----~~--~-~-==-~---~-=-==-=-~---- ---·-····--~------~- .. 1
EJEMPLO:
Supongamos, que se aplica un test de percepción visual compuesto por 50 ítems a una muestra de sujetos y se obtiene un coeficiente de fiabilidad de 0,60. Veamos lo que sucede al incrementar n veces la longitud del test:
nr 2 ·O 60 1 80 Paran = 2· R = xx = ' =O 75 paran= 3· R = ' =O 82
l XX 1+(n-1)rXX 1+0,60 l l XX 1+1, 20 l
P 2,40
ara n = 4 · R = = O 86 1 XX 1 + 1,80 1
3 Para n =S· R = =O 88
1 XX 1 + 2,40 1
Para n = 6· R = 3'60
=O 90 1 XX 1 + 3 1
7 R 4, 20 o Paran= · =--= 91
1 XX 1 + 3/6 1
P 4,80
ara n = 8· R = =O 92 1 XX 1+4,20 1
9 R 5,40 9 Para n = · = = O 3
1 XX 1+4, 80 1
183
1 PSICOMETRÍA
Como se puede apreciar en el gráfico 4.1, a medida que aumenta el número de ítems paralelos aumenta el coeficiente de fiabilidad del test, aunque no de una manera proporcional. Se puede observar que a partir de un determinado valor de n no se producen incrementos significativos en la fiabilidad del test. Como consecuencia de esto nos podemos preguntar: ¿cuánto habría que alargar o acortar un test para obtener un determinado coeficiente de fiabilidad? y, en segundo lugar, ¿hasta qué punto es razonable dicho aumento?
.9
.8
.7~--~--------~------~----~--~ 2 3 4 5 6 7 8 9
De nuevo encontramos la respuesta a esta pregunta a través de la ecuación de Spearman-Brown, ya que despejando «n» tendremos:
Supongamos que con los datos del ejemplo anterior queremos aumentar la fiabilidad del test hasta obtener un valor de 0,93. Aplicando la expresión anterior tenemos:
n = Rxx (l- rxJ =O, 93(1- 0,60) = 8, 85 = 9 (xx (1- Rxx) O, 60(1- O, 93)
184
Paré damen dría ur
lo que ítems r alterna test, m choob dido 3'
En< númer· cienter atribut• de íten un coe vos un formul obten e
luego t
7.2. \ -La f
a la qu• muestr en fun< más he puntua
que aumenta el número 2l test, aunque no de una un determinado valor de idad del test. Como con
' a que alargar o acortar lidad? y, en segundo lu-
8 9
a través de la ecuación
r queremos aumentar la icando la expresión ante-
85 = 9
LA FIABILIDAD DE LAS PUNTUACIONES 1
Para conseguir ese coeficiente de fiabilidad sería necesario hacer, aproximadamente, 9 veces más largo el test original de 50 ítems. Es decir, el nuevo test tendría una longitud de:
n = EF · EF = n ·El= 9 ·50= 450 ítems El'
lo que implicaría añadir 400 ítems al test original. Obviamente, añadir al test 400 ítems no parece una solución razonable al problema y debemos plantearnos otras alternativas como, por ejemplo, revisar el objetivo para el que se construye el test, mejorar los ítems y analizar cuál es el valor de precisión aceptable para dicho objetivo (si se hubiera tomado el valor exacto de 8,85 habría que haber añadido 392,5 ítems es decir 393, lo cual tampoco sería una solución razonable).
En ocasiones puede que estemos interesados en saber si es posible reducir el número de ítems de un test y que el nuevo coeficiente de fiabilidad sea lo suficientemente aceptable como para no perder demasiada información respecto al atributo objeto de estudio. Esta situación se da cuando consideramos el número de ítems excesivo. Supongamos, por ejemplo un test compuesto de 100 ítems y un coeficiente de fiabilidad de 0,85 (rxx). Supongamos que para nuestros objetivos un coeficiente de fiabilidad de 0,75 (Rxx) es admisible. La pregunta que nos formularíamos sería cuántos elementos debemos eliminar del test original para obtener ese coeficiente de fiabilidad. En este caso:
n=Rxx(1-rxJ = 0,75(1-0,85) = 0,11 =O 52 rxx (1-RxJ 0, 85(1-0,75) 0,21 '
EF = n · El = 0,52 x 1 00 =52
luego tendríamos que eliminar 100- 52 = 48 ítems.
7.2. Variabilidad de la muestra
La fiabilidad de un test también depende de las características de la muestra a la que se aplica. Un test puede presentar tantos coeficientes de fiabilidad como muestras distintas en las que se calcule. El coeficiente de fiabilidad puede variar en función de la mayor o menor homogeneidad del grupo, siendo menor cuanto más homogéneo sea; es decir,cuanto más pequeña sea la desviación típica de las puntuaciones empíricas obtenidas por los sujetos en el test. Recordemos que he-
185
1 PSICOMETRÍA
mos definido el coeficiente de fiabilidad como la correlación entre dos formas paralelas de un test y la corre lación viene afectada por la variabilidad del grupo. Por lo tanto, es importante saber hasta qué punto la fiabilidad de un test se ve afectada por dicha variabilidad.
Supongamos dos grupos de sujetos 1 y 2. Partiendo del supuesto de que el error típico de medida de un test se mantiene constante, independientemente de la va
riabilidad del grupo en que se aplique, podemos establecer la siguiente igualdad:
Por tanto, teniendo en cuenta que, 5~ = 5~(1- rxx ) podemos establecer la igual
dad: 512 (1-r,,)=5~(1-r22 ) y despejando:
donde:
S~ =varianza empírica de las puntuaciones en el grupo 1.
S~ =varianza empírica de las puntuaciones en el grupo 2.
r11 =coeficiente de fiabilidad en el grupo 1.
r22 =coeficiente de fiabilidad en el grupo 2.
EJEMPLO:
[4.25]
Se ha aplicado un test a una muestra de sujetos en la que la desviación típica de las puntuaciones empíricas obtenidas es igual a 20 y la razón entre la desviación tí
pica de los errores y la desviación típica de las puntuaciones empíricas es 0,40. Aplicado el test a otra muestra de sujetos en la que la desviación típica de las puntuacio
nes empíricas es igual a 1 O, ¿cuál sería el valor del coeficiente de fiabilidad del test?
S Datos: S = 20· S = 1 O· ~=O 40
x1 ' x 2 ' S ' x l
52 r,11
= 1 - _ e = 1 - O 1 6 = O 84 52 1 1
X
186
~ ! ación entre dos formas k variabilidad del grupo. abilidad de un test se ve
1 supuesto de que el error )endientemente de la va:er la siguiente igualdad:
emos establecer la igual
[4.25]
ue la desviación típica de entre la desviación tí
empíricas es 0,40. Aplitípica de las puntuacio
de fiabilidad del test?
LA FIABILIDAD DE LAS PUNTUACIONES 1
Como se puede apreciar, al reducir la variabilidad de las puntuaciones empíricas en el segundo grupo, se reduce el coeficiente de fiabilidad. Asimismo se puede observar que el valor del error típico de medida permanece constante (lo
cuál es lógico puesto que se ha partido de ese supuesto).
Se, =Sx,.Jl - rxx =20-Jl-0,84 =8
8. LA FIABILIDAD COMO EQUIVALENCIA Y COMO ESTABILIDAD DE LAS MEDIDAS
Un test debe cumplir dos requisitos básicos. En primer lugar debe medir el rasgo que realmente pretende medir (es decir, ser válido) y, en segundo lugar, las puntuaciones empíricas obtenidas al aplicar el test deben ser estables y precisas. La precisión hace referencia, como ya hemos apuntado anteriormente, a la necesidad de que, en la medida de lo posible, las puntuaciones obtenidas estén libres de errores. La estabilidad se refiere a que cuando se evalúa un rasgo con el mismo test en distintas ocasiones y bajo condiciones lo más parecidas
posibles, siempre y cuando el rasgo estudiado no haya cambiado, se deberán obtener unos resultados similares. Este segundo requisito, referido a la reproductividad de unos resultados en condiciones similares, es lo que definimos como la fiabilidad del test, entendida como estabilidad de las medidas. En definitiva, lo que pretendemos es poder establecer el grado de acuerdo entre las puntuaciones obtenidas por los sujetos en distintas aplicaciones.
En este apartado, nos centraremos en dos métodos basados en la estabilidad de las medidas para el cálculo del coeficiente de fiabilidad, métodos que constituyen una aplicación directa de la definición de correlación entre formas paralelas:
Método de las formas paralelas
Método test-retest
Existen otras formas de abordar el cálculo de la fiabilidad de un test, como veremos en el siguiente apartado, basadas en la consistencia interna del test.
187
1 PSICOMETRÍA
8.1 . Método de las formas paralelas
La forma de proceder, según este método, sería: primero, construir dos formas paralelas de un test X y X/, en segundo lugar, aplicar las dos formas del test a una muestra de sujetos lo suficientemente amplia como para que sea representativa de la población a la que va dirigido el test y, en tercer lugar, calcular el coeficiente de correlación de Pearson entre las puntuaciones de los sujetos en ambas formas.
[4.26]
donde: X1 y X2 corresponden a las puntuaciones obtenidas por los sujetos en cada una de las formas aplicadas.
El coeficiente de fiabilidad así obtenido recibe también el nombre de coeficiente de equivalencia, haciendo referencia al grado en que ambas formas son
equivalentes.
El método de las formas paralelas presenta la ventaja de que, si ambas formas son aplicadas en el mismo momento se tiene un mayor control de las condiciones en que los sujetos realizan las pruebas. Este método presenta el inconveniente de la dificultad que supone la construcción de dos formas que sean paralelas.
1
8.2. Método test-retest
Con este método se aplica el mismo test en dos ocasiones diferentes a una misma muestra de sujetos. Calculamos el coeficiente de fiabilidad mediante la correlación entre las puntuaciones obtenidas por los sujetos en ambas aplicaciones.
[4.27]
donde: X1 y X2 corresponden, en este caso, a las puntuaciones obtenidas por los sujetos en cada una de las aplicaciones del mismo test.
188
Como: ralelas sie1 la misma t
Este mf tintas del1 remos en,
pueden ca pretensión las puntua bilidad sin diendo, la:
Al igual inconveni' cuenta, es terferir en 1
dado a cie su puntuac riables de t
factor dete
Un segt currido en1 caciones p tiempo, un que el rasg tores socia cidir en un
Una últ bio en el g radamente coeficiente
Teniend en ambas e dicarán el¡ fiabilidad 2
ro, construir dos formas dos formas del test a
para que sea representercer lugar, calcular el ·ones de los sujetos en
[4.26]
idas por los sujetos en
·én el nombre de coefi
que ambas formas son
de que, si ambas formas control de las condicio
el inconveniente as que sean paralelas.
iones diferentes a una abilidad mediante la coen ambas aplicaciones.
[4.27]
ciones obtenidas por los
LA FIABILIDAD DE LAS PUNTUACIONES 1
Como se puede apreciar, el cálculo es idéntico al método de las formas paralelas siendo la única diferencia que en lugar de aplicar dos formas se emplea la misma en dos momentos distintos.
Este método presenta la ventaja de que no requieren dos ó más formas distintas del mismo test. Con el método test-retest, es el mismo test el que aplicaremos en distintas ocasiones. En el caso de que se pretendan medir rasgos que pueden cambiar en el tiempo hay que extremar las precauciones si tenemos la pretensión de emplear este método ya que se pueden encontrar diferencias en las puntuaciones obtenidas en las dos aplicaciones y no significar falta de estabilidad sino que si realmente los sujetos han variado en el rasgo que se está midiendo, las diferencias pongan de manifiesto ese cambio.
Al igual que el método de las formas paralelas, este método no está exento de inconvenientes que hay que tener presentes. Un primer aspecto a tener en cuenta, es el posible influjo de la memorización de algunos ítems que puede interferir en la segunda aplicación. Un sujeto puede recordar la respuesta que haya dado a ciertos ítems y esto puede provocar un aumento o disminución irreal de su puntuación y, consiguientemente, del valor de la correlación. El efecto de variables de estas características sobre la repetición de un test puede llegar a ser un factor determinante en el valor del coeficiente de fiabilidad.
Un segundo inconveniente a tener en cuenta es el intervalo de tiempo transcurrido entre una aplicación y otra. Es deseable incrementar el tiempo entre aplicaciones para minimizar el efecto de aprendizaje o de memoria pero, al mismo tiempo, un incremento demasiado grande, hace que aumente la posibilidad de que el rasgo que estamos estudiando haya variado debido a la influencia de factores sociales, afectivos o incluso evolutivos propios del sujeto y esto puede incidir en una infraestimación del coeficiente de fiabilidad.
Una última cuestión es la propia actitud del sujeto (Ghiselli, 1981 ). Un cambio en el grado de cooperación por parte de un sujeto puede provocar, deliberadamente, una puntuación más baja o más alta, que daría como resultado un coeficiente de fiabilidad más bajo o más alto.
Teniendo en cuenta estos aspectos, y si las condiciones de aplicación del test en ambas ocasiones son lo más parecidas posibles, los resultados obtenidos indicarán el grado de estabilidad en las puntuaciones obtenidas. Al coeficiente de fiabilidad así obtenido se le denomina también coeficiente de estabilidad.
189
1 PSICOMETRÍA
9. LA FIABILIDAD COMO CONSISTENCIA INTERNA
Existen situaciones en las cuales solamente es posible llevar a cabo una única aplicación de un test; situaciones en las que la aplicación de cualquiera de los dos métodos que acabamos de describir no sea factible, o donde un análisis de la estabilidad o la equivalencia de las medidas no constituya nuestro fin prioritario.
En este apartado presentamos una serie de métodos para estimar la fiabilidad de un test que sólo requieren una aplicación . Unos hacen referencia a la división del test en dos mitades. Otros requieren un análisis de la varianza y covarianza de las respuestas de los sujetos a los ítems. Las diferentes técnicas que presentamos aportan un índice de la consistencia interna de las respuestas de los sujetos a los ítems del test en una sola aplicación.
9.1. Métodos basados en la división del test en dos mitades
El método de las dos mitades presenta una ventaja sustancial respecto a los dos métodos explicados anteriormente. Esta ventaja reside en el hecho de que consideramos las puntuaciones obtenidas en una única aplicación de un test, con lo cuál, la estimación de la fiabilidad no se ve afectada por factores como el intervalo de tiempo transcurrido entre una aplicación y otra, la memoria, el aprendizaje, etc., y supone un ahorro de tiempo y esfuerzo al no tener que construir una segunda forma paralela del test, ó tener que realizar una segunda evaluación de los sujetos. Básicamente se trataría de aplicar el test a una muestra de sujetos y, una vez obtenidas las puntuaciones dividir el test en dos mitades, calculando, posteriormente, la correlación entre las puntuaciones obtenidas por los sujetos en ambas partes y aplicar, a continuación, una fórmula de corrección que ya se especificará.
La división del test en dos mitades no es siempre una labor tan sencilla como pueda parecer a primera vista. Las mitades del test deberán ser similares en dificultad y contenido para que la correlación entre las puntuaciones se aproxime al valor máximo. Uno puede cuestionarse si efectivamente las medias, varianzas y el contenido de los ítems son realmente similares o no, y, por lo tanto, si este método es adecuado en todo tipo de situaciones. El hecho de conseguir una igualdad de los valores de la media y la desviación típica es posible con este tipo de agrupamiento, pero como establece Gulliksen (1987) corremos el peligro de agrupar ítems análogos en un solo lado, con lo que pudiera ocurrir que
190
a e
9
d;
b< bi
INTERNA
llevar a cabo una única
r
n de cualquiera de los o donde un análisis de ítuya nuestro fin priori-
a estimar la fiabilidad n referencia a la divide la varianza y covaiferentes técnicas que a de las respuestas de
dos mitades
cial respecto a los ide en el hecho de que
aplicación de un test, por factores como
y otra, la memoria, el al no tener que cons
lizar una segunda evael test a una muestra de
en dos mitades, cal-iones obtenidas por los fórmula de corrección
labor tan sencilla como án ser similares en di
ntuaciones se aproxime las medias, varianzas
, y, por lo tanto, si este cho de conseguir una ca es posible con este
(1987) corremos el pelique pudiera ocurrir que
LA FIABILIDAD DE LAS PUNTUACIONES 1
las dos mitades no fueran iguales en cuanto a contenido se refiere. Este aspecto deberá ser cuidadosamente estudiado debido a su importancia.
Son diversas las formas en las que se puede llevar a cabo la división del test en dos mitades pero, ante todo, una característica que habrá que valorar es la forma en que se ha construido el test.
Una primera forma consistiría en dividir el test por la mitad, es decir, considerar los primeros (n/2) ítems como una mitad y los últimos (n/2) ítems como la segunda mitad. Esta forma de dividir el test puede presentar inconvenientes, puesto que muchos tests están formados por ítems cuya dificultad se va incrementando y, por lo tanto, las dos mitades no serían equivalentes; en el caso de tests con contenidos heterogéneos las dos mitades no serían comparables, y en el caso de tests con un número elevado de ítems hay que tener en cuenta el efecto del cansancio de los sujetos.
Una segunda aproximación al problema consistiría en definir una forma con todos los elementos pares y una segunda forma con todos los elementos impares, con lo cual reducimos significativamente los problemas planteados por la forma anterior.
Una tercera forma de abordar el problema puede ser ordenar los ítems en función de su grado de dificultad, calculando para ello el índice de dificultad de cada ítem, y subdividirlos en pares e impares.
Una cuarta forma, aunque no muy recomendable por razones obvias, podría consistir en la asignación de los ítems al azar a una mitad o a otra.
Normalmente, dado que cuando los ítems del test son de dificultad creciente aparecen ya ordenados a lo largo del test, la forma más utilizada en la división del test en dos mitades, es asignar a una de las mitades los elementos pares y a la otra los impares.
Cuando se utiliza el método de las dos mitades la fiabilidad se puede estimar aplicando cualquiera de las siguientes fórmulas: Spearman-Brown, Rulon, Guttman-Fianagan.
9.1 . 1. Spearman-Brown
La ecuación de Spearman-Brown, constituye una de las formas más utilizadas para estimar la fiabilidad de un test por el método de las dos mitades. Está basada en la relación existente entre la longitud de un test y el coeficiente de fiabilidad.
191
1 PSICOMETRÍA
En primer lugar aplicamos el test a una muestra de sujetos. Una vez aplicado el test, dividimos éste en dos mitades que han de ser paralelas. Por lo tanto, para ver si la aplicación de este método es la correcta, habría que comprobar los supuestos de paralelismo comentados anteriormente. A continuación calculamos la correlación entre las puntuaciones obtenidas por los sujetos en ambas partes. La correlación calculada correspondería al coeficiente de fiabilidad de cada una de las mitades del test, pero como lo que queremos es calcular la fiabilidad del test completo, para ello aplicamos la ecuación de Spearman-Brown para el caso de longitud doble:
donde:
R = 2rxx XX 1
+(XX
Rxx =coeficiente de fiabilidad del test.
rxx =coeficiente de fiabilidad de cada una de las mitades.
EJEMPLO:
[4 .28]
Hemos aplicado un test de aptitud numérica compuesto de 20 ítems a una muestra de 6 sujetos. Los resultados que se presentan a continuación corresponden a las puntuaciones que dichos sujetos obtuvieron en los ítems pares (X1)
e impares(X2 ). Calcular el coeficiente de fiabilidad suponiendo que las dos mitades del test sean paralelas.
SUJETOS x2 1
1 8 4 64 16 32
2 7 7 49 49 49
3 8 6 64 36 48
4 5 4 25 16 20
5 8 7 64 49 56
6 6 6 36 36 36
Total 42 34 302 202 241
192
Jjetos. Una vez aplicado alelas. Por lo tanto, para a que comprobar los su-
·nuación calculamos sujetos en ambas partes.
fiabilidad de cada una calcular la fiabilidad del
n-Brown para el caso
[4.28]
itades.
de 20 ítems a una a continuación corres
en los ítems pares (Xl)
niendo que las dos mi-
16 32
49 49
36 48
16 20
49 56
36 36
202 241
LA FIABILIDAD DE LAS PUNTUACIONES 1
rx,x2 = )[NLx12 -(IX/] [NLx~ -(IX2l2]
r = 6x241-42x34 =1.446-1.428=035
XxX2 ~(6 X 302- 422 )(6 X 202-342 ) .j 48 X 56
1
R = 2rxx = 2x0,35 = 0,70 =O 52 xx 1+rxx 1+0,35 1,35
1
El coeficiente de fiabilidad de cada una de las mitades es 0,35 pero el del test total es 0,52. Se trata de un coeficiente medio ya que el valor máximo es la unidad. Hemos asumido que las dos mitades son paralelas dado que se trata de un ejemplo, no obstante para aplicar este procedimiento de forma estricta habría que haber hecho previamente la compro.bación analizando, por ejemplo, la igualdad de las medias de ambas mitades y la igualdad de los errores típicos de medida.
9.1.2. Rulon
La fórmula de Rulon (1939) para la estimación de la fiabilidad de un test según el método de dos mitades se utiliza cuando, aún no siendo las dos mitades definidas estrictamente paralelas, podemos considerarlas •-equivalentes (tauequivalentes) o esencialmente • -equivalentes. Lord y Novick (1968) definen los tests • equivalentes como aquellos en los que las puntuaciones verdaderas de los sujetos de una muestra son iguales en ambas formas, pero las varianzas de error no tienen porqué ser iguales, y definen los tests esencialmente (•) tau-equivalentes como aquellos en los que la puntuación verdadera de cada sujeto en uno de los tests es igual a la del otro más una constante. Tanto en una situación como en otra se asume el cumplimiento del supuesto de igualdad de las varianzas verdaderas de ambas mitades.
Calculados los valores de las puntuaciones en los ítems pares e impares, se calcula la diferencia entre ellas y, a continuación, su varianza (varianza de la diferencia entre las puntuaciones).
[4.29]
193
1 PSICOMETRÍA
donde:
d = diferencias entre las puntuaciones de los elementos pares e impares de cada uno de los sujetos.
S~= 5~-i =varianza de la diferencia entre las puntuaciones pares e impares.
S~ =varianza de las puntuaciones empíricas de los sujetos.
EJEMPLO:
Hemos aplicado un test de fluidez verbal compuesto 6 ítems a 6 sujetos. A continuación se presentan las puntuaciones empíricas obtenidas por los sujetos en el test total, así como las obtenidas en los elementos pares e impares. Calcular el coeficiente de fiabilidad del test.
p (P-1) = d
A 4 3 1 2
B 1 1 o 1
e 6 3 3 o
o 2 1 1 o
E 3 1 2 -1
F 5 2 3 -1
X=4+1+6+2+3+s= 35 6 1
52 = 42
+ f + 62
+ 22
+ 32
+52
- (3 5)2 = 15 17-12 25 = 2 92 X
6 1 1 1 1
xd =o, 17 52 = 4 + 1 + 1 + 1 -(O 1 7)2 = 1 14 d 6 1 1
Se ha obtenido un coeficiente de fiabilidad medio.
194
9.1.
F fórm cacit pres i
dond
52 p
tivam
y X
Ta1 c iona relacit
EJE
Co1 zando
xp =1,
S~ =0,
comop mula dE
~ntos pares e impares de
aciones pares e impares.
sujetos.
6 ítems a 6 sujetos. A conidas por los sujetos en el
e impares. Calcular el
(P-1) = d
1 2
o 1
3 o
1 o
2 -1
3 -1
-12,25 = 2,92
14
LA FIABILIDAD DE LAS PUNTUACIONES 1
9.1.3. Guttman-Fianagan
Flanagan (1937) y Guttman (1945), de forma independiente llegaron a una fórmula equivalente a la de Rulon y que presenta una mayor sencillez de aplicación . La fórmula de Guttman-Fianagan viene determinada por la siguiente expresión:
[4.30]
donde:
5~ y Sf = varianzas de las puntuaciones en los ítems pares e impares respectivamente.
5~ =varianza empírica del test total.
Tanto la ecuación de Rulon como la ecuación de Guttman-Fianagan proporcionan el mismo valor de la fiabilidad por ser expresiones equivalentes. Dicha relación aparece recogida al final del tema en el Apéndice.
EJEMPLO:
Con los datos del ejercicio anterior, calcular el coeficiente de fiabilidad utilizando la fórmula de Guttman-Fianagan.
- -xp =1,83 X¡ =1,66
5~ =0,81 5¡2 =1,21 52= 32 +12 +32 +f +12 +22 -(183)2 =416-3 35=0 81
p 6 ' ' ' '
R =2[1- 5,2 +Si J=2(1- 0,81+1,21)=0 61 XX 52 2 92 l
X 1
como puede observarse el resultado es el mismo que el obtenido mediante la fórmula de Rulon.
1 PSICOMETRÍA
9.2. Métodos basados en la covariación entre los ítems
Al hablar de la fiabilidad como consistencia interna hemos hecho alusión a dos formas de abordar el tema. Una forma es la basada en la división del test en dos mitades. La segunda forma requiere un análisis de la varianza y covarianza de las respuestas de los sujetos a los ítems. De esta forma, el coeficiente obtenido proporciona una estimación de la consistencia interna de los ítems del test. En el presente apartado haremos referencia a algunos de los métodos más frecuentes para estimar la fiabilidad de un test bajo estas condiciones como son el coeficiente alpha de Cronbach (1951 ), ó los coeficientes KR20 y KR21 de KuderRichardson (193 7). Tanto KR20 como KR21 pueden ser considerados como casos particulares del coeficiente «alpha» de Cronbach en el caso de que los ítems que forman el test sean dicotómicos.
9.2.1. Coeficiente alfa (a) de Cronbach
El coeficiente de Cronbach (1951) constituye un indicador de la consistencia interna del test. Este coeficiente expresa la fiabilidad del test en función del número de ítems y de la proporción de la varianza total del test debida a la covariación entre los ítems. Cuanto más covarien los ítems entre sí mayor será la fiabilidad del test.
La ecuación general del coeficiente «alfa» viene expresada como:
donde:
n
L,.L,.cov(jk) n ,i"'_K ----=--a=---
n -1 52 X
=-n (1-L,.5J) n -1 52
X
[ n(r¡) ] n (5;- L,.5J)
= 1 + (n - 1)r¡ = n - 1 5; =
n = número de elementos del test.
L.Sj = suma de las varianzas de los elementos del test.
L.L.cov (jk) = suma de las covarianzas de los ítems.
S~ =varianza de las puntuaciones en el test.
[4.31]
r1 =cociente entre la covarianza media de los ítems y su varianza media.
196
Ej
H En la cada fic ier
EjE/1
Sien averigu 1 O íterr
los ítems
a hemos hecho alusión a t en la división del test en la varianza y covarianza rma, el coeficiente obte
a de los ítems del test. de los métodos más fre
condiciones como son el KR20 y KR21 de Kuder
r considerados como can el caso de que los ítems
r de la consistencia inen función del número da a la covariación en
será la fiabilidad del test.
[4.31]
ms y su varianza media.
LA FIABILIDAD DE LAS PUNTUACIONES 1
EJEMPLO 1:
Hemos aplicado un test de percepción visual a una muestra de seis sujetos. En la tabla adjunta se presentan las puntuaciones que los sujetos obtuvieron en cada uno de los cinco ítems que forman el test. Se desea saber el valor del coeficiente de fiabilidad del test.
A 3 4
B 2 3
e 4 2
D 2 1
E 1 1 1 2 1
F o o 1 1 1
X1 =2;
X2 = 1,83;
X3 =1,67;
X4 = 2,5;
X5 = 2,33;
a= _n_(1- :¿s; ]= ~( 1 - 1,67 + 1,82 + 0,54 + 0,92 + 1,90 )= 0 94 n-1 S~ 4 27,29 '
EJEMPLO 2:
Siendo la covarianza media entre todos los elementos de un test igual a 0,25, averiguar el coeficiente de fiabilidad del test sabiendo que está compuesto por 1 O ítems y que la varianza empírica es igual a 40 puntos.
197
1 PSICOMETRÍA
Para resolver el problema hay que partir de que la varianza de una variable compuesta, suma de otras variables, es igual a la suma de las varianzas de todas las variables más la de las covarianzas, o bien a la suma de las varianzas más los n(n-1) términos de covarianza media:
n n
s; = :¿s: +n(n - 1)r1kSJ; :¿s: = 40-10 · 9 · 0, 25=17,5 j=l j=l
a = .!_Q(1-17
'5)=o 62
9 40 1
9.2. 7. 7 Estimador insesgado de a
El estimador insesgado de a propuesto por Feldt, Woodruff y Salih (1987) se expresa como:
- (N-3)& +2 a = -'----'---- [4.32]
N - 1
donde:
a= estimador insesgado.
a= valor de alpha de Cronbach.
N= número de sujetos de la muestra.
A medida que aumenta el número de sujetos de la muestra, el valor del a encontrado y el valor del estimador insesgado se aproximan, siendo iguales cuando N --too. En la práctica, a partir de 100 sujetos, se pueden considerar insignificantes las diferencias encontradas. Es decir:
[4.33]
Supongamos que en una muestra de 150 sujetos se les ha aplicado un test y se ha obtenido un valor de a= 0,75.
198
Co tre am tra de
9.2. 7.
El e ri or dE coefic
Ell Muñi2
El e test se he m o~
Otr c iente
donde
n=
52 -J -
1rianza de una variable e las varianzas de todas de las varianzas más los
·0,25=17,5
druff y Salih (1987) se
[4.32]
uestra, el valor del a enn, siendo iguales cuando
n considerar insignifi-
[4.33]
les ha aplicado un test y
LA FIABILIDAD DE LAS PUNTUACIONES 1
a= (150-3)0,75+2 =O 75 150-1
1
Como se puede apreciar, a partir de 100 sujetos la diferencia encontrada entre ambos estimadores es insignificante. Si por el contrario tuviéramos una muestra de 20 sujetos, las diferencias serían mayores.
a= (20-3)0,75+2 =O 78 20-1
1
9.2. 7 .2. El coeficiente a como límite inferior del coeficiente de fiabilidad
El coeficiente a puede ser considerado como una estimación del límite inferior del coeficiente de fiabilidad de un test, siendo su valor menor o igual que el coeficiente de correlación rxx· (Guttman, 1945):
[4.34]
El lector interesado puede encontrar una demostración de dicha relación en Muñiz (1998).
El coeficiente a es igual al coeficiente de fiabilidad, rXX' cuando los ítems del test sean paralelos y, por tanto, satisfagan las condiciones de paralelismo que hemos formulado con anterioridad.
Otro estimador del límite inferior del coeficiente de fiabilidad es el coeficiente 8 (delta) propuesto por Guttman (1945):
( J _ n _ 2,2,cov(j,k)
83 = 1 - Í. S~ + --'---'(_n_-_1-'-) _5_2 ___ _ j =l SX X
donde:
n = número de elementos del test.
sj = varianza del elemento j del test.
[4.30]
199
1 PSICOMETRÍA
S~ = varianza del test total. n
L,L,cov(j,k) = s;- L,sJ =suma de las covarianzas de los ítems j~l
9.2. 7 .3. Inferencias sobre a
Como acabamos de ver, el coeficiente a nos proporciona una estimación de la fiabilidad de un test basada en la consistencia interna del mismo. En ocasiones queremos ir mas allá, y nos planteamos cuestiones como, por ejemplo, si existe una diferencia significativa entre el valor del coeficiente alfa obtenido en dos o más muestras independientes; si alfa puede tomar un valor concreto en la población; si la diferencia entre dos ó más valores distintos de alfa para una misma muestra de sujetos, es significativa o no; etc. Estos problemas referidos a las inferencias acerca del coeficiente alfa, dieron lugar, a principios de los años 60 del siglo veinte, al desarrollo de la teoría muestra! para el coeficiente alfa. Kristof (1963) y Feldt (1965), de forma independiente, derivaron un estadístico de contraste del coeficiente alfa, que se distribuye según una distribución F de Snedecor, a partir del cuál se puede determinar un intervalo confidencial para el valor de a en la población.
Feldt (1969) deriva el estadístico « W» para el caso de que se quieran contrastar dos valores de alfa obtenidos en muestras independientes. Dicho método fue ampliado a «n» muestras independientes a partir del estadístico «UX1» postulado por Hakstian y Whalen (1976). Feldt (1980) desarrolló un estadístico de contraste para dos valores de alfa obtenidos en la misma muestra y, Woodruff y Feldt (1986) ampliaron esta metodología al caso de «n» coeficientes obtenidos en la misma muestra.
a) Inferencias para un solo valor de a
Cuando estamos interesados en saber si alpha puede tomar un determinado valor en la población o, entre qué valores se encuentra alpha en la población, podemos aplicar el estadístico propuesto por Kristof (1963) y Feldt (1965) independientemente. Es decir, una vez que hayamos obtenido un determinado valor de alfa en una muestra de sujetos, podemos plantearnos la hipótesis de si el valor obtenido es compatible con el hecho de que alfa tome un determinado valor en la población. El estadístico de contraste propuesto puede expresarse como:
200
1-a F=-
1- &.. [4.36]
donde:
F=s
a =\
&., = v
N= r
n=n
El sig rencia.
EJEMI
Su por de 35 íte tenido ur tadísticar el coefici
La pri1 dísticamE
como hi~
Puesto blecido se ticamente
La segu tre los que
1 Obsérves
1 PSICOMETRÍA
1-a ---;::::0,67; a:s;1-0,67(1-0,83); a:s;0,89 1-0,83
0,76::::; a::::; 0,89
Al nivel de confianza del 95%, está comprendido entre los valores 0,76 y 0,89. Por tanto, el valor planteado por la Ho no está incluido en el intervalo.
b) Inferencias sobre alfa para muestras independientes
Analizaremos dos situaciones: dos muestras independientes y «K» muestras independientes.
b. 1) Dos muestras independientes
Para el caso de dos muestras independientes, Feldt (1969) propuso el estadístico de contraste W que permite comprobar la Ho: a 1 = a 2
donde:
~ ~
W =se distribuye según F con (N1 - 1) y (N2 - 1) grados de libertad.
&1 y &2 = valores del coeficiente alfa en cada una de las muestras.
N 1 y N2 = número de sujetos de cada muestra.
EJEMPLO:
[4.37]
Hemos aplicado un test de razonamiento, a una muestra de 121 sujetos, obteniendo un valor de alfa igual a 0,55 . Se aplicó el mismo test a otra muestra de 61 sujetos, obteniéndose un valor de alfa igual a 0,62. Queremos saber si existen diferencias estadísticamente significativas entre los valores de ambos coeficientes (N.C. 95%).
202
es E
tre
«K »
m u(
don
L
1<
u
S
a~ 0,76
a S 0,89
D entre los valores 0,76 y 1cluido en el intervalo.
dientes y «K» muestras
(1969) propuso el esta
a1 =a2
os de libertad.
de las muestras.
[4.37]
uestra de 121 sujetos, abIsmo test a otra muestra de . Queremos saber si exis
valores de ambos coefi-
LA FIABILIDAD DE LAS PUNTUACIONES 1
H 0 : a,= a 2
H, =a, -:t- a 2
W= 1-0,55 =118 1-0,62
1
f o ,97s(l2o ,6o ) = 1, 58
fo ,o2s( l2o,6o ) = 0,63
Podemos afirmar, al N.C. 95%, que la diferencia entre ambos coeficientes no es estadísticamente significativa puesto que el valor W = 1,18 se encuentra entre los valores encontrados.
b.2) «K» muestras independientes
Woodruff y Feldt (1986) ampliaron el estudio de Feldt (1969) para el caso de «K» coeficientes obtenidos en K muestras independientes. Bajo la condición de muestras independientes han derivado el estadístico de contraste UX1:
donde:
k [ _X ]2
L (1-&;) , -u UX, = --~--~----~ 52
[4.38]
UX1 =se distribuye aproximadamente como X2 con n-1 grados de libertad.
K= número de muestras o coeficientes.
&; = valor del coeficiente alfa para cada muestra.
u = media de los coeficientes transformados.
S2 = media aritmética de las varianzas de cada muestra.
203
1 PSICOMETRÍA
siendo:
y
Ñ = N¡(n¡ -1)
' n¡ + 1
donde:
N¡= número de sujetos en cada muestra.
n¡ = número de ítems en cada test.
EJEMPLO:
Se ha aplicado un test compuesto por 50 ítems a tres muestras independientes de 25, 40 y 50 sujetos. Para cada una de estas muestras se obtuvieron los siguientes valores de alfa: a 1 = 01551 a 2 = 0170 y a 3 = 0175. Deseamos saber si existen diferencias estadísticamente significativas para los valores de alfa obtenidos (N.C. 95%).
Ha : al = a 2 = a 3
Hl : al * a 2 * a 3
-x -x -x u= (1-0155) 3 + (1-0,70) 3 + (1-0175) 3 = 1457 3 3 3
1
Ñ = 25(50 -1) = 24 02· 1 50+ 1 1 1
2 2 51 = 7j = o 1 o 1 6
9(24102-1)(1-0155) 3
2 2 52= ?j =01013
9(38143 -1)(1- 0170) 3
Ñ = 40(50-1) =38 43· 2 50+ 1 1 1
2 2 53 = 7j = o 1 o 11
9(48104 -1)(1- 0,75) 3 Ñ = 50(50- 1) = 48 04·
3 50+ 1 1 1
52= 01016+01013+01011 =0 013 3 1
204
Pe signii
e) ln1
Er la mi depe1 mos e
Lo traste ficier (198( (198E
C.}
Fel dos vé comiE núme
muestras independienestras se obtuvieron los si-
0,75. Deseamos saber si los valores de alfa obte-
1,457
x =o,o16 -0,55) 3
f----x;;-;- =o, o13 - 0,70) 3
¡.....-----,x;;-;- = o, o 11 -0,75) 3
LA FiAB!L!DAD :lE lAS PU:'iTUACICNES
[(1-0,55)-y3 -1,457 r [(1-o, 7ofX -1,457 r ux = + + 1 O, 013 O, 013
[ V ]2 (1 -0,75) 73 -1,457
+ =1,778+0,104+1,308=3,19 0,013
g./.(n- 1) = 2; X~,97s,2 = 7, 3 8
X~.o2 s ,2 =O, 05
Podemos afirmar, al N.C. 95%, que no existen diferencias estadísticamente significativas entre los distintos valores de alpha.
e) Inferencias sobre alfa para muestras dependientes
En algunos diseños experimentales es posible administrar distintas pruebas a la misma muestra de sujetos. En estas situaciones los coeficientes obtenidos son dependientes y no podemos emplear ninguno de los dos contrastes que acabamos de estudiar.
Los primeros estudios llevados a cabo para establecer un estadístico de contraste que nos permitiera ver si existen diferencias significativas entre dos coeficientes obtenidos en la misma muestra, fueron llevados a cabo por Feldt (1980) y, posteriormente desarrollados para «K» muestras por Woodruff y Feldt (1986).
c. 7) Dos muestras dependientes
Feldt (1980, 1987) propuso el empleo del estadístico de contraste «t » para dos valores de alfa obtenidos a partir de una misma muestra de sujetos. Feldt recomienda el empleo de este estadístico cuando N · n ~ 1.000, siendo N igual al número de sujetos y n el número de ítems. El estadístico se expresa como:
(& -& ).JN-2 t = 1 2
~[ 4 ( 1 - &1 ) ( 1 - &2 ) ( 1 - rx~x2 ) ]
[4 .39]
205
1 PSICOMETRÍA
donde:
t =se distribuye según una distribución t de Student con (N- 2) grados de li-bertad.
&, y &2 = valores del coeficiente alfa.
N= número de sujetos en la muestra.
G x =correlación al cuadrado entre las puntuaciones de los SUJ·etos en los dos 1 2
tests.
EJEMPLO:
Aplicamos dos tests de percepción visual a una muestra de 125 sujetos. La correlación entre las puntuaciones de ambos tests es igual a 0,70. Los valores del coeficiente alfa fueron, respectivamente: 0,75 y 0,84. Queremos saber si la diferencia existente entre ambos valores es estadísticamente significativa o no (N.C. 95%).
t= (0,84-0,75)~(125-2) =3 50
~[ 4(1-0,84)(1-0,75)(1-0,702)] '
t (N-2 ) = t1 23 = 1, 96
Se rechaza la hipótesis nula y podemos establecer que la diferencia entre los coeficientes es estadísticamente significativa.
c.2) rrK» muestras dependientes
Para el caso de «K» muestras, Woodruff y Feldt (1986) presentaron una serie de estadísticos de contraste entre los que cabe resaltar, por su sencillez de aplicación y gran precisión, el estadístico UX2.
[4.40]
206
dond
u; K=
N
u=
donde
siendo
y
donde:
n¡= 1
C=
nt con (N- 2) grados de li-
es de los sujetos en los dos
de 125 sujetos. La coa! a 0,70. Los valores del
. Queremos saber si la diamente significativa o no
=3,50
que la diferencia entre los
986) presentaron una serie r, por su sencillez de apli-
[4.40]
LA FIABILIDAD DE LAS PUNTUACIONES 1
donde:
UX2 =se distribuye aproximadamente igual a X2 con (K-1) grados de libertad.
K= número de muestras o coeficientes.
N= número de sujetos de la muestra.
U; = valor de los coeficientes alfa.
u = media de los coeficientes transformados.
S2 = media aritmética de las varianzas de cada muestra .
donde:
siendo:
y
donde:
Ñ = N(ñ-1) ñ + 1
ñ = -f-- (media armónica de las longitudes de los tests) :¿_!_ i=l n;
n¡ = número de ítems de cada test.
C = media de las covarianzas S¡k.
207
1 PSICOMETRÍA
EJEMPLO:
Se aplicaron 3 versiones de un cuestionario de ansiedad a una muestra de 100 sujetos. Los cuestionarios estaban compuestos de A = 50, B = 60 y e= 65 ítems respectivamente. Los coeficientes alfa obtenidos fueron: aA = 0,60, a 8 = 0,70 y a e = 0,74. Las correlaciones entre las puntuaciones de los sujetos fueron: rAB = 0,50; rAe = 0,58 y r8e = 0,59. Calcular, al N.C. 95%, si existen diferencias significativas entre los valores de los coeficientes a obtenidos:
u= 11(1-0 60)/j + 11(1-0 70)/j + 11(1-0 74)/j =0 25+0 22+0 21=0 68 /3 ' / 3 ' /3 ' ' ' ' '
3 ñ = 1 1 1 =58, 82
- + - +-50 60 65
Ñ = 1 00(58, 82) = 96 65 58,82-1 '
2 S~ = 2 = 0,0042
9(96, 65 -1)(1- O, 60) 3
2 S~= 2 = 0,0052
9(96, 65 -1)(1- o, 70) 3
2 2 Se = 7j =0,0057
9(96,65 -1)(1- 0,74) 3
5 2=± S¡2
= 0,0042 + 0,0052 + 0,0057 = 0,0050 i=l k 3
e = 2(0,50)2 =o 0011 AB 11 1 '
9(96, 65 -1)(1- o, 60)13 (1- 0,70) 3
208
u
9.2
en E
re m cior «alp tima m ay m ay,
T( elerr caso riabl, en el
iedad a una muestra de r = 50, 8 = 60 y e = 65 ¡tueron: uA = 0,60, ua = 1es de los sujetos fueron: %, si existen diferencias
nidos:
25 + 0,22 + 0,21 = 0,68
2
= 0,0050
=0,0011
LA FIABILIDAD DE LAS PUNTUACIONES 1
e = 2(0,58)2 =o oo16 ~ X X ' 9(96,65-1)(1-0,60) 3 (1 - 0,74) 3
e = 2(o; 59)2 =o oo1 9 BC X X 1
9(96,65-1)(1-0,70) 3 (1-0,74) 3
C = o,oo11+0,0016+0,0019 = O 0015 3(3 -1) 1
2
[(1-0,60fx - 0,68 r [(1 - 0,70fx - 0,68 J [(1-0,74fx -0,68 r ux = + + = 2
0,0035 0,0035 0,0035
= 131,03 + 189,22 + 224,68 = 544,93
g.!.(n - 1) = 2; x;9752 = 7,38
x;o2s2 =o,o5
Dado que el valor obtenido está fuera del intervalo podemos afirmar, al N.C. 95%, que existen diferencias estadísticamente significativas entre los distintos valores de alpha y, por lo tanto, rechazar la H 0 .
9.2.2. Casos particulares del coeficiente a
En este punto hacemos referencia a la estimación de la fiabilidad de un test en el caso de que los ítems que lo componen sean dicotómicos, para lo cual haremos referencia a los estudios de Kuder y Richardson (1937, 1939). Las ecuaciones de Kuder-Richardson (1937) representan un caso particular del coeficiente «alpha» de Cronbach, en el supuesto de que los ítems sean dicotómicos. Esta estimación es una función del número de ítems y sus intercorrelaciones. Cuanto mayor sea el número de ítems, y cuanto mayor sea el valor de sus covarianzas, mayor será su consistencia interna, y mayor será la fiabilidad.
Teniendo en cuenta que la ecuación de Kuder-Richardson se basa en que los elementos del test son dicotómicos, éstos vendrán puntuados con un 1, en el caso de acierto (o de respuesta favorable en el caso de que se traten de medir variables no cognitivas) y, con un O, en el caso de fallo (o respuesta desfavorable en el caso de variables no cognitivas).
209
1 PSICOMETRÍA
Como ya se ha visto, el coeficiente «alpha» puede expresarse:
a=-n [1- L5J) n -1 52
X
Sabemos, por otra parte, que la varianza de una variable dicotómica cualquiera, «h», con proporción de aciertos Ph, y proporción de errores qh, siendo qh = 1 - Ph podemos expresarla en los siguientes términos:
1
con lo que la ecuación del coeficiente «alpha» que acabamos de ver puede escribirse:
[4.41]
donde:
n = número de elementos del test.
Ph =proporción de aciertos en el elemento h. ph = fh, igual también a la me-dia del elemento. N
qh = proporción de errores en el elemento h. qh = 1 - Ph
Phqh =varianza del elemento h.
5; = varianza total del test.
Dicha expresión recibe el nombre de ecuación de Kuder-Richardson20 (KR20).
Si los ítems que componen el test, además de ser dicotómicos, presentan la misma dificultad, podemos aplicar la ecuación de Kuder-Richardson 21 (KR21).
KR = _ n_(1- npq) 21 n - 1 5 2
X
[4.42]
210
expresarse:
variable dicotómica cualción de errores qh, siendo
illinos:
bamos de ver puede es-
[4.41]
~ igual también a la meN'
der-Richardson20 (KR20).
dicotómicos, presentan la r-Richardson 21 (KR21 ).
[4.42]
LA FIABILIDAD DE LAS PUNTUACIONES 1
donde:
n = número de elementos del test.
npq = suma de las varianzas de los elementos. Al ser iguales las varianzas se sustituye el signo sumatorio por «n» veces la misma varianza.
s; = varianza del test.
La expresión anterior se puede simplificar y expresarse en los siguientes términos:
X- -KR2, =-n- 1- 2 n
[
- ·p l n - 1 Sx
donde:
n = número de elementos del test.
s; = varianza del test.
X media de las puntuaciones empíricas.
EJEMPLO:
[4.43]
Supongamos un test (A) de fluidez verbal y otro test (8) de comprensión lectora, cuyas puntuaciones aparecen en las siguientes matrices de datos. El test de fluidez verbal sólo admite dos posibles puntuaciones, 1 y O. Calcular el valor del coeficiente de fiabilidad de ambos tests.
_ Test A . Test B
Ítems Ítems
Sujetos A B e D E F Sujetos A B e D E F
1 1 1 1 1 1 1 1 3 4 3 3 4 3
2 1 1 1 o 1 1 2 2 3 2 4 4 2
3 1 o 1 o 1 1 3 4 2 2 3 3 4
4 o 1 o 1 o 1 4 2 1 1 2 1 2
5 o o o o o o 5 1 1 1 2 1 2
6 1 o o o o o 6 o o 1 1 1 1
211
1 PSICOMETRÍA
Medias de los ítems en el Test B:
x, = 2; X2 = 11 83; X3 = 1167 ; X4 = 21 5; X5 = 2133 y X6 = 2133
TESTA
4 P =- =0 67
1 6 1
3 P =-=0 50
2 6 1
3 P =- =0 50
3 6 1
2 P = -=0 33
4 6 1
3 P =- =0 50
5 6 1
4 P =-=o 67
6 6 1
XA=3117
S~= 4145
TEST B
q, = 1 - o 1 6 7 = o 1 3 3 p,q, = 0167.0133 = 0122
q2 = 1-0150 = 0150
q2 = 1- 0150 = 0150
q4 = 1- 0133 = 0167 p4q4 = 0133.0167 = 0122
q5 =1-0150 =0150 p5q5 = 0150 · 0150 = 0125
q6 =1-0167=0133
s,2 = ~2 -(xf = 9+4+~6+4+1_(2)2 =1~67
52 = 1 6 + 9 + 4 + 1 + 1 - (1 83)2 = 1 82 2 6 1 1
52= 9+4+4+1+1+1_(167)2 =0 54 3 6 1 1
52 = 9 + 16 + 9 + 4 + 4 + 1 - (2 50)2 =o 92 4 6 1 1
52 = 16 + 16 + 9 + 1 + 1 + 1 - (2 33)2 = 1 90 5 6 1 1
212
(
52-_: 6 -
--r
=O
En el tendrá u
cotómio
Como inferior al
estrictam1
9.3. (o{ The -
Los COE
de Heise)
terna de le dos coefic
El coefi
33 yX6 =2,33
7 ·0,33=0,22
50 ·0,50=0,25
50·0,50=0,25
33 ·0,67=0,22
50·0 50=0,25 ' '
67·0,33 =0,22
LA FIABILIDAD DE LAS PUNTUACIONES 1
52 = 9 + 4 + 16 + 4 + 4 + 1 - (2 33)2 =o 90 6 6 ' '
x = 76
= 12 67 · 582 =
117 4 -12 672 = 35 14
B 6 1 1 6 1 1
R = KR = _n_(1- LPhqh J= aa 20 n -1 52
X
=~(1- 0,22+0,25+0,25+0,22+0,25+0,22)=0 82 5 4,45 '
R =a=-n-[1_:L5J ]=~(1 _1,67+1,82+0,54+0,92+1,90+0,90)= bb n-1 5; 5 35,14
=0,94
En el caso de aplicar KR21 con ítems cuya dificultad no es la misma, se obtendrá un valor inferior al de KR20 • En el test A, que es el que tiene los ítems dicotómicos el valor encontrado sería:
KR = _n_ 1- n = ~ 1- ' l 6 =O 80
[ x _ x
2
] [ 3 1 7
_ ~ l 21 n-1 5; 5 4, 45 '
Como se puede observar el valor obtenido mediante la fórmula KR21 es algo inferior al obtenido mediante la KR20, lo que indica que los ítems del test no son estrictamente paralelos.
9.3. Coeficientes basados en el análisis factorial de los ítems: Theta (9) y Omega (!l)
Los coeficientes Theta (8) de Carmines (Carmines y Zeller, 1979) y Omega (Q)
de Heise y Bohrnstedt (1970) constituyen dos indicadores de la consistencia interna de los ítems de un test y una aproximación al coeficiente alpha. Se trata de dos coeficientes basados en el análisis factorial de los ítems.
El coeficiente e se puede expresar mediante la siguiente fórmula:
213
1 PSICOMETRÍA
e=-n (1-_2_) n -1 A.1
[4.44]
donde:
n = número de ítems del test.
lv1 =primer autovalor de la matriz factorial; es decir, la varianza explicada por el primer factor antes de la rotación.
El coef iciente e es además un indicador de la unidimensionalidad de los ítems. Cuanto mayor sea la varianza que explica el primer factor mayor será el valor de theta y, por consiguiente, la intercorrelación entre los ítems, lo que implica que éstos se distribuyan en torno a una sola dimensión.
El coeficiente n se puede expresar mediante la siguiente fórmula:
donde:
n n
"52 -" 52h2 L.,¡ ¡ L.,¡ ¡¡
n = 1 - ---'--1; -1 ----'-1;- 1
-n n
:¿:¿cov(X1,Xh) j;J h;J
i"h
2.5} = suma de las varianzas de los ítems.
h} = comunalidad estimada del ítem j.
2.2.Cov (Xj, Xh) =suma de las covarianzas entre los ítems j y h.
[4.45]
Otra forma más sencilla de expresar el coeficiente n es en función de lascorrelaciones entre los ítems:
0=1----- [4.46]
Donde rjh representa la correlación entre los ítems j y h.
En general, y para los mismos datos, se verifica que a:::; e:::; n. La igualdad entre los coeficientes se verifica cuando los ítems son paralelos (Carmines y Séller, 1979).
214
EJE~
En 1 cinco f. de las ítems e
9.4. El -Cronl
sistencia con desi test total coeficier de la fial
rar este r test com coeficier de los & es mejor
E
[4.44]
la varianza explicada por
idimensionalidad de los mer factor mayor será el ntre los ítems, lo que im-
iente fórmula:
[4.45]
• ítems j y h.
Q es en función de lasco-
[4.46]
a~ e ~O.. La igualdad enel os (Carmines y Séller,
LA FIABILIDAD DE LAS PUNTUACIONES 1
EJEMPLO:
En la siguiente tabla aparecen los valores de la varianza explicada por los cinco factores obtenidos tras someter a un análisis factorial a 5 variables. La suma de las comunalidades es igual a 4.95 y la suma de las correlaciones entre los ítems es igual a 5.1. Calcular el valor de los coeficientes 8 y n.
Factor Varianza explicada
1 3,286
2 1,346
3 0,224
4 0,128
5 0,014
8 = _n_(1 - _2_)= -5- (1--
1-)= 0,869
n-1 A1 5-1 3,286
n- Lh2 n = 1- ' = 1-
5-
4'95
= o 996
2~ 5 + 2 o 5,1 1
n + L./Jh
9.4. El coeficiente beta (J3) de Raju
Cronbach (1951) introdujo el coeficiente alfa como una medida de la consistencia interna de un test. En el caso de que un test se divida en varios subtests, con desigual número de ítems, y se quiera estimar la consistencia interna del test total a partir de las puntuaciones totales de los sujetos en los subtests, el coeficiente alfa presenta el problema de que proporciona un valor infraestimado de la fiabilidad. El coeficiente f3 propuesto por Raju (Raju, 1977) permite superar este problema y proporciona una estimación adecuada de la fiabilidad de un test compuesto de varios subtests con distinto número de ítems. Se aplica este coeficiente cuando se desconocen las puntuaciones de los sujetos en los ítems de los distintos subtests. En el caso de conocer los valores de estas puntuaciones es mejor emplear el coeficiente a.
El coeficiente f3 viene dado por la expresión:
215
1 PSICOMETRÍA
donde:
k = número de subtests.
s; = varianza del test.
Sj = varianza de cada subtest.
nj = número de ítems en cada subtest.
N= número de ítems total de la batería.
EJEMPLO:
[4.47]
Hemos aplicado un test de destreza manual, compuesto de cuatro subtests, a una muestra de 200 empleados de correos. Los subtests están compuestos por A = 18, 8 = 30, C = 45 y O = 55 ítems respectivamente. La varianza total del test es igual a 50 y las varianzas de los respectivos subtests iguales as; = 5, Sb = 7, S~= 9 y S~ = 11. Calcular el valor de los coeficientes a y p.
a= _ 4_ ( 1- 5 + 7 + 9 + 11 )= 0 48 4-1 50
1
~ = 50- (5 + 7 + 9 + 11) =o 50 50[1 - (0,015+0,041+0,092+0,138)]
1
En el caso de que los distintos subtests contengan el mismo número de ítems, entonces el coeficiente p es igual al coeficiente a. (Véase Apéndice al final del tema)
1 O. ESTIMACIÓN DE LA PUNTUACIÓN VERDADERA DE LOS SUJETOS EN El ATRIBUTO DE INTERÉS
Una vez estudiado el problema de cómo poder calcular la fiabilidad de un test mediante los procedimientos descritos anteriormente, estamos en condicio-
216
[4.47]
, esto de cuatro subtests, a
están compuestos por La varianza total del test
iguales a S~ = 5, Sb = 7,
a y~·
ismo número de ítems, enApéndice al final del tema)
ERDADERA DE LOS S
lcular la fiabilidad de un estamos en condicio-
LA FIABILIDAD DE LAS PUNTUACIONES 1
nes de poder abordar el problema de cómo hacer estimaciones acerca del valor de la puntuación verdadera de un sujeto en un test y del error que afecta a las puntuaciones empíricas obtenidas en el mismo. Desgraciadamente no podemos calcular el valor exacto de la puntuación verdadera de un sujeto, pero sí establecer un intervalo confidencial dentro del cual se encontrará dicha puntuación con un determinado nivel de confianza. Dentro de este apartado veremos tres formas de llevar a cabo esta estimación: la primera mediante la desigualdad de Chebychev, la segunda basada en la distribución normal de los errores y, la tercera basada en el modelo de regresión lineal de mínimos cuadrados.
1 0.1. Estimación mediante la desigualdad de Chebychev
Si no se hace ningún supuesto sobre la distribución de las puntuaciones empíricas o de los errores, se aplica la desigualdad de Chebychev:
[4.48]
donde:
1---; =nivel de confianza utilizado. K
Se = error típico de medida.
EJEMPLO:
Habiendo administrado a una muestra de 200 sujetos un test de razonamiento numérico, se obtuvieron los siguientes resultados: X= 52 , Sx = 7 y rxx = 0,73. Estimar la puntuación verdadera de un sujeto que obtuvo en el test una puntuación empírica de 65 puntos. Nivel de confianza del 95%.
se = SX ~1- ( XX = 7 .j1- o, 73 = 3, 64
1 1--
2 =O, 95; K = 4, 5
K
P{l65- VI~ 3,64 . 4,5} 2 o, 95
P{-16,38~IV-65I~16,38}2 0,95
P{48,62 ~V~ 81,38} 2 0,95
217
1 PSICOMETRÍA
Por lo tanto, la puntuación verdadera se encontrará entre los valores 48,62 y 81,38. Este es, sin embargo, un intervalo confidencial demasiado amplio que conlleva una estimación vaga. Esta amplitud exagerada del intervalo confidencial puede ser debida, en primer lugar, a un coeficiente de fiabilidad bajo o, en segundo lugar, a que el método de Chebychev no considera el tipo de distribución de las puntuaciones empíricas.
1 0.2. Estimación basada en la distribución normal de los errores
Este método asume una distribución normal de los errores de medida (con media O y varianza S~) y de las puntuaciones empíricas condicionadas a un determinado valor de V.
Para la determinación del intervalo confidencial dentro del que se encontrará la puntuación verdadera del sujeto seguiremos los siguientes pasos:
1) Se fija un nivel de confianza y se determina el valor Zc correspondiente buscándolo en la tabla de distribución normal. Por ejemplo, para un nivel de confianza del 95% tendremos un valor Zc igual a 1,96.
2) Calcular el error típico de medida Se.
se= sX.J1- (XX ¡ para puntuaciones directas 0 diferenciales
Sze = .j1- rxXI para puntuaciones típicas
3) Calcular el error de medida máximo (fmáxl que estamos dispuestos a admitir. Este error de medida se verá afectado también por el nivel de confianza adoptado.
4) Calcular el intervalo confidencial en el que se encontrará la puntuación verdadera.
IC =X± Emáx
EJEMPLO:
Habiendo administrado a una muestra de 200 sujetos un test de razonamiento
numérico, se obtuvieron los siguientes resultados, X= 52, Sx = 7 y rxx = 0,73. Estimar la puntuación verdadera (en puntuaciones directas, diferenciales y típicas)
218
entre los valores 48,62 y demasiado amplio que del intervalo confidende fiabilidad bajo o, en
idera el tipo de distribu-
mal de los errores
errores de medida (con condicionadas a un de-
del que se encontrará
ientes pasos:
lor Zc correspondiente r ejemplo, para un nivel
a 1 ,96.
renciales
estamos dispuestos a adién por el nivel de con-
contrará la puntuación
un test de razonamiento 2, Sx = 7 y rxx = 0,73. Es
diferenciales y típicas)
LA FIABILIDAD DE LAS PUNTUACIONES 1
de un sujeto que obtuvo en el test una puntuación empírica directa de 65 puntos. N.C. 95%.
X= 65 ; X= 65- 52= 13 ; z = 65- 52 = 1 86 X 7 f
N.C.95%:::::} Zc = ±1, 96
fmáx =Zc ·Se =1,96·3,64=7,13
{72, 13
1 e = X± Emáx = 65 ± 7,13 ~ ; 57,85 ~V~ 72,13 (Puntuaciones 57, 87 Directas)
{20, 13
1 e =X± Emáx = 13 ± 7,13 ~ ; 5,87 ~V~ 20,13 5,87
Sz. = ~1- rxx = .J1- 0,73 =O, 52
fmáx = Zc · Sze = 1, 96 · 0,52 = 1,02
{2,88
l.e = Zx ± fmáx = 1,86 ± 1,02 ~ 0,84
O, 84 ~ Zv ~ 2, 88 (Puntuaciones Típicas)
(Puntuaciones Diferenciales)
Como se puede apreciar, con respecto a la estimación según el procedimiento de Chebychev, el intervalo confidencial se ha reducido sensiblemente.
La principal ventaja que presenta la utilización de un intervalo confidencial, a pesar de las críticas formuladas por Nunnally (1970), es que clarifica el hecho de que una puntuación empírica está afectada por un cierto error de medida. Es decir, si un test presenta un coeficiente de fiabilidad bajo y, consiguientemente, poca precisión de medida, los intervalos confidenciales son muy amplios. A medida que dichos coeficientes van incrementándose, los valores extremos del intervalo se acotan denotando una aproximación a la puntuación verdadera del sujeto (Al len y Yen, 1979; Yela, 1984).
219
1 PSICOMETRÍA
1 0.3. Estimación basada en e l Modelo de Regresión
Así como la correlación entre las puntuaciones verdaderas y los errores de medida es igual a cero (rve = 0), no sucede lo mismo entre la correlación de las puntuaciones empíricas de los sujetos y los errores de medida, puesto que dichas puntuaciones se ven afectadas por un cierto componente de error produciéndose un sesgo. Esta correlación vendrá expresada, como ya hemos visto, como
( Xe = .J1 - (XX
La correlación así establecida es siempre igual o mayor de cero. Su valor máximo se alcanzará cuando la fiabilidad del test sea nula (rxx =O) y su valor mínimo se alcanzará cuando la fiabilidad del test sea perfecta (rxx = 1 ). En el primer caso las puntuaciones empíricas coincidirán con los errores y, en el segundo caso, no habrá errores y las puntuaciones empíricas coincidirán con las verdaderas.
En cualquier caso, como esa correlación es siempre positiva, las puntuaciones empíricas son siempre sesgadas y, por lo tanto, es más conveniente establecer el intervalo confidencial no a partir de las puntuaciones empíricas (que son sesgadas) sino a partir de la puntuación verdadera estimada, que podremos calcular mediante el modelo de regresión lineal según el criterio de mínimos cuadrados.
Las ecuaciones de la recta de regresión de Y sobre X vienen expresadas por las siguientes ecuaciones:
1 - S - S S ( - ) -Puntuaciones Directas: Y'= (Y- rxy _____!:'_X)+ rxy _____!:'_X= rxy _Y X- X +Y
sx sx sx
, sy - Puntuaciones Diferenciales: y = rxy - X siendo X= (X- X)
sx
X-X - Puntuaciones Típicas: ZY, = rxy z x siendo Zx =-S-
x
Nota: El lector interesado puede encontrar una explicación más detallada en los textos de Introducción al Análisis de Datos y Diseños de Investigación.
A partir de dichas ecuaciones de regresión podemos establecer las ecuaciones correspondientes para estimar el valor de la puntuación verdadera. Dichas ecuaciones vendrán expresadas de la siguiente forma:
220
as y los errores de tre la correlación de las
ida, puesto que dichas te de error produciénya hemos visto, como
r de cero. Su valor máa (rxx =O) y su valor mí
cta (rxx = 1 ). En el pris errores y, en el segundo incidirán con las verda-
positiva, las puntuacioás conveniente estable
ones empíricas (que son ada, que podremos cal
criterio de mínimos cua-
X vienen expresadas por
S - ) -X= r _l'_ (X- X +Y xy S
X
establecer las ecuacioción verdadera. Dichas
LA FIABILIDAD DE LAS PUNTUACIONES 1
1. Ecuación de regresión en puntuaciones directas de V sobre X.
[4.49]
S S S - -Sabemos que, rxv ---"é. = ---"é. ---"é. = rx: = rxx y dado que V = X podemos estable-cer que: Sx Sx Sx
- -V' = rxx x + (X - (XX X) [4 .50] V' = rxx(X - X) + X
2. Ecuación de regresión en puntuaciones diferenciales.
sv d 1 s v sv s: COmO rxv = - ten remos que: V = --X = -2
X = r ·X S SS S XX X X X X
1
V=rxx·X
v' = rxx (X- X)
3. Ecuación de regresión en puntuaciones típicas.
EJEMPLO:
[4.51]
[4.52]
Con los datos del ejemplo anterior, estimar la puntuación verdadera de un sujeto que obtuvo en el test una puntuación empírica de 65 puntos. N.C. 95%
Puntuaciones directas:
V'= rxx X +(X- rxx X) = 0,73 · 65 +(52 -0,73 · 52)= 47,45 + 14,04 = 61,49
Puntuaciones diferenciales:
v' = rxx · X= 0,73 · (65 - 52) = 9,49
221
1 PSICOMETRÍA
Puntuaciones típicas:
65-52 zv' = rxv. z x = .JoJ3. = 0,85 ·1,86 = 1,58
7
Una vez estimado el valor de la puntuación verdadera se seguirá el esquema general con el fin de establecer el intervalo confidencial en el que se pueda aceptar, a un determinado nivel de confianza, que se encuentra la puntuación verdadera del sujeto. Los pasos a seguir serían los siguientes:
222
Adoptar un nivel de confianza y determinar el valor zeta crítico (Zc)·
Calcular el error típico de estimación Svx- Siendo:
Svx = Sx_j1- rxx .fr:: (Puntuaciones directas o diferenciales)
Szvzx = _j1- rxx .fr:: (Puntuaciones típicas)
Calcular el error máximo de estimación fmáx· Siendo fmáx = Zc · Svx en puntuaciones directas o diferenciales y Emáx = Zc · Szvzx en puntuaciones típicas.
Establecer el intervalo confidencial a partir de la estimación puntual obtenida al aplicar las ecuaciones de regresión.
Dicho intervalo viene expresado por: V'± Emáx' ó v' ± fmáx' ó Zv' ± fmáx
Para los datos del ejemplo anterior tenemos:
N.C. 95% => Zc = ±1,96
Svx =Sx-J1-rxx .fr:: =7~~1--0-J-3.JOJ3 = 3,09
fmáx = zc. se= 1,96. 3,09 = 6,06
' {67,55 IC =V ± fmáx = 61,49 ± 6,06---7 55,43
{15,55
/.C.=v'±fmáx =9,49 ±6,06---7 3,43
En puntuaciones directas
En puntuaciones diferenciales
Szvzx = .j1- rxx Jr:: = .j1- 0,73.JOJ3 = 0,44
de
Si e
6 = 1,58
rase seguirá el esquema en el que se pueda acepentra la puntuación ver
es:
1lor zeta crítico (Zc).
ferenciales)
do Emáx = Zc · Svx en · Szvzx en puntuaciones
estimación puntual ob-
iones directas
·ones diferenciales
fmáx = Zc · SZvZx = 1,96 · 0,44 = 0,86
{2,44
f.C.= Zv. ± Emáx = 1,58 ± 0,86 ~ 0,72
LA FIABILIDAD DE LAS PUNTUACIONES 1
En puntuaciones típicas
11. FIABILIDAD DE UNA BATERÍA DE TESTS
Se trata de calcular la fiabilidad de la batería en función de los coeficientes de fiabilidad, varianzas y covarianzas de los subtests que la van a conformar.
La fórmula a utilizar en este caso será:
Siendo:
s; = varianza del subtest j.
rjj =coeficiente de fiabilidad del subtestj.
5} = varianza de la batería total.
223
1 PSICOMETRÍA
12. EJERCICIOS DE AUTOEVALUACIÓN
1. La razón entre la desviación típica de los errores y la desviación típica de las puntuaciones empíricas es 0,45. ¿Cuál es el valor del coeficiente de fiabi 1 idad?
2. Calcular el coeficiente de fiabilidad de un test sabiendo que la varianza de
las puntuaciones empíricas es igual a 36 y el error típico de medida es 3.
3. ¿Cuál es el valor del coeficiente de fiabilidad si la proporción de varianza verdadera que hay en la varianza empírica de un test es O, 90?
4. Hemos aplicado un test a un grupo de 100 sujetos. La desviación típica de los errores de medida es 2, lo que significa el 10% de la varianza de las puntuaciones verdaderas. Calcular el coeficiente de fiabilidad de dicho test.
5. Hemos aplicado un test de fluidez verbal a un grupo de 150 sujetos. La varianza de las puntuaciones empíricas de los sujetos de dicho grupo fue 36 y el coeficiente de fiabilidad 0,85.
Calcular:
224
a) El error típico de medida del test.
b) El intervalo confidencial dentro del cual podemos afirmar que se encontrará la puntuación diferencial verdadera de un sujeto cuya puntuación típica empírica fue de 0,75 (N.C. 99%).
6. El Instituto Nacional de Calidad desea examinar el nivel de conocimientos en el área de Humanidades de los alumnos al finalizar la educación obligatoria . Para ello, construye una prueba de cinco preguntas cortas, calificadas en una escala de 1 a 5 cada una de ellas; esta prueba se administra a una muestra representativa de 2.000 alumnos procedentes de todas las comunidades autónomas. En la tabla adjunta se presentan las respuestas dadas a las preguntas de dicha prueba por los seis primeros alumnos de la muestra.
Calcular:
a) La fiabilidad de la prueba.
b) Si se añadieran a la prueba 5 preguntas paralelas a las ya existentes, ¿se obtendría un coeficiente de fiabilidad significativamente diferente al anterior? La correlación entre las puntuaciones del test original y del alargado es 0,85 (N.C. 95%).
~s y la desviación típica de ~1 valor del coeficiente de
abiendo que la varianza de ror típico de medida es 3.
la proporción de varianza
n test es O, 90?
. La desviación típica de O% de la varianza de las te de fiabilidad de dicho
de 150 sujetos. La vade dicho grupo fue 36
mos afirmar que se ende un sujeto cuya pun-
r el nivel de conocimienal finalizar la educación neo preguntas cortas, ca
ll as; esta prueba se admimnos procedentes de toadjunta se presentan las
por los seis primeros
as a las ya existentes, ¿se cativamente diferente al es del test original y del
LA FIABILIDAD DE LAS PUNTUACIONES 1
e) Estimar la puntuación verdadera en el test original del alumno número 4.
1 3 2 4 3 4
2 2 3 4 3 2
3 5 4 3 4 5
4 2 1 3 2 1
5 3 2 2 1 3
6 4 5 4 5 4
7. Ejercicios conceptuales
A continuación se ofrecen una serie de enunciados ante los que tendrá que responder si son verdaderos o falsos:
1. Si dos tests son paralelos, las medias de las puntuaciones empíricas deben ser iguales
2. El coeficiente de fiabilidad expresa la proporción de la varianza verda-dera que hay en la varianza de las puntuaciones empíricas.
3. El coeficiente a es un índice de la estabilidad de las medidas.
4. Un test tiene un único coeficiente de fiabilidad.
5. En el caso de que un test esté formado por ítems dicotómicos de igual nivel de dificultad, el mejor estimador del coeficiente de fiabilidad lo constituye la ecuación KR21.
6. Si un test tiene un coeficiente de fiabilidad igual 0,80, el índice de fiabilidad es igual a 0,64.
7. Si se cumple que 5~ = 5; el coeficiente de fiabilidad rxx = 1.
8. Para calcular la fiabilidad de un test mediante el método de dos mitades, aplicamos el test una sola vez.
9. En la fórmula de Spearman-Brown, n indica el número de ítems del test.
1 O. Se define el error típico de medida como la desviación típica de los errores de medida.
11. El coeficiente de fiabilidad de un test es igual a cero si 5~ =O.
225
1 PSICOMETRÍA
226
12. El coeficiente de fiabi 1 idad varía entre -1 y 1 .
13 . La fiabilidad de un test depende de la longitud del mismo.
14. El valor de a ~ Gv· 15. La correlación entre las puntuaciones empíricas y los errores es siem
pre igual cero.
del mismo.
s y los errores es siem-
LA FIABILIDAD DE LAS PUNTUACIONES 1
13. SOlUCIONES A lOS EJERCICIOS DE AUTOEVAlUACIÓN
1.
5e =o 45 S 1
X
rxx =1- ~~ = 1-0,452 =1-0120=0180 X
2.
o también
5 2 9 rxx =1-~=1--=1-0 25=0 75 52 36 1 1
X
3.
52 =-2-=20
V 011 o
52 20 rxx = ----'¡ =- = 0183 sx 24
5.
a) Se =Sx.J1-rxx =6.J1-0 1 85 =2132
b) N.C. 99% ~ Zc = ±2158
27 'xx =- =01 75
36
227
1 PSICOMETRÍA
Z = 0,75-7 X= 0,75 · 6 = 4,5
svx = seJT: = 2,32..}0,85 = 2,14
V'=rxx · X=0,85·4,5=3,82
fmáx = 2, 58· 2,14 = 5, 52
3, 82 ± 5, 52 -7-1,70::; V::; 9,34
6.
Alumnos x1 x2 x3 x4 Xs
1
2
3
4
5
6
a)
3 2 4 3 4
2 3 4 3
5 4 3 4
2 1 2 2
3 2 2 1
4 5 4 5
I,sl
[
n l a= n~ 1 1- ;~~
S~= 67/6- (19/6)2 = 1, 14
S~= 59/6-(17/6)2 = 1, 81
S~ = 65/6- (19/6)2 =O, 81
2
5
1
3
4
s¡ = 64/6- (18/6)2 = 1, 67
S~= 71/6- (19/6)2 = 1, 81
S~= 1562/6- (92/6)2 = 25,22
Preguntas
X x2 1 x2 2 x;
16 9 4 16
14 4 9 16
21 25 16 9
8 4 1 4
11 9 4 4
22 16 25 16
65
a= _2__(1_1,14+1,81+0,81+1,67+1,81]= 0 89 5-1 25, 22 '
228
x¡ X~ X2
9 16 256
9 4 196
16 25 441
4 1 64
1 9 121
25 16 484
64 71 1562
7
x; X~ X~
16 9 16
16 9 4
9 16 25
4 4 1
4 1 9
16 25 16
71
0,89
X?
256
196
441
64
121
484
1562
b)
e)
LA FIABILIDAD DE LAS PUNTUACIONES 1
Teniendo en cuenta el resultado obtenido, podemos concluir que el test constituye un buen instrumento para medir el nivel de conocimientos en el área de Humanidades.
n = EF 1 El= 1 O 15 = 2
r = 2·0,89 =0 94 XX 1 + 0,89 l
(á, - á2 ) ~N - 2
t= ~4(1-á1 )(1-á2 )(1-r¡~ ) :=TN-2
(0, 94-0,89)~6-2 t = = 1,1 7 < t 95 4 = 2, 78
~4(1-0,94)(1-0,89)(1-0,852 ) . '
No parecen existir diferencias estadísticamente significativas entre las pruebas de 5 y 1 O preguntas, a ese nivel de confianza.
V' = rxx (X - X) + X
V'= 0,89(8 -15,33) + 15,33 = 8,81
7. Soluciones a los ejercicios conceptuales
1. El enunciado es verdadero.
Teniendo en cuenta que la esperanza matemática de los errores de medida es cero y que las puntuaciones verdaderas de los sujetos son iguales en ambos tests, podemos concluir la existencia de igualdad entre las medias de las puntuaciones empíricas.
2. El enunciado es verdadero.
Se expresa como el cociente entre la varianza de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas y se puede interpretar como la proporción de la varianza de las puntuaciones empíricas de los sujetos que se debe a la varianza verdadera o lo que es lo mismo, la proporción de varianza verdadera que hay en la varianza empírica.
229
1 PSICOMETRÍA
230
3. El enunciado es falso.
El coeficiente a es un estimador de la consistencia interna del test.
4. El enunciado es falso.
El valor del coeficiente de fiabilidad no depende únicamente de las características propias del test, sino de otros factores como la variabilidad de la muestra en la que es aplicado y la longitud del test.
5. El enunciado es verdadero.
6. El enunciado es falso.
rxv = JT:: =.Jo, 80 =O, 89
7. El enunciado es verdadero.
8. El enunciado es verdadero.
9. El enunciado es falso.
((n» indica el número de veces que hay que alargar o reducir la longitud del test.
1 O. El enunciado es verdadero.
11. El enunciado es falso.
52 rxx = 1, puesto que rxx = 1- --T
sx 12 . El enunciado es falso.
El coeficiente de fiabilidad varía entre O y 1. Definimos el coeficiente de fiabilidad como el cociente entre la varianza de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas. Esta forma de expresar el coeficiente de fiabilidad nos indica la proporción de la varianza verdadera que se puede explicar a partir de la varianza empírica de las puntuaciones de los sujetos. A medida que dicha proporción aumenta, disminuye el error de medida. Si rxx' = 1, el error es cero lo que implica una fiabilidad perfecta del test. Sin embargo, a medida que dicha proporción disminuye se produce un incremento en el error de medida. En el caso de que rxx' = O, la varianza de los errores de medida sería igual a la varianza de las puntuaciones empíricas.
cia interna del test.
e únicamente de las cares como la variabilidad
d del test.
=1
largar o reducir la longi-
Definimos el coeficiente nza de las puntuaciones
. empíricas. Esta forma de ica la proporción de la a partir de la varianza . A medida que dicha
ida. Si rxx' = 1, el error del test. Sin embargo, a
1 roduce un incremento en la varianza de los errores tuaciones empíricas.
LA FIABILIDAD DE LAS PUNTUACIONES 1
13. El enunciado es verdadero.
Uno de los factores que influye en la fiabilidad de un test es su longitud, es decir, el número de ítems que lo componen. Cuantos más ítems representativos del rasgo a medir se utilicen mayor será la información que obtengamos acerca del atributo que estemos estudiando y, consiguientemente, cabe pensar que menor será el error que cometamos al pronosticar la puntuación verdadera de un sujeto. Por lo tanto, la fiabilidad del test se incrementará. Ahora bien, llega un momento en que por más que se aumente el número de ítems ya no se produce un aumento significativo.
14. El enunciado es verdadero.
El coeficiente alpha puede ser considerado como una estimación del límite inferior del coeficiente de fiabilidad de un test.
15. El enunciado es falso.
Esta correlación viene expresada como: rxe = .J1- rxx · La correlación así establecida es igual o mayor de cero. Su valor máximo se alcanzará cuando la fiabilidad del test es nula (rxx = O) y su valor mínimo se alcanzará cuando la fiabilidad del test es perfecta (rxx =1 ).
231
1 PSICOMETRÍA
14. APÉNDICE
A continuación se ofrecen las demostraciones de las fórmulas que han ido apareciendo a lo largo del tema.
4.3
4.5
4.6
4.8
4.9
4 .1 o
232
I,ve I,ve 1 I,ve r =--=----.Como --=O~r =0 ve NS S N S S N ve
v e v e
E=X- V
Por definición, la ecuación del modelo establece que: X= V+ E. Despejando: E = X- V
E(e) =O
e= X- V, luego la E(e)= E(X)- E(V). Según el primer supuesto del modelo sabemos que: E(X) =V, por lo tanto: E(e) =V- E(V) =V- V= O
Dado que la covarianza es, Cov (v:,e) = r ve Sx Se, y, según el segundo supuesto, rve =O podemos inferir que Cov (v:,e) =O
La varianza de una variable que es suma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas. s; = S(v+e) = S~ + S~ + 2Cov(v,e). Partiendo del segundo supuesto del mo-
Cov(v e) . . delo sabemos que, rve = ' , de donde podemos concluir que el va
sxse lor de Cov(v:,e) = O. Por lo tantos; = S~ + S~
Cov(X, V) =S~
La Cov(X, V) = E(XV)-E(X)E(V). Según el modelo lineal X= V+ e, sustituyendo
4
4.1
as fórmulas que han ido
que: X = V + E. Despe-
er supuesto del modelo )=V-V=O
y, según el segundo su-
dos es igual a la suma de doble de las covarianzas.
supuesto del mo-
mos concluir que el va
lineal X= V+ e, sustitu-
4.11
4.12
LA FIABILIDAD DE LAS PUNTUACIONES 1
Cov(X,V) = E((V+e)V)-E(V+e)E(V) = E(VJ2+E(Ve)-E(V)E(V)-E(e)E(V)
Puesto que: E(Ve)-E(e)E(V) = Cov(~~¡e), y la Cov(~e) = O, podemos establecer,
Cov(X, V)=E(V2)-(E(V))2 =S~
S r= ---"-xe S
X
En puntuaciones diferenciales:
r = Ixe = L(v+e)e =:¿ve+ :¿e2 =:¿ve+ :¿e
2
xe NSxSe NSxSe NSxSe NSxSe NSxSe
"" "" 2 ~ve ~e como -- = rveSvSe, y -- = s;, podemos establecer que
N N
rxe = rve SvSe + l = Se ya que r ve Sv Se = O, por ser igual a la covarianza SxSe SxSe Sx
entre las puntuaciones verdaderas y los errores.
Cov (X1,X2) = Cov (V1,V2) = f(X1,X2)- f(X1) f(X2). Según el modelo lineal X= V+ e, sustituyendo en X1 y X2 .
Cov (X1,X2) = f((V1+e1) (V2+e2))- f(V1+e1) f(V2+e2) = f(V1 V2) + f(V1e2) + + f(e1 V2) + f(e1e2)- f(V1) f(V2)- f(V1) f(e2)- f(e1) f(V2)- f(e1) f(e2)
Como: f(V1 e2) - f(V1) f(e2) - Cov (V1 ,e2) = O
f(e1 V2)- f(e1) f(V2)- Cov (e1,V2) =O
f(e1 e2) - f(e1) f(e2) - Cov (e1 ,e2) = O
Es decir, no existe covariación entre las puntuaciones verdaderas y los errores, y tampoco entre los errores entre sí, por lo que podemos concluir que:
Cov (X1 ,X2 ) = f(V1 V2) - f(V1) f(V2) = Cov (V1, V2)
Si tenemos formas paralelas entonces, Cov (X1,X2) = Cov (V1,V2) = Var (V)
233
1 PSICOMETRÍA
4.13
4 .14
4.17
4 .18
234
Por definición sabemos que la correlación entre las puntuaciones obtenidas por una muestra de sujetos en dos formas paralelas la podemos expresar
Cov(X, X') S ' 1 . ' (3 1 O) C (X X' ) 52 como rxx· = . egun a expres1on . : ov , = v .
SxSx·
Asímismo, hemos establecido que las varianzas de las puntuaciones empíricas en dos tests paralelos son iguales, luego podemos establecer la igual-
dad: Sx = Sx· y que Sx Sx = s;. De donde se concluye que rxx· = 5~ = r}v . Sx
Como consecuencia de la expresión 4.13, se deduce fácilmente que rx1x2 = rx1x3 = rx2x3 = .... · = rx¡xk
Sabemos que la correlación entre dos formas paralelas de un test (X, X')
d Cov(X,X') S , h . C pue e expresarse como: rxx· = . egun emos v1sto ov (X,X') = SxSx·
= S~ y, por ser formas paralelas, Sx = Sx·
Podemos establecer rxx· = 5~ y que el coeficiente de fiabilidad, dados dos Sx
o mas tests paralelos, es el mismo para todos puesto que se mantiene constante tanto el valor de la varianza verdadera como el de la varianza empírica.
s: 52 52 52 ( XX' = 21 puesto que X = V + e tenemos,
sx
as puntuaciones obtenidas elas la podemos expresar
3.10): Cov (X,X') = S~.
de las puntuaciones em,demos establecer la igual-
5~ 2 ·luye que rxx' = - 2 = fxv ·
Sx
uce fácilmente que
ralelas de un test (X, X')
hemos visto Cov (X,X') =
de fiabilidad, dados dos
puesto que se mantiene como el de la varianza
4.19
4.20
4.21
LA FIABILIDAD DE LAS PUNTUACIONES 1
S , h . 1 s: d s; - s: s2 s2 s2 egun emos VIStO, rxx' = --2' operan o rxx' = 2 ::::? rxx' X = X - e ' sx sx
despejando 5~ tenemos s: = s;- s;rxx' = s;- s;(1- rxx' ) de donde:
se = 5x~1- rxx'
2 - L(v- v')2 En puntuaciones diferenciales podemos expresar: Svx - -=--
n
Mediante la ecuación de regresión en puntuaciones diferenciales v' = rxxx,
Sustituyendo:
S 52
Como hemos visto: rxv = ~ y rxx = 5~ de donde: SX X
s; + (XXs; - 2rXXSVSX 5v = s; + (XXs;- 2rXXs; = s;- s;rXX = s;(1- (XX), teniendo
sx
en cuenta que, Sv = Sx .¡¡:: sustituyendo en la expresión anterior:
235
1 PSICOMETRÍA
4.24
236
Por lo general, la puntuación V' estimada a partir de las ecuaciones de la recta de regresión no coincide con la puntuación verdadera del sujeto V. La diferencia entre la puntuación verdadera del sujeto (V) y la puntuación verdadera estimada (V') es lo que conocemos como el error de estimación. Definimos el error típico de estimación (5vxl, como la desviación típica de los errores de estimación.
Según el modelo, las varianzas en los tests paralelos son iguales por lo que:
5x1-x
2 = 2s; - 2rxx's; = 25;(1- rxx') simplificando y sacando la raíz cuadrada:
SX¡-X2 =5x ~1-rxx'..Ji
R = nrxx xx 1 + (n - 1)rxx
Partimos de la definición del coeficiente de fiabilidad como cociente entre la varianza verdadera y la varianza empírica de las puntuaciones de los sujetos en un test.
R = S~v XX 52
nx
A continuación descomponemos tanto la varianza verdadera como la varianza empírica del test total.
La varianza de las puntuaciones verdaderas, S~v' será igual a la suma de las «n» varianzas de las puntuaciones verdaderas más la suma de las «n(n-1 )»
covarianzas: S~v = L,.s;a + L,.rvav65va 5v
6• Puesto que partimos del supuesto
de ítems paralelos, tanto las varianzas como las covarianzas son iguales, por lo que la expresión anterior puede formularse como:
s~v = ns; + n(n -1)rv V sv svb' También sabemos que la correlación rv V = 1 a aba ab 1
ya que es la correlación entre las puntuaciones verdaderas, y que Sva = 5v6,
Por lo tanto: s~v = ns; + n(n -1)5; . a a
tir de las ecuaciones de la )n verdadera del sujeto V. sujeto (V) y la puntuación mo el error de estimación. mo la desviación típica de
~los son iguales por lo que:
, sacando la raíz cuadrada:
lidad como cociente entre las puntuaciones de los su-
verdadera como la va-
será igual a la suma de las la suma de las «n(n-1 )»
que partimos del supuesto
covarianzas son iguales,
como:
u e la correlación r vavb = 1,
verdaderas, y que Sva = 5v6,
LA FIABILIDAD DE LAS PUNTUACIONES 1
Sacando factor común a ns;a, S~v = ns;a (1 + (n - 1)). Simplificando podemos
concluir que la varianza de las puntuaciones verdaderas en el test total puede expresarse: S~v = nS~a
Veamos ahora lo que ocurre en el caso de la varianza empírica, S~x · La varianza de las puntuaciones empíricas será igual a la suma de las «n» varianzas de las puntuaciones empíricas más la suma de las «n(n-1 )» cova-
rianzas: s; = L,.s;a + L,.rXaXb s Xa sXb" Puesto que partimos del supuesto de
ítems paralelos, tanto las varianzas como las covarianzas son iguales entre,
por lo que la expresión anterior puede formularse como S~x = nS~ +
+ n(n -1)rXaXb s ;a 1 por ser SXa = SXb
Sacando factor común a ns; 1 s~x = ns; (1 + (n -1)rx Xb ). a a a
Sustituyendo el valor de la varianza verdadera y la varianza empírica en la expresión del coeficiente de fiabilidad, tenemos:
2 n52 52 R - 5
nv - Va = n ~ . Si tenemos en cuenta que XX s~X ns;a (1 + (n -1)rXaXb ) SXa 1 + (n -1)rXaXb
52 ~2a = rx x y que las intercorrelaciones entre cada dos o mas tests paralelos 5 a a
X a
son iguales, es decir, rx X = rx Xb =(XXI podemos concluir: Rxx = nrxx a a a 1 + (n - 1)rxx
Partiendo de lo anterior, cuando se aumenta «n» veces la longitud del test la varianza de los errores sería: s~e = ns; + n(n -1)rxx
Un caso particular de esta fórmula es cuando se duplica la longitud del test inicial.
En ocasiones lo que pretendemos es que un test tenga una determinada fiabilidad, y lo que nos planteamos es saber cuántos ítems tendríamos que aumentar el test para conseguir dicho coeficiente.
El número de ítems que tenemos que aumentar dicho test lo podemos hallar despejando el término «n» de la ecuación general de Spearman-Brown.
R = nrxx xx 1 + (n - 1)rxx
237
1 PSICOMETRÍA
4.28
238
Una vez conocido el valor de «n» podemos calcular el número de elementos finales (EF) . EF = El · n. La diferencia entre los ítems finales y los ítems iniciales nos dará el número de elementos que habría que añadir o disminuir un test para obtener el coeficiente de fiabilidad deseado.
R = 2rxx XX 1 + rxx
Supongamos que tenemos una serie de formas paralelas y que juntamos
éstas de dos en dos: xa + xb, xe + xd·
Puesto que dichos tests son paralelos podemos establecer: rxx = rab = rae =
... = red' es decir, dados dos o mas tests paralelos, las intercorrelaciones entre cada dos de ellos son iguales.
Por definición el coeficiente de fiabilidad del test Rxx puede expresarse, en
. . . L(Xa +xb)(xc +xd) puntuaciones d1ferenc1ales como: R xx = , al ser formas
N s (Xa +xb )s (Xc +xd)
paralelaS, laS deSViaCiOneS típiCaS Serán igualeS (S(Xa+Xb) = s (Xc+xd) )t p0r 10 que podemos expresar el denominador como S(xa+xb)' y sustituyendo:
L(Xa + xb)(xc + xd) R xx = N -----,--2--
S (xa +xb) .
Si desarrollamos el primer término tendremos:
L(Xa + xb)(xc + xd) = LXaXc + LXaXd + LXbXc + LXbXd
N N N N N
puesto que estos cuatro términos expresan covarianza, les podemos susti
tuir por rae Sa Se+ rad S a Sd + rbe Sb Se + rbd Sd Sd y, al ser formas paralelas, la expresión puede escribirse como: 4S;rxx·
Si desarrollamos el término S(xa+x6¡, puesto que la varianza de una variable
que es suma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas:
tl cular el número de elelos ítems finales y los
que habría que añadir o abilidad deseado.
aralelas y que juntamos
stablecer: rxx = rab = rae = s, las intercorrelaciones
Rxx puede expresarse, en
)(x + x ) e d 1 al ser formas
J5 (xc+xdl
(Xa+Xb) = 5 (Xc+Xd) )t pOr lO que y sustituyendo:
ianza, les podemos sustiy, al ser formas paralelas,
• varianza de una variable as varianzas de cada una
LA FIABILIDAD DE LAS PUNTUACIONES 1
Sustituyendo,
y simplificando,
R = 2rxx XX 1 + rxx
Esta misma expresión puede obtenerse a partir de la influencia del aumento de la longitud de un test sobre la varianza verdadera, la varianza empírica y la varianza de error.
En primer lugar veamos como se ve afectada la varianza de las puntuaciones empíricas de los sujetos, cuando se duplica la longitud del test. Supuesto los ítems paralelos, las varianzas de las dos mitades son iguales, es decir, 5~ =51, con lo que la varianza total del test puede expresarse como,
5~x · Puesto que, como ya hemos dicho, la varianza de una variable que es suma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas, tendremos:
Veamos ahora lo que sucede respecto a la varianza verdadera. La varianza de la distribución de las puntuaciones verdaderas, 5~, puede expresarse
2 2 2 como 52V = 5V + 5V + 2rV V 5V 5V a b ab a b
Las puntuaciones verdaderas en los dos tests paralelos son iguales y la correlación r vavb = 1, ya que es la correlación entre las puntuaciones verdaderas. Luego:
239
1 PSICOMETRÍA
4.31
240
Es decir, cuando se duplica la longitud de un test dado, la varianza de las puntuaciones verdaderas de los sujetos es igual a cuatro veces la varianza de las puntuaciones verdaderas de cada una de las mitades.
Por último, veamos lo que sucede respecto a la varianza de error. Por ser tests paralelos, partimos del supuesto de que las varianzas s~a = s~ b y que la correlación entre los errores reaeb =O. La varianza de error (52e) puede
expresarse en los siguientes términos: Sie = s;a + s;b + 2reaebsea seb = 2s;,
puesto que la covarianza se anularía al ser la correlación entre errores igual a cero.
Dado que el coeficiente de fiabilidad (rxx) es igual al cociente entre la varianza verdadera (5~ ) y la varianza empírica (5; ), tendremos que el coeficiente de fiabilidad, al duplicar la longitud del test viene expresado por:
R _ Siv = 45~ = 2rxx xx Six 25; (1 + rxx ) 1 + rxx
que es precisamente la expresión a la cual habíamos llegado anteriormente.
a=-n (1- :¿s; J n -1 52
X
Como ya hemos comentado, la varianza de una variable, suma de «n» variables, es definida como la suma de las varianzas, más la suma de las cavarianzas, con lo que la varianza total de las puntuaciones empíricas de los sujetos en un test la podemos expresar como:
es decir, suma de las varianzas de cada uno de los elementos más la de las covarianzas entre todos ellos.
Si los ítems son paralelos, se puede calcular la varianza media y la covarianza media de los items.
;t dado, la varianza de las a cuatro veces la varianza
las mitades.
varianza de error. Por ser
; varianzas s~a = s~b y que 1nza de error (52 e ) puede 2 52 + 2 S S - 252 ea + eb reaeb ea eb - et
·elación entre errores igual
Jal al cociente entre la va), tendremos que el coefi
viene expresado por:
bíamos llegado anterior-
variable, suma de «n » vaas, más la suma de las co
aciones empíricas de los
os elementos más la de las
varianza media y la cova-
LA FIABILIDAD DE LAS PUNTUACIONES 1
Ls2 52 52 Is: . = n . , ya que . = --1 1 1 n
de donde:
n --
S~ = L Sf + n(n - 1)r¡k Sf
y despejando:
n
52-" 52 X L._¡ 1
r ----=-¡k- (n -1)LSf
En el caso de querer estimar la fiabilidad del test total aplicaremos la ecuación general de Spearman-Brown para el caso de un test de longitud «n».
donde «n» representa el número de ítems y, rjk representa la correlación promedio de las n(n-1) correlaciones entre los ítems. Si lo sustituimos por la expresión anterior:
n
52-" 52 X L._¡ 1
n . ----=;--:
(n-1)LS f r" = ----==---'-----5::-2 -- ---;"=-s----:-2 --
1 + (n - 1) x L._¡ 1
(n-1)LS f
despejando,
a=-n [5~ -Isf ]=-n (1_Isfl n -1 52 n -1 52
X X
241
1 PSICOMETRÍA
4.33
242
a = & 1 cuando n ----¿ 00
- (N-3)&+2 (N-3)& 2 N&-3& 2 a= N-1 = N-1 + N-1 = N-1 + N - 1 =
N& 3& 2 & 3& 2 = N-1- N-1 + N-1 = N-1- N -1 +N -1 =
N
& 3& 2 & 3& 2 = ---+--= ---+--(N / N)-(1 / N) N-1 N-1 1-(1 / n) N-1 N-1
Si n---¿oo entonces 1/N=O, 3a/N-1=0, 2/N-1=0; de donde podemos deducir que a= &
- Relación entre la ecuación de Rulan y la ecuación de Cuttman-Fianagan
52 . 52-52 . (xx = 1- p;1
= x 2
p-I 1 pueStO que la Varianza de Una Variable que eS SU-s x s x
ma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas, tenemos:
Si desarrollamos ahora la ecuación de Guttman, tendremos:
( 52
+ S2
) (52
- S2
- S2
) rxx = 2 1- p s; 1 = 2 X S~
1
• Puesto que la varianza de una varia-
ble, suma de «n» variables, es definida como la suma de sus varianzas, más la suma de las covarianzas, podemos establecer que s; = S~ + 5;2 + 2rpiSp5; de donde
Como puede observarse, en ambos casos, llegamos a la misma expresión fina l.
): 2 -+---1 N -1
v -1 =O; de donde pode-
de Cuttman-Fianagan
de una variable que es su-
zas de cada una de las va-
tendremos:
e la varianza de una varia-
suma de sus varianzas, más que s; =S~ + 5,2 + 2rpiSpS;
mos a la misma expresión
LA FIABILIDAD DE LAS PUNTUACIONES 1
-Relación entre «a» y «{3»
P=a Bajo este supuesto podemos establecer que: n = knj, donde:
n = número de subtests
2 ( ]2 n n n n 1 k-1 1-I(_j_J =1- I -.~ =1-k -2 =-
1=1 n 1=1 k n1 k k
Sustituyendo en P,
n n n
s2- :¿s2 s2- :¿s2 :¿s; X 1 k
X 1 k ~=
}=1 }=1 1-_E__ = = =a 2 k -1 k -1 52 k -1 52
S - X X
X k
243
1 PSICOMETRÍA
15. BIBLIOGRAFÍA COMPlEMENTARIA
MARTÍNEZ-ARIAS, R.; HERNÁNDEZ LLOREDA, Ma J.; HERNÁNDEZ LLOREDA, Ma V. (2006). Psicometría. Madrid: Alianza editorial.
MARTÍNEZ-ARIAS, R.(1995). Psicometría: Teoría de los Tests Psicológicos y Edu-cativos. Madrid: Editorial Síntesis.
MUÑIZ, J. (1998, 2002) . Teoría Clásica de los Tests. Madrid: Editorial Pirámide.
MUÑIZ, J. (1996). Psicometría . Madrid: Universitas.
SANTISTEBAN, C.(1990). Psicometría. Teoría y práctica en la construcción de tests. Madrid: Editorial Norma.
244