tema-4 (79).pdf

Parte 11

EVALUACIÓN DE LAS PROPIEDADES MÉTRICAS DE LOS INSTRUMENTOS

DE MEDICIÓN PSICOLÓGICA

ITEMA 4

LA FIABILIDAD DE LAS PUNTUACIONES

Enrique Vila Abad

¡suMARIO

1. Orientaciones didácticas 2. El problema del error de medida 3. El modelo lineal de Spearman 4. Tests paralelos. Condiciones de paralelismo 5. Interpretación teórica del coeficiente de fiabilidad 6. Tipos de errores de medida 7. Factores que afectan a la fiabilidad

7.1. Longitud del test 7.2. Variabilidad de la muestra

8. La fiabilidad como equivalencia y como estabilidad de las medidas 8.1. Método de las formas paralelas 8.2. Método test-retest

9. La fiabilidad como consistencia interna 9.1. Métodos basados en la división del test en dos mitades

9.1 .1 . Spearman-Brown 9.1.2. Rulan 9.1.3. Guttman-Fianagan

9.2. Métodos basados en la covariación entre los ítems 9.2.1. Coeficiente alfa (a) de Cronbach

9.2.1.1. Estimador insesgado de a 9.2.1.2. El coeficiente a como límite inferior del coeficiente

de fiabilidad 9.2.1.3. Inferencias sobre a

9.2 .2. Casos particulares del coeficiente a 9.3. Coeficientes basados en el análisis factorial de los ítems : Theta (8) y

Omega (Q)

9.4 . El coeficiente beta(~) de Raju 1 O. Estimación de la puntuación verdadera de los sujetos en el atributo de in-

terés 11. Fiabilidad de una batería de tests 12. Ejercicios de autoevaluación 13. Soluciones a los ejercicios de autoevaluación 14. Apéndice 15 . Bibliografía complementaria

d

ad de las medidas

mitades

inferior del coeficiente

de los ítems: Theta (8) y

jetos en el atributo de in-

1. ORIENTACIONES DIDÁCTICAS

En los temas anteriores se han expuesto los principios básicos para la construcción de tests y las principales técnicas de construcción de escalas de actitudes; se cumple así la primera etapa de la construcción de los instrumentos de medición psicológica. Hasta el momento, se cuenta con una prueba piloto que se ha aplicado a una muestra de sujetos a los que se les han asignado sus puntuaciones correspondientes. Vamos a comenzar ahora el estudio de la segunda parte del proceso, la evaluación de la calidad métrica de la prueba piloto y la construcción del instrumento de medición definitivo.

Hemos intentado aclarar, en cierta medida, los distintos términos utilizados en relación con estos instrumentos: tests, escalas, cuestionarios, etc.; sin embargo, a partir de este momento, y teniendo en cuenta que la forma de llevar a cabo la evaluación de la calidad métrica es la misma, vamos a seguir las mismas normas que en los Standards for Educational and Psychological Testing (AERAIAPAINCME/ 1999) que utilizan el término test para referirse a todos estos instrumentos de evaluación.

Esta fase de evaluación de la calidad del test debería comenzar por el análisis de la calidad de los ítems ya que, como se ha comentado con anterioridad, dado que los ítems son las unidades elementales del test, difícilmente se podrá contar con un buen test si los ítems que lo forman son de mala calidad. Durante el proceso de construcción de la prueba inicial se ha explicado la forma de llevar a cabo una parte del análisis de los ítems a partir de la revisión crítica del contenido de los mismos por un grupo de expertos o jueces; sin embargo, quedaría por hacer otro tipo de análisis que no estuviera basado en juicios subjetivos, sino un análisis objetivo basado en las respuestas que han emitido los suje-

171

1 PSICOMETRÍA

tos a los ítems. Dado que para llevar a cabo este tipo de análisis es necesario que nuestros alumnos se hayan familiarizado con los conceptos de validez y fiabilidad, entre otros, el tema dedicado al análisis de los ítems se expondrá más adelante.

Una vez evaluada la calidad de los ítems del test y eliminados aquellos que no se consideran adecuados, el paso siguiente será la evaluación de la calidad global del test que incluye, entre otras cosas, la evaluación de la precisión y estabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas a partir de las puntuaciones obtenidas (validez).

En este tema se analiza el problema de la fiabilidad y precisión de la medida, tratando de encontrar respuesta a la pregunta de hasta qué punto las puntuaciones obtenidas por los sujetos en la prueba que se les ha aplicado están afectadas por errores de medida y en qué cuantía. El tema siguiente está dedicado al estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).

Comenzamos el tema con una alusión al problema del error de medida, centrándonos en los errores aleatorios y en cómo el modelo lineal propuesto por Spearman intenta buscar soluciones a esta cuestión. Seguidamente presentamos los distintos tipos de errores aleatorios con los que nos podemos encontrar al aplicar un instrumento de medición.

A continuación, introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente de fiabilidad, haciendo mención de los distintos factores que pueden influir en su cuantía como pueden ser la longitud del test y las características de la muestra a la que se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos permitan estimarlo: el método de las formas paralelas, el método test-retest y los métodos basados en la consistencia interna del test; indicando cómo se deben interpretar los coeficientes obtenidos. A continuación se presentan tres procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o característica que mide el test (su puntuación verdadera).

Al estudiar el tema se recomienda que los alumnos hagan hincapié en los si-guientes puntos básicos:

172

Conocer los supuestos básicos del modelo lineal de Spearman así como las deducciones que se puedan hacer a partir de esos supuestos .

Tener muy claros los conceptos de error de medida y fiabilidad .

Saber diferenciar los distintos tipos de error de medida.

Conocer la influencia que pueden tener en el coeficiente de fiabilidad

2. E -Ur

fiabil carac be me medi1 un ce

Si termi puntL obser por e1 pacid del in sible, rea l s

1 PSICOMETRÍA

tos a los ítems. Dado que para llevar a cabo este tipo de análisis es necesario que nuestros alumnos se hayan familiarizado con los conceptos de validez y fiabilidad, entre otros, el tema dedicado al análisis de los ítems se expondrá más adelante.

Una vez evaluada la calidad de los ítems del test y eliminados aquellos que no se consideran adecuados, el paso siguiente será la evaluación de la calidad

global del test que incluye, entre otras cosas, la evaluación de la precisión y estabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas a partir de las puntuaciones obtenidas (validez) .

En este tema se analiza el problema de la fiabilidad y precisión de la medida, tratando de encontrar respuesta a la pregunta de hasta qué punto las puntuaciones obtenidas por los sujetos en la prueba que se les ha aplicado están afectadas por errores de medida y en qué cuantía. El tema siguiente está dedicado al estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).

Comenzamos el tema con una alusión al problema del error de medida, centrándonos en los errores aleatorios y en cómo el modelo lineal propuesto por

Spearman intenta buscar soluciones a esta cuestión. Seguidamente presentamos los distintos tipos de errores aleatorios con los que nos podemos encontrar al aplicar un instrumento de medición.

A continuación, introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente de fiabilidad, haciendo mención de los distintos factores que pueden influir en su cuantía como pueden ser la longitud del test y las características de la muestra a la que se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos permitan estimarlo: el método de las formas paralelas, el método test-retest y los métodos basados en la consistencia interna del test; indicando cómo se deben interpretar los coeficientes obtenidos.

A continuación se presentan tres procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o característica que mide el test (su puntuación verdadera).

Al estudiar el tema se recomienda que los alumnos hagan hincapié en los si-guientes puntos básicos:

172

Conocer los supuestos básicos del modelo lineal de Spearman así como las deducciones que se puedan hacer a partir de esos supuestos.

Tener muy claros los conceptos de error de medida y fiabilidad .



2. 1

f iab car< ben

un

ter pu ob pe pa dE sil re

1 PSICOMETRÍA

tos a los ítems. Dado que para llevar a cabo este tipo de análisis es necesario que nuestros alumnos se hayan familiarizado con los conceptos de validez y fia

bilidad, entre otros, el tema dedicado al análisis de los ítems se expondrá más adelante.

Una vez evaluada la calidad de los ítems del test y eliminados aquellos que no se consideran adecuados, el paso siguiente será la evaluación de la calidad global del test que incluye, entre otras cosas, la evaluación de la precisión y estabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas a partir de las puntuaciones obtenidas (validez).

En este tema se analiza el problema de la fiabilidad y precisión de la medida,

tratando de encontrar respuesta a la pregunta de hasta qué punto las puntuaciones obtenidas por los sujetos en la prueba que se les ha aplicado están afectadas por errores de medida y en qué cuantía. El tema siguiente está dedicado al estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).

Comenzamos el tema con una alusión al problema del error de medida, centrándonos en los errores aleatorios y en cómo el modelo lineal propuesto por Spearman intenta buscar soluciones a esta cuestión. Seguidamente presentamos los distintos tipos de errores aleatorios con los que nos podemos encontrar al aplicar un instrumento de medición.

A continuación, introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente de fiabilidad, haciendo mención de los distintos factores que pueden influir en su cuantía como pueden ser la longitud del test y las características de la muestra a la que se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos permitan estimarlo: el método de las formas paralelas, el método test-retest y los métodos basados en la consistencia interna del test; indicando cómo se deben interpretar los coeficientes obtenidos. A continuación se presentan tres procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o característica que mide el test (su puntuación verdadera).

Al estudiar el tema se recomienda que los alumnos hagan hincapié en los siguientes puntos básicos:

172

Conocer los supuestos básicos del modelo lineal de Spearman así como las deducciones que se puedan hacer a partir de esos supuestos.

' Tener muy claros los conceptos de error de medida y fiabilidad .



~ e p p d si rE

de análisis es necesario

'"""'L'"''"' de validez y fiaítems se expondrá más

eliminados aquellos que evaluación de la calidad ción de la precisión y eslas inferencias realizadas

y precisión de la medida, qué punto las puntuacio-

aplicado están afecta

iguiente está dedicado al referidos al criterio (TRC).

del error de medida, ceno lineal propuesto por idamente presentamos podemos encontrar al

de la Teoría Clásica de los de los distintos factores

longitud del test y las cado la necesidad de estamaria: el método de las sados en la consistencia coeficientes obtenidos. rmitirán estimar el nivel test (su puntuación ver-

hagan hincapié en los si-

al de Spearman así como

esos supuestos.

ida y fiabilidad.

coeficiente de fiabilidad

LA FIABILIDAD DE LAS PUNTUACIONES 1

factores como la longitud del test y la variabilidad de la muestra de sujetos a los que se aplica.

Conocer los procedimientos empíricos para estimar el coeficiente de fiabilidad.

Diferenciar entre la fiabilidad como estabilidad temporal de las puntuaciones obtenidas en el test y como consistencia interna de los ítems del

test.

Diferenciar entre los distintos procedimientos para estimar la puntuación verdadera de un sujeto en un test.

Nota: Para aquellos lectores interesados, al final del tema se incluye un Apéndice en el que se ofrecen las demostraciones de las fórmulas que irán apareciendo a lo largo del mismo.

2. EL PROBLEMA DEL ERROR DE MEDIDA

Uno de los requisitos fundamentales en cualquier teoría de la medición es la fiabilidad y precisión de los instrumentos utilizados para medir una determinada característica. La medición en Psicología no está exenta de este requisito y debemos contar con instrumentos que sean fiables y, por consiguiente libres, en la medida de lo posible, de errores de medida. El concepto de error de medida es un concepto básico en Psicometría.

Se define el error de medida como la diferencia entre la puntuación empírica

obtenida por un sujeto en un test y su puntuación verdadera, entendiendo por test

cualquier instrumento de medición psicológica.

Si aplicáramos «n » veces un test a un mismo sujeto, con la finalidad de determinar su capacidad en una determinada característica, es casi seguro que las puntuaciones obtenidas por ese sujeto serían muy parecidas pero nunca iguales observándose que, en algunos casos, el valor de la puntuación empírica estará por encima de la puntuación verdadera del sujeto, la que realmente indica la capacidad que tiene, y en otros por debajo. En cualquier caso será responsabilidad del investigador construir pruebas que den lugar al mínimo error de medida posible, y que la puntuación obtenida proporcione el mayor grado de información real sobre la característica objeto de estudio.

1 PSICOMETRÍA

A veces, los errores de medida no son debidos al propio instrumento de medición sino a cambios que operan en el propio sujeto y que pueden ser atribuidos a diversas razones: su motivación cuando realiza la prueba, que conteste al azar algunos de los ítems, las condiciones físicas en que se encuentre, etc. Éstos son errores de carácter aleatorio e impredecibles, con los que hay que contar y tratar de controlar para que no interfieran de manera significativa en las predicciones que podamos hacer acerca de su capacidad. Son los errores de los que se va a ocupar la fiabilidad. En el apartado 6 veremos con más detalle los distintos tipos de errores de medida que existen .

De lo dicho hasta ahora se puede deducir, en primer lugar, que si aplicamos repetidas veces un mismo test a un sujeto, lo más probable es que obtengamos puntuaciones distintas en las diferentes aplicaciones y, en segundo lugar, que cuando un sujeto obtiene una puntuación en un test, dicha puntuación estará afectada por errores de medida. Este hecho nos lleva a plantearnos la siguiente pregunta: ¿cómo podemos saber cuál es el valor real del sujeto en la característica que estamos estudiando? Para ello, hay que acudir a alguna de las teorías que se han ido desarrollando y que nos van a proporcionar los medios para hacer estimaciones acerca de la cuantía de error que afecta a las puntuaciones empíricas y acerca del verdadero nivel del sujeto (o sujetos) en la característica que se está midiendo.

Dado que este texto está dedicado, fundamentalmente, a la Teoría Clásica de los Tests, el modelo (teoría) que se estudiará es el modelo lineal propuesto por Spearman. Este modelo establece que la puntuación empírica obtenida por los sujetos cuando se les aplica un test es función lineal de su puntuación verdadera en el rasgo que se intenta medir y un componente de error, tal y como se especificará en el siguiente apartado.

3. El MODELO LINEAL DE SPEARMAN

El modelo lineal de Spearman, establece que la puntuación empírica obtenida por un sujeto en un test (X) puede considerarse como una combinación lineal de dos componentes: por una parte, la puntuación verdadera (V) de ese sujeto en el rasgo que mide el test, y por otra, el error de medida (f) que la afecta. Así pues, podemos establecer la ecuación del modelo en los siguientes términos:

X= V+ E [4 .1]

174

)pío instrumento de me, que pueden ser atribui

l prueba, que conteste al 2 se encuentre, etc. Éstos

los que hay que contar y gnificativa en las predic)n los errores de los que con más detalle los dis-

r lugar, que si aplicamos )able es que obtengamos

y, en segundo lugar, que dicha puntuación estará plantearnos la siguiente 1 sujeto en la caracterís

alguna de las teorías que los medios para hacer eslas puntuaciones empíri

la característica que se

nte, a la Teoría Clásica de lo lineal propuesto por pírica obtenida por los

su puntuación verdadera , tal y como se espe-

ación empírica obtenida na combinación lineal de

ra (V) de ese sujeto en

ida (f ) que la afecta. Así

los siguientes términos:

[4.1]


Como se puede deducir de esta expresión, si aplicamos un test a un sujeto la puntuación que obtenga en el test, no coincidirá con el valor de la puntuación verdadera . Como en cualquier proceso de medición hemos de tener en cuenta la presencia del error de medida cometido.

El modelo asume una serie de supuestos:

Primer supuesto. La puntuación verdadera (V) es la esperanza matemática de la puntuación empírica (X). Esto quiere decir que si a un sujeto se le pasara un número infinito de veces un mismo test, y suponiendo que las aplicaciones fueran independientes entre sí de manera que la puntuación obtenida por dicho sujeto en una de las aplicaciones no estuviera influyendo en la obtenida en las demás, la media de todas las puntuaciones observadas (X) sería la puntuación verdadera del sujeto.

V= E(X) [4.2]

Segundo supuesto. La correlación existente entre las puntuaciones verdaderas de «n» sujetos en un test y los errores de medida es igual a cero. Es decir, no existe relación entre los errores de medida y las puntuaciones verdaderas.

[4.3]

Tercer supuesto. La correlación entre los errores de medida (re1e) que afectan

a las puntuaciones de los sujetos en dos tests diferentes (X 7 y X2 ) es igual a cero. Si «e 7» representa los errores de medida de las puntuaciones de «n » sujetos en el test 1 y «e2 » representa los errores de medida de las puntuaciones de los mismos sujetos en el test 2 el supuesto implica que no existe ninguna razón para presuponer que los errores de medida cometidos en un test vayan a influir, positiva o negativamente, en el otro test, siempre y cuando los tests se apliquen correctamente.

[4.4]

A partir de estos tres supuestos del modelo se pueden hacer las siguientes deducciones:

a) El error de medida se define como la diferencia entre la puntuación empírica obtenida por un sujeto y su puntuación verdadera.

175

1 PSICOMETRÍA

[4.5]

b) La esperanza matemática de los errores de medida es cero.

E(e) =O [4.6]

e) La media de las puntuaciones empíricas es igual a la media de las puntuaciones verdaderas.

X=V [4.7]

d) La covarianza entre las puntuaciones verdaderas y los errores es igual a cero.

Cov (V, E)= O [4.8]

e) La varianza de las puntuaciones empíricas es igual a la suma de la varianza de las puntuaciones verdaderas más la varianza de los errores.

[4.9]

f) La covarianza entre las puntuaciones empíricas y las verdaderas es igual a la varianza de las puntuaciones verdaderas.

[4.1 O]

g) La correlación entre las puntuaciones empíricas y los errores es igual al cociente entre la desviación típica de los errores y la desviación típica de las puntuaciones empíricas.

[4.11]

176

[4.5]

a es cero.

[4.6]

a la media de las pun-

[4.7]

os errores es igual a cero.

[4.8]

gual a la suma de la vari anza de los errores.

[4.9]

las verdaderas es igual a

[4 .10]

y los errores es igual al y la desviación típica de

[4 .11]


h) La covarianza entre las puntuaciones empíricas de dos tests es igual a la covarianza entre las puntuaciones verdaderas.

Cov (X 7, X2) = Cov (V7, V2) J [4.12]

=·~ :;n:~::;:::::_-~-~:;,;:;""" ·

4. TESTS PARALELOS. CONDICIONES DE PARALELISMO

Si a una misma muestra de sujetos se le aplican dos tests, X y X', podemos considerar que son paralelos si, además de cumplirse los supuestos anteriores, se cumplen las dos condiciones siguientes:

1. Las puntuaciones verdaderas de los sujetos son iguales en ambos tests.

Según el modelo lineal podemos establecer:

X= V+ E X'= V+ E'

2. La varianza de los errores de medida es la misma en ambos tests:

De las condiciones de paralelismo enunciadas podemos sacar una serie de deducciones importantes dentro del modelo clásico.

a) La media de las puntuaciones empíricas obtenidas en dos tests supuestamente paralelos es la misma.

Teniendo en cuenta que la esperanza matemática de los errores de medida es cero y que las puntuaciones verdaderas de los sujetos son iguales en ambos tests, podemos concluir la existencia de igualdad entre las medias de las puntuaciones empíricas.

- - - -X=V+E=V

x' = v + fi= v

177

1 PSICOMETRÍA

b) Las varianzas de las puntuaciones empíricas obtenidas en dos tests paralelos son iguales.

S~ = S~. 52 =52 + 52

X V e

Teniendo en cuenta, por definición de tests paralelos, que la varianza de

los errores es la misma, podemos concluir que las varianzas de las puntuaciones empíricas snn iguales.

e) La correlación entre las puntuaciones empíricas obtenidas en dos tests

paralelos (rxx'l es igual al cuadrado de la correlación entre las puntuaciones empíricas y las puntuaciones verdaderas (r~vl o bien, al cociente entre la varia11za de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas.

[4.13]

d) Dados dos o más tests paralelos, las intercorrelaciones entre cada dos de ellos son iguales.

[4.14]

5. INTERPRETACIÓN TEÓRICA DEL COEFICIENTE DE FIABILIDAD

Definimos el coeficiente de fiabilidad de un test, como:

... la correlación entre las puntuaciones empíricas obtenidas por una muestra

de sujetos en dos formas paralelas del test.

Se puede expresar también como el cociente entre la varianza de las pun

tuaciones verdaderas y la varianza de las puntuaciones empíricas.

178

enidas en dos tests para-

lelos, que la varianza de las varianzas de las pun-

obtenidas en dos tests n entre las puntuaciones ien, al cociente entre la nza de las puntuaciones

[4.13]

iones entre cada dos de

[4.14]

ICIENTE DE

m o:

obtenidas por una muestra

la varianza de las pun

empíricas.


[4.15]

y se pude interpretar, por lo tanto, como la proporción de la varianza de las puntuaciones empíricas de los sujetos que se debe a la varianza de las puntuaciones verdaderas, o lo que es lo mismo, la proporción de varianza verdadera que hay en la varianza empírica. A medida que dicha proporción aumenta, disminuye el error

de medida. Si rxx' = 1, el error de medida es cero lo que implica una fiabilidad perfecta del test. Sin embargo, a medida que dicha proporción disminuye se produce un incremento en el error de medida. En el caso de que rxx' =O, la varianza de los errores de medida sería igual a la varianza de las puntuaciones empíricas.

EJEMPLO:

Calcular el coeficiente de fiabilidad de un test de razonamiento abstracto, sabiendo que la varianza verdadera de dicho test es el 80% de su varianza empírica.

r _ S~ = O, 805~ = 0 80 XX' - -2 52 1

Sx x

es decir el 80% de la varianza de las puntuaciones empíricas es verdadera medida del rasgo.

A partir de la expresión (4.13) se puede inferir que:

[4.16]

Al término rxv se le denomina índice de fiabilidad de un test.

El coeficiente de fiabilidad de un test se puede expresar también en función de la varianza de los errores:

[4.17]

Así mismo, es fácilmente deducible que:

179

1 PSICOMETRÍA

[4.18]

Es decir, la correlación entre las puntuaciones empíricas y los errores de medida se puede obtener a partir de la correlación entre las puntuaciones obteni-

das por los sujetos en las dos formas paralelas de un test. El término 5

e repre-5x

senta la proporción de la desviación típica de las puntuaciones de los sujetos en el test que se debe a la desviación típica de los errores y, como vemos, esa proporción se puede estimar a partir del coeficiente de fiabilidad del test.

Resumiendo, podemos decir que el coeficiente de fiabilidad definido según el modelo clásico de Spearman como la correlación entre las puntuaciones obtenidas por una muestra de sujetos en dos tests paralelos, nos proporciona información para poder estimar la cuantía del error de medida.

6. TIPOS DE ERRORES DE MEDIDA

En este apartado haremos alusión a diferentes tipos de errores: el de medida, el de estimación, el de sustitución y el de predicción.

- Error de medida .

Como ya se ha dicho, el error de medida es la diferencia entre la puntuación empírica de un sujeto y su puntuación verdadera.

E=X-V

A la desviación típica de los errores de medida se le denomina error típico de medida y se expresa como:

15e =5x~ ~ , S t ··~A

[4 .19]

Cuando se calcula el error de medida obtenemos una medida individual del error que se comete; es decir, una medida individual de la precisión del test. Esta medida nos indica la diferencia que existe entre la puntuación que un sujeto ha obtenido en un test y el nivel real de dicho sujeto en la variable que medimos

180

[4.18]

y los errores de me

. as puntuaciones obteni -

EI término Se repre-5x

·0 nes de los sujetos en

como vemos, esa pro

ilidad del test.

abilidad definido según las puntuaciones ob

os, nos proporciona in

edida.

de errores: el de medida,

cia entre la puntuación

denomina error típico de

[4.19]

na medida individual del

la precisión del test. Esta

ntuación que un sujeto ha la variable que medimos


con dicho test; es decir, su puntuación verdadera. Cuando calculamos el error

típico de medida estamos llevando a cabo una medida grupal del error puesto

que se calcula para todos los sujetos de la muestra.

Este mismo razonamiento es válido para los distintos tipos de error que se ex

ponen a continuación .

- Error de estimación de la puntuación verdadera.

Se denomina error de estimación de la puntuación verdadera a la diferencia

entre la puntuación verdadera de un sujeto y la puntuación verdadera pronosti

cada mediante el modelo de regresión.

E= V- V'

Definimos el error típico de estimación de la puntuación verdadera, como la

desviación típica de los errores de estimación y viene expresado como:

[4.20]

- Error de sustitución

Se define el error de sustitución como la diferencia entre las puntuaciones

obtenidas por un sujeto en un test y las obtenidas en otro test paralelo. Es decir,

el error que se cometería al sustituir las puntuaciones obtenidas en un test X1

por las obtenidas en un test paralelo X2 .

e= x,- x2

Definimos el error típico de sustitución, como la desviación típica de los erro

res de sustitución y viene expresado como:

[4 .21]

- Error de predicción.

Se define el error de predicción como la diferencia entre las puntuaciones

obtenidas por un sujeto en un test (X1) y las puntuaciones pronosticadas en ese

mismo test (Xí) a partir de una forma paralela X2 .

181

1 PSICOMETRÍA

e= X1 - Xí

La puntuación Xí se obtiene mediante la recta de regresión de X1 sobre X2 :

[4.22]

Definimos el error típico de predicción, como la desviación típica de los errores de predicción y viene expresado como:

[4.23]

7. FACTORES QUE AFECTAN A LA FIABILIDAD

La fiabilidad de un test depende de factores como la variabilidad del grupo al que se aplica, la longitud del propio test, las características de los ítems que lo configuran, etc. En este apartado estudiaremos los dos primeros aspectos y el tercero será abordado más adelante en otro tema dedicado específicamente al estudio de la calidad métrica de los ítems.

7 .1. Longitud del test

Uno de los factores que influyen en la fiabilidad de un test es su longitud, es decir, el número de ítems que lo componen. Cuantos más ítems representativos del rasgo a medir se utilicen mayor será la información que obtengamos acerca del atributo que estemos estudiando. Cabe pensar que también será menor el error que cometamos al tratar de estimar la puntuación verdadera de un sujeto y, por lo tanto, la fiabilidad del test tenderá a incrementarse. Entonces, una forma de intentar aumentar la fiabilidad del test es aumentar su longitud. A veces, si un test es demasiado largo puede ser interesante averiguar cuál sería su fiabilidad si se le disminuyera el número de ítems. Si esta disminución de la fiabilidad no es muy elevada puede ser más aconsejable utilizar el test más corto.

La relación existente entre la fiabilidad de un test y su longitud, siempre y cuando los ítems a añadir sean paralelos a los que ya tenía el test original, se puede evaluar mediante la ecuación de Spearman-Brown.

182

gresión de X1 sobre Xi

[4.22]

·ación típica de los erro-

[4.23]

DAD

a variabilidad del grupo ísticas de los ítems que primeros aspectos y el

cado específicamente al

un test es su longitud, es ás ítems representativos que obtengamos acerca también será menor el verdadera de un sujeto

Entonces, una forma longitud. A veces, si un

r cuál sería su fiabilidad ución de la fiabilidad no

su longitud, siempre y tenía el test original, se

donde:


nrxx =---""-----

1 + (n -1)rxx [4.24]

Rxx =coeficiente de fiabilidad del test alargado o acortado.

rxx =coeficiente de fiabilidad del test inicial.

n = número de veces que se ha alargado o acortado el test.

n = EF, siendo EF el número de elementos finales del test y El el número de El

elementos iniciales del test.

Esta expresión (4.24), es la que definimos como ecuación general de SpearmanBrown y hace referencia al caso en que se quiera aumentar o disminuir la longitud del test inicial «n» veces.

Todo lo que acabamos de decir, es igual de válido en el caso de reducir la longitud del test, con la salvedad de que «n» será siempre menor que 1.

Nota: Téngase en cuenta que <<n» no es el número de ítems que se añaden o se eliminan del test original, sino que hace referencia al número de veces que se aumenta o disminuye la longitud del test.

~---~--.~--~. ~~---- ~- • -~- ----~----~~--~-~-==-~---~-=-==-=-~---- ---·-····--~------~- .. 1

EJEMPLO:

Supongamos, que se aplica un test de percepción visual compuesto por 50 ítems a una muestra de sujetos y se obtiene un coeficiente de fiabilidad de 0,60. Veamos lo que sucede al incrementar n veces la longitud del test:

nr 2 ·O 60 1 80 Paran = 2· R = xx = ' =O 75 paran= 3· R = ' =O 82

l XX 1+(n-1)rXX 1+0,60 l l XX 1+1, 20 l

P 2,40

ara n = 4 · R = = O 86 1 XX 1 + 1,80 1

3 Para n =S· R = =O 88

1 XX 1 + 2,40 1

Para n = 6· R = 3'60

=O 90 1 XX 1 + 3 1

7 R 4, 20 o Paran= · =--= 91

1 XX 1 + 3/6 1

P 4,80

ara n = 8· R = =O 92 1 XX 1+4,20 1

9 R 5,40 9 Para n = · = = O 3

1 XX 1+4, 80 1

183

1 PSICOMETRÍA

Como se puede apreciar en el gráfico 4.1, a medida que aumenta el número de ítems paralelos aumenta el coeficiente de fiabilidad del test, aunque no de una manera proporcional. Se puede observar que a partir de un determinado valor de n no se producen incrementos significativos en la fiabilidad del test. Como consecuencia de esto nos podemos preguntar: ¿cuánto habría que alargar o acortar un test para obtener un determinado coeficiente de fiabilidad? y, en segundo lugar, ¿hasta qué punto es razonable dicho aumento?

.9

.8

.7~--~--------~------~----~--~ 2 3 4 5 6 7 8 9

De nuevo encontramos la respuesta a esta pregunta a través de la ecuación de Spearman-Brown, ya que despejando «n» tendremos:

Supongamos que con los datos del ejemplo anterior queremos aumentar la fiabilidad del test hasta obtener un valor de 0,93. Aplicando la expresión anterior tenemos:

n = Rxx (l- rxJ =O, 93(1- 0,60) = 8, 85 = 9 (xx (1- Rxx) O, 60(1- O, 93)

184

Paré damen dría ur

lo que ítems r alterna test, m choob dido 3'

En< númer· cienter atribut• de íten un coe vos un formul obten e

luego t

7.2. \ -La f

a la qu• muestr en fun< más he puntua

que aumenta el número 2l test, aunque no de una un determinado valor de idad del test. Como con

' a que alargar o acortar lidad? y, en segundo lu-

8 9

a través de la ecuación

r queremos aumentar la icando la expresión ante-

85 = 9


Para conseguir ese coeficiente de fiabilidad sería necesario hacer, aproximadamente, 9 veces más largo el test original de 50 ítems. Es decir, el nuevo test tendría una longitud de:

n = EF · EF = n ·El= 9 ·50= 450 ítems El'

lo que implicaría añadir 400 ítems al test original. Obviamente, añadir al test 400 ítems no parece una solución razonable al problema y debemos plantearnos otras alternativas como, por ejemplo, revisar el objetivo para el que se construye el test, mejorar los ítems y analizar cuál es el valor de precisión aceptable para dicho objetivo (si se hubiera tomado el valor exacto de 8,85 habría que haber añadido 392,5 ítems es decir 393, lo cual tampoco sería una solución razonable).

En ocasiones puede que estemos interesados en saber si es posible reducir el número de ítems de un test y que el nuevo coeficiente de fiabilidad sea lo suficientemente aceptable como para no perder demasiada información respecto al atributo objeto de estudio. Esta situación se da cuando consideramos el número de ítems excesivo. Supongamos, por ejemplo un test compuesto de 100 ítems y un coeficiente de fiabilidad de 0,85 (rxx). Supongamos que para nuestros objetivos un coeficiente de fiabilidad de 0,75 (Rxx) es admisible. La pregunta que nos formularíamos sería cuántos elementos debemos eliminar del test original para obtener ese coeficiente de fiabilidad. En este caso:

n=Rxx(1-rxJ = 0,75(1-0,85) = 0,11 =O 52 rxx (1-RxJ 0, 85(1-0,75) 0,21 '

EF = n · El = 0,52 x 1 00 =52

luego tendríamos que eliminar 100- 52 = 48 ítems.

7.2. Variabilidad de la muestra

La fiabilidad de un test también depende de las características de la muestra a la que se aplica. Un test puede presentar tantos coeficientes de fiabilidad como muestras distintas en las que se calcule. El coeficiente de fiabilidad puede variar en función de la mayor o menor homogeneidad del grupo, siendo menor cuanto más homogéneo sea; es decir,cuanto más pequeña sea la desviación típica de las puntuaciones empíricas obtenidas por los sujetos en el test. Recordemos que he-

185

1 PSICOMETRÍA

mos definido el coeficiente de fiabilidad como la correlación entre dos formas paralelas de un test y la corre lación viene afectada por la variabilidad del grupo. Por lo tanto, es importante saber hasta qué punto la fiabilidad de un test se ve afectada por dicha variabilidad.

Supongamos dos grupos de sujetos 1 y 2. Partiendo del supuesto de que el error típico de medida de un test se mantiene constante, independientemente de la va

riabilidad del grupo en que se aplique, podemos establecer la siguiente igualdad:

Por tanto, teniendo en cuenta que, 5~ = 5~(1- rxx ) podemos establecer la igual

dad: 512 (1-r,,)=5~(1-r22 ) y despejando:

donde:

S~ =varianza empírica de las puntuaciones en el grupo 1.

S~ =varianza empírica de las puntuaciones en el grupo 2.

r11 =coeficiente de fiabilidad en el grupo 1.

r22 =coeficiente de fiabilidad en el grupo 2.

EJEMPLO:

[4.25]

Se ha aplicado un test a una muestra de sujetos en la que la desviación típica de las puntuaciones empíricas obtenidas es igual a 20 y la razón entre la desviación tí

pica de los errores y la desviación típica de las puntuaciones empíricas es 0,40. Aplicado el test a otra muestra de sujetos en la que la desviación típica de las puntuacio

nes empíricas es igual a 1 O, ¿cuál sería el valor del coeficiente de fiabilidad del test?

S Datos: S = 20· S = 1 O· ~=O 40

x1 ' x 2 ' S ' x l

52 r,11

= 1 - _ e = 1 - O 1 6 = O 84 52 1 1

X

186

~ ! ación entre dos formas k variabilidad del grupo. abilidad de un test se ve

1 supuesto de que el error )endientemente de la va:er la siguiente igualdad:

emos establecer la igual

[4.25]

ue la desviación típica de entre la desviación tí

empíricas es 0,40. Aplitípica de las puntuacio

de fiabilidad del test?


Como se puede apreciar, al reducir la variabilidad de las puntuaciones empíricas en el segundo grupo, se reduce el coeficiente de fiabilidad. Asimismo se puede observar que el valor del error típico de medida permanece constante (lo

cuál es lógico puesto que se ha partido de ese supuesto).

Se, =Sx,.Jl - rxx =20-Jl-0,84 =8

8. LA FIABILIDAD COMO EQUIVALENCIA Y COMO ESTABILIDAD DE LAS MEDIDAS

Un test debe cumplir dos requisitos básicos. En primer lugar debe medir el rasgo que realmente pretende medir (es decir, ser válido) y, en segundo lugar, las puntuaciones empíricas obtenidas al aplicar el test deben ser estables y precisas. La precisión hace referencia, como ya hemos apuntado anteriormente, a la necesidad de que, en la medida de lo posible, las puntuaciones obtenidas estén libres de errores. La estabilidad se refiere a que cuando se evalúa un rasgo con el mismo test en distintas ocasiones y bajo condiciones lo más parecidas

posibles, siempre y cuando el rasgo estudiado no haya cambiado, se deberán obtener unos resultados similares. Este segundo requisito, referido a la reproductividad de unos resultados en condiciones similares, es lo que definimos como la fiabilidad del test, entendida como estabilidad de las medidas. En definitiva, lo que pretendemos es poder establecer el grado de acuerdo entre las puntuaciones obtenidas por los sujetos en distintas aplicaciones.

En este apartado, nos centraremos en dos métodos basados en la estabilidad de las medidas para el cálculo del coeficiente de fiabilidad, métodos que constituyen una aplicación directa de la definición de correlación entre formas paralelas:

Método de las formas paralelas

Método test-retest

Existen otras formas de abordar el cálculo de la fiabilidad de un test, como veremos en el siguiente apartado, basadas en la consistencia interna del test.

187

1 PSICOMETRÍA

8.1 . Método de las formas paralelas

La forma de proceder, según este método, sería: primero, construir dos formas paralelas de un test X y X/, en segundo lugar, aplicar las dos formas del test a una muestra de sujetos lo suficientemente amplia como para que sea representativa de la población a la que va dirigido el test y, en tercer lugar, calcular el coeficiente de correlación de Pearson entre las puntuaciones de los sujetos en ambas formas.

[4.26]

donde: X1 y X2 corresponden a las puntuaciones obtenidas por los sujetos en cada una de las formas aplicadas.

El coeficiente de fiabilidad así obtenido recibe también el nombre de coeficiente de equivalencia, haciendo referencia al grado en que ambas formas son

equivalentes.

El método de las formas paralelas presenta la ventaja de que, si ambas formas son aplicadas en el mismo momento se tiene un mayor control de las condiciones en que los sujetos realizan las pruebas. Este método presenta el inconveniente de la dificultad que supone la construcción de dos formas que sean paralelas.

1

8.2. Método test-retest

Con este método se aplica el mismo test en dos ocasiones diferentes a una misma muestra de sujetos. Calculamos el coeficiente de fiabilidad mediante la correlación entre las puntuaciones obtenidas por los sujetos en ambas aplicaciones.

[4.27]

donde: X1 y X2 corresponden, en este caso, a las puntuaciones obtenidas por los sujetos en cada una de las aplicaciones del mismo test.

188

Como: ralelas sie1 la misma t

Este mf tintas del1 remos en,

pueden ca pretensión las puntua bilidad sin diendo, la:

Al igual inconveni' cuenta, es terferir en 1

dado a cie su puntuac riables de t

factor dete

Un segt currido en1 caciones p tiempo, un que el rasg tores socia cidir en un

Una últ bio en el g radamente coeficiente

Teniend en ambas e dicarán el¡ fiabilidad 2

ro, construir dos formas dos formas del test a

para que sea representercer lugar, calcular el ·ones de los sujetos en

[4.26]

idas por los sujetos en

·én el nombre de coefi

que ambas formas son

de que, si ambas formas control de las condicio

el inconveniente as que sean paralelas.

iones diferentes a una abilidad mediante la coen ambas aplicaciones.

[4.27]

ciones obtenidas por los


Como se puede apreciar, el cálculo es idéntico al método de las formas paralelas siendo la única diferencia que en lugar de aplicar dos formas se emplea la misma en dos momentos distintos.

Este método presenta la ventaja de que no requieren dos ó más formas distintas del mismo test. Con el método test-retest, es el mismo test el que aplicaremos en distintas ocasiones. En el caso de que se pretendan medir rasgos que pueden cambiar en el tiempo hay que extremar las precauciones si tenemos la pretensión de emplear este método ya que se pueden encontrar diferencias en las puntuaciones obtenidas en las dos aplicaciones y no significar falta de estabilidad sino que si realmente los sujetos han variado en el rasgo que se está midiendo, las diferencias pongan de manifiesto ese cambio.

Al igual que el método de las formas paralelas, este método no está exento de inconvenientes que hay que tener presentes. Un primer aspecto a tener en cuenta, es el posible influjo de la memorización de algunos ítems que puede interferir en la segunda aplicación. Un sujeto puede recordar la respuesta que haya dado a ciertos ítems y esto puede provocar un aumento o disminución irreal de su puntuación y, consiguientemente, del valor de la correlación. El efecto de variables de estas características sobre la repetición de un test puede llegar a ser un factor determinante en el valor del coeficiente de fiabilidad.

Un segundo inconveniente a tener en cuenta es el intervalo de tiempo transcurrido entre una aplicación y otra. Es deseable incrementar el tiempo entre aplicaciones para minimizar el efecto de aprendizaje o de memoria pero, al mismo tiempo, un incremento demasiado grande, hace que aumente la posibilidad de que el rasgo que estamos estudiando haya variado debido a la influencia de factores sociales, afectivos o incluso evolutivos propios del sujeto y esto puede incidir en una infraestimación del coeficiente de fiabilidad.

Una última cuestión es la propia actitud del sujeto (Ghiselli, 1981 ). Un cambio en el grado de cooperación por parte de un sujeto puede provocar, deliberadamente, una puntuación más baja o más alta, que daría como resultado un coeficiente de fiabilidad más bajo o más alto.

Teniendo en cuenta estos aspectos, y si las condiciones de aplicación del test en ambas ocasiones son lo más parecidas posibles, los resultados obtenidos indicarán el grado de estabilidad en las puntuaciones obtenidas. Al coeficiente de fiabilidad así obtenido se le denomina también coeficiente de estabilidad.

189

1 PSICOMETRÍA

9. LA FIABILIDAD COMO CONSISTENCIA INTERNA

Existen situaciones en las cuales solamente es posible llevar a cabo una única aplicación de un test; situaciones en las que la aplicación de cualquiera de los dos métodos que acabamos de describir no sea factible, o donde un análisis de la estabilidad o la equivalencia de las medidas no constituya nuestro fin prioritario.

En este apartado presentamos una serie de métodos para estimar la fiabilidad de un test que sólo requieren una aplicación . Unos hacen referencia a la división del test en dos mitades. Otros requieren un análisis de la varianza y covarianza de las respuestas de los sujetos a los ítems. Las diferentes técnicas que presentamos aportan un índice de la consistencia interna de las respuestas de los sujetos a los ítems del test en una sola aplicación.

9.1. Métodos basados en la división del test en dos mitades

El método de las dos mitades presenta una ventaja sustancial respecto a los dos métodos explicados anteriormente. Esta ventaja reside en el hecho de que consideramos las puntuaciones obtenidas en una única aplicación de un test, con lo cuál, la estimación de la fiabilidad no se ve afectada por factores como el intervalo de tiempo transcurrido entre una aplicación y otra, la memoria, el aprendizaje, etc., y supone un ahorro de tiempo y esfuerzo al no tener que construir una segunda forma paralela del test, ó tener que realizar una segunda evaluación de los sujetos. Básicamente se trataría de aplicar el test a una muestra de sujetos y, una vez obtenidas las puntuaciones dividir el test en dos mitades, calculando, posteriormente, la correlación entre las puntuaciones obtenidas por los sujetos en ambas partes y aplicar, a continuación, una fórmula de corrección que ya se especificará.

La división del test en dos mitades no es siempre una labor tan sencilla como pueda parecer a primera vista. Las mitades del test deberán ser similares en dificultad y contenido para que la correlación entre las puntuaciones se aproxime al valor máximo. Uno puede cuestionarse si efectivamente las medias, varianzas y el contenido de los ítems son realmente similares o no, y, por lo tanto, si este método es adecuado en todo tipo de situaciones. El hecho de conseguir una igualdad de los valores de la media y la desviación típica es posible con este tipo de agrupamiento, pero como establece Gulliksen (1987) corremos el peligro de agrupar ítems análogos en un solo lado, con lo que pudiera ocurrir que

190

a e

9

d;

b< bi

INTERNA

llevar a cabo una única

r

n de cualquiera de los o donde un análisis de ítuya nuestro fin priori-

a estimar la fiabilidad n referencia a la divide la varianza y covaiferentes técnicas que a de las respuestas de

dos mitades

cial respecto a los ide en el hecho de que

aplicación de un test, por factores como

y otra, la memoria, el al no tener que cons

lizar una segunda evael test a una muestra de

en dos mitades, cal-iones obtenidas por los fórmula de corrección

labor tan sencilla como án ser similares en di

ntuaciones se aproxime las medias, varianzas

, y, por lo tanto, si este cho de conseguir una ca es posible con este

(1987) corremos el pelique pudiera ocurrir que


las dos mitades no fueran iguales en cuanto a contenido se refiere. Este aspecto deberá ser cuidadosamente estudiado debido a su importancia.

Son diversas las formas en las que se puede llevar a cabo la división del test en dos mitades pero, ante todo, una característica que habrá que valorar es la forma en que se ha construido el test.

Una primera forma consistiría en dividir el test por la mitad, es decir, considerar los primeros (n/2) ítems como una mitad y los últimos (n/2) ítems como la segunda mitad. Esta forma de dividir el test puede presentar inconvenientes, puesto que muchos tests están formados por ítems cuya dificultad se va incrementando y, por lo tanto, las dos mitades no serían equivalentes; en el caso de tests con contenidos heterogéneos las dos mitades no serían comparables, y en el caso de tests con un número elevado de ítems hay que tener en cuenta el efecto del cansancio de los sujetos.

Una segunda aproximación al problema consistiría en definir una forma con todos los elementos pares y una segunda forma con todos los elementos impares, con lo cual reducimos significativamente los problemas planteados por la forma anterior.

Una tercera forma de abordar el problema puede ser ordenar los ítems en función de su grado de dificultad, calculando para ello el índice de dificultad de cada ítem, y subdividirlos en pares e impares.

Una cuarta forma, aunque no muy recomendable por razones obvias, podría consistir en la asignación de los ítems al azar a una mitad o a otra.

Normalmente, dado que cuando los ítems del test son de dificultad creciente aparecen ya ordenados a lo largo del test, la forma más utilizada en la división del test en dos mitades, es asignar a una de las mitades los elementos pares y a la otra los impares.

Cuando se utiliza el método de las dos mitades la fiabilidad se puede estimar aplicando cualquiera de las siguientes fórmulas: Spearman-Brown, Rulon, Guttman-Fianagan.

9.1 . 1. Spearman-Brown

La ecuación de Spearman-Brown, constituye una de las formas más utilizadas para estimar la fiabilidad de un test por el método de las dos mitades. Está basada en la relación existente entre la longitud de un test y el coeficiente de fiabilidad.

191

1 PSICOMETRÍA

En primer lugar aplicamos el test a una muestra de sujetos. Una vez aplicado el test, dividimos éste en dos mitades que han de ser paralelas. Por lo tanto, para ver si la aplicación de este método es la correcta, habría que comprobar los supuestos de paralelismo comentados anteriormente. A continuación calculamos la correlación entre las puntuaciones obtenidas por los sujetos en ambas partes. La correlación calculada correspondería al coeficiente de fiabilidad de cada una de las mitades del test, pero como lo que queremos es calcular la fiabilidad del test completo, para ello aplicamos la ecuación de Spearman-Brown para el caso de longitud doble:

donde:

R = 2rxx XX 1

+(XX

Rxx =coeficiente de fiabilidad del test.

rxx =coeficiente de fiabilidad de cada una de las mitades.

EJEMPLO:

[4 .28]

Hemos aplicado un test de aptitud numérica compuesto de 20 ítems a una muestra de 6 sujetos. Los resultados que se presentan a continuación corresponden a las puntuaciones que dichos sujetos obtuvieron en los ítems pares (X1)

e impares(X2 ). Calcular el coeficiente de fiabilidad suponiendo que las dos mitades del test sean paralelas.

SUJETOS x2 1

1 8 4 64 16 32

2 7 7 49 49 49

3 8 6 64 36 48

4 5 4 25 16 20

5 8 7 64 49 56

6 6 6 36 36 36

Total 42 34 302 202 241

192

Jjetos. Una vez aplicado alelas. Por lo tanto, para a que comprobar los su-

·nuación calculamos sujetos en ambas partes.

fiabilidad de cada una calcular la fiabilidad del

n-Brown para el caso

[4.28]

itades.

de 20 ítems a una a continuación corres

en los ítems pares (Xl)

niendo que las dos mi-

16 32

49 49

36 48

16 20

49 56

36 36

202 241


rx,x2 = )[NLx12 -(IX/] [NLx~ -(IX2l2]

r = 6x241-42x34 =1.446-1.428=035

XxX2 ~(6 X 302- 422 )(6 X 202-342 ) .j 48 X 56

1

R = 2rxx = 2x0,35 = 0,70 =O 52 xx 1+rxx 1+0,35 1,35

1

El coeficiente de fiabilidad de cada una de las mitades es 0,35 pero el del test total es 0,52. Se trata de un coeficiente medio ya que el valor máximo es la unidad. Hemos asumido que las dos mitades son paralelas dado que se trata de un ejemplo, no obstante para aplicar este procedimiento de forma estricta habría que haber hecho previamente la compro.bación analizando, por ejemplo, la igualdad de las medias de ambas mitades y la igualdad de los errores típicos de medida.

9.1.2. Rulon

La fórmula de Rulon (1939) para la estimación de la fiabilidad de un test según el método de dos mitades se utiliza cuando, aún no siendo las dos mitades definidas estrictamente paralelas, podemos considerarlas •-equivalentes (tauequivalentes) o esencialmente • -equivalentes. Lord y Novick (1968) definen los tests • equivalentes como aquellos en los que las puntuaciones verdaderas de los sujetos de una muestra son iguales en ambas formas, pero las varianzas de error no tienen porqué ser iguales, y definen los tests esencialmente (•) tau-equivalentes como aquellos en los que la puntuación verdadera de cada sujeto en uno de los tests es igual a la del otro más una constante. Tanto en una situación como en otra se asume el cumplimiento del supuesto de igualdad de las varianzas verdaderas de ambas mitades.

Calculados los valores de las puntuaciones en los ítems pares e impares, se calcula la diferencia entre ellas y, a continuación, su varianza (varianza de la diferencia entre las puntuaciones).

[4.29]

193

1 PSICOMETRÍA

donde:

d = diferencias entre las puntuaciones de los elementos pares e impares de cada uno de los sujetos.

S~= 5~-i =varianza de la diferencia entre las puntuaciones pares e impares.

S~ =varianza de las puntuaciones empíricas de los sujetos.

EJEMPLO:

Hemos aplicado un test de fluidez verbal compuesto 6 ítems a 6 sujetos. A continuación se presentan las puntuaciones empíricas obtenidas por los sujetos en el test total, así como las obtenidas en los elementos pares e impares. Calcular el coeficiente de fiabilidad del test.

p (P-1) = d

A 4 3 1 2

B 1 1 o 1

e 6 3 3 o

o 2 1 1 o

E 3 1 2 -1

F 5 2 3 -1

X=4+1+6+2+3+s= 35 6 1

52 = 42

+ f + 62

+ 22

+ 32

+52

- (3 5)2 = 15 17-12 25 = 2 92 X

6 1 1 1 1

xd =o, 17 52 = 4 + 1 + 1 + 1 -(O 1 7)2 = 1 14 d 6 1 1

Se ha obtenido un coeficiente de fiabilidad medio.

194

9.1.

F fórm cacit pres i

dond

52 p

tivam

y X

Ta1 c iona relacit

EJE

Co1 zando

xp =1,

S~ =0,

comop mula dE

~ntos pares e impares de

aciones pares e impares.

sujetos.

6 ítems a 6 sujetos. A conidas por los sujetos en el

e impares. Calcular el

(P-1) = d

1 2

o 1

3 o

1 o

2 -1

3 -1

-12,25 = 2,92

14


9.1.3. Guttman-Fianagan

Flanagan (1937) y Guttman (1945), de forma independiente llegaron a una fórmula equivalente a la de Rulon y que presenta una mayor sencillez de aplicación . La fórmula de Guttman-Fianagan viene determinada por la siguiente expresión:

[4.30]

donde:

5~ y Sf = varianzas de las puntuaciones en los ítems pares e impares respectivamente.

5~ =varianza empírica del test total.

Tanto la ecuación de Rulon como la ecuación de Guttman-Fianagan proporcionan el mismo valor de la fiabilidad por ser expresiones equivalentes. Dicha relación aparece recogida al final del tema en el Apéndice.

EJEMPLO:

Con los datos del ejercicio anterior, calcular el coeficiente de fiabilidad utilizando la fórmula de Guttman-Fianagan.

- -xp =1,83 X¡ =1,66

5~ =0,81 5¡2 =1,21 52= 32 +12 +32 +f +12 +22 -(183)2 =416-3 35=0 81

p 6 ' ' ' '

R =2[1- 5,2 +Si J=2(1- 0,81+1,21)=0 61 XX 52 2 92 l

X 1

como puede observarse el resultado es el mismo que el obtenido mediante la fórmula de Rulon.

1 PSICOMETRÍA

9.2. Métodos basados en la covariación entre los ítems

Al hablar de la fiabilidad como consistencia interna hemos hecho alusión a dos formas de abordar el tema. Una forma es la basada en la división del test en dos mitades. La segunda forma requiere un análisis de la varianza y covarianza de las respuestas de los sujetos a los ítems. De esta forma, el coeficiente obtenido proporciona una estimación de la consistencia interna de los ítems del test. En el presente apartado haremos referencia a algunos de los métodos más frecuentes para estimar la fiabilidad de un test bajo estas condiciones como son el coeficiente alpha de Cronbach (1951 ), ó los coeficientes KR20 y KR21 de KuderRichardson (193 7). Tanto KR20 como KR21 pueden ser considerados como casos particulares del coeficiente «alpha» de Cronbach en el caso de que los ítems que forman el test sean dicotómicos.

9.2.1. Coeficiente alfa (a) de Cronbach

El coeficiente de Cronbach (1951) constituye un indicador de la consistencia interna del test. Este coeficiente expresa la fiabilidad del test en función del número de ítems y de la proporción de la varianza total del test debida a la covariación entre los ítems. Cuanto más covarien los ítems entre sí mayor será la fiabilidad del test.

La ecuación general del coeficiente «alfa» viene expresada como:

donde:

n

L,.L,.cov(jk) n ,i"'_K ----=--a=---

n -1 52 X

=-n (1-L,.5J) n -1 52

X

[ n(r¡) ] n (5;- L,.5J)

= 1 + (n - 1)r¡ = n - 1 5; =

n = número de elementos del test.

L.Sj = suma de las varianzas de los elementos del test.

L.L.cov (jk) = suma de las covarianzas de los ítems.

S~ =varianza de las puntuaciones en el test.

[4.31]

r1 =cociente entre la covarianza media de los ítems y su varianza media.

196

Ej

H En la cada fic ier

EjE/1

Sien averigu 1 O íterr

los ítems

a hemos hecho alusión a t en la división del test en la varianza y covarianza rma, el coeficiente obte

a de los ítems del test. de los métodos más fre

condiciones como son el KR20 y KR21 de Kuder

r considerados como can el caso de que los ítems

r de la consistencia inen función del número da a la covariación en

será la fiabilidad del test.

[4.31]

ms y su varianza media.


EJEMPLO 1:

Hemos aplicado un test de percepción visual a una muestra de seis sujetos. En la tabla adjunta se presentan las puntuaciones que los sujetos obtuvieron en cada uno de los cinco ítems que forman el test. Se desea saber el valor del coeficiente de fiabilidad del test.

A 3 4

B 2 3

e 4 2

D 2 1

E 1 1 1 2 1

F o o 1 1 1

X1 =2;

X2 = 1,83;

X3 =1,67;

X4 = 2,5;

X5 = 2,33;

a= _n_(1- :¿s; ]= ~( 1 - 1,67 + 1,82 + 0,54 + 0,92 + 1,90 )= 0 94 n-1 S~ 4 27,29 '

EJEMPLO 2:

Siendo la covarianza media entre todos los elementos de un test igual a 0,25, averiguar el coeficiente de fiabilidad del test sabiendo que está compuesto por 1 O ítems y que la varianza empírica es igual a 40 puntos.

197

1 PSICOMETRÍA

Para resolver el problema hay que partir de que la varianza de una variable compuesta, suma de otras variables, es igual a la suma de las varianzas de todas las variables más la de las covarianzas, o bien a la suma de las varianzas más los n(n-1) términos de covarianza media:

n n

s; = :¿s: +n(n - 1)r1kSJ; :¿s: = 40-10 · 9 · 0, 25=17,5 j=l j=l

a = .!_Q(1-17

'5)=o 62

9 40 1

9.2. 7. 7 Estimador insesgado de a

El estimador insesgado de a propuesto por Feldt, Woodruff y Salih (1987) se expresa como:

- (N-3)& +2 a = -'----'---- [4.32]

N - 1

donde:

a= estimador insesgado.

a= valor de alpha de Cronbach.

N= número de sujetos de la muestra.

A medida que aumenta el número de sujetos de la muestra, el valor del a encontrado y el valor del estimador insesgado se aproximan, siendo iguales cuando N --too. En la práctica, a partir de 100 sujetos, se pueden considerar insignificantes las diferencias encontradas. Es decir:

[4.33]

Supongamos que en una muestra de 150 sujetos se les ha aplicado un test y se ha obtenido un valor de a= 0,75.

198

Co tre am tra de

9.2. 7.

El e ri or dE coefic

Ell Muñi2

El e test se he m o~

Otr c iente

donde

n=

52 -J -

1rianza de una variable e las varianzas de todas de las varianzas más los

·0,25=17,5

druff y Salih (1987) se

[4.32]

uestra, el valor del a enn, siendo iguales cuando

n considerar insignifi-

[4.33]

les ha aplicado un test y


a= (150-3)0,75+2 =O 75 150-1

1

Como se puede apreciar, a partir de 100 sujetos la diferencia encontrada entre ambos estimadores es insignificante. Si por el contrario tuviéramos una muestra de 20 sujetos, las diferencias serían mayores.

a= (20-3)0,75+2 =O 78 20-1

1

9.2. 7 .2. El coeficiente a como límite inferior del coeficiente de fiabilidad

El coeficiente a puede ser considerado como una estimación del límite inferior del coeficiente de fiabilidad de un test, siendo su valor menor o igual que el coeficiente de correlación rxx· (Guttman, 1945):

[4.34]

El lector interesado puede encontrar una demostración de dicha relación en Muñiz (1998).

El coeficiente a es igual al coeficiente de fiabilidad, rXX' cuando los ítems del test sean paralelos y, por tanto, satisfagan las condiciones de paralelismo que hemos formulado con anterioridad.

Otro estimador del límite inferior del coeficiente de fiabilidad es el coeficiente 8 (delta) propuesto por Guttman (1945):

( J _ n _ 2,2,cov(j,k)

83 = 1 - Í. S~ + --'---'(_n_-_1-'-) _5_2 ___ _ j =l SX X

donde:


sj = varianza del elemento j del test.

[4.30]

199

1 PSICOMETRÍA

S~ = varianza del test total. n

L,L,cov(j,k) = s;- L,sJ =suma de las covarianzas de los ítems j~l

9.2. 7 .3. Inferencias sobre a

Como acabamos de ver, el coeficiente a nos proporciona una estimación de la fiabilidad de un test basada en la consistencia interna del mismo. En ocasiones queremos ir mas allá, y nos planteamos cuestiones como, por ejemplo, si existe una diferencia significativa entre el valor del coeficiente alfa obtenido en dos o más muestras independientes; si alfa puede tomar un valor concreto en la población; si la diferencia entre dos ó más valores distintos de alfa para una misma muestra de sujetos, es significativa o no; etc. Estos problemas referidos a las inferencias acerca del coeficiente alfa, dieron lugar, a principios de los años 60 del siglo veinte, al desarrollo de la teoría muestra! para el coeficiente alfa. Kristof (1963) y Feldt (1965), de forma independiente, derivaron un estadístico de contraste del coeficiente alfa, que se distribuye según una distribución F de Snedecor, a partir del cuál se puede determinar un intervalo confidencial para el valor de a en la población.

Feldt (1969) deriva el estadístico « W» para el caso de que se quieran contrastar dos valores de alfa obtenidos en muestras independientes. Dicho método fue ampliado a «n» muestras independientes a partir del estadístico «UX1» postulado por Hakstian y Whalen (1976). Feldt (1980) desarrolló un estadístico de contraste para dos valores de alfa obtenidos en la misma muestra y, Woodruff y Feldt (1986) ampliaron esta metodología al caso de «n» coeficientes obtenidos en la misma muestra.

a) Inferencias para un solo valor de a

Cuando estamos interesados en saber si alpha puede tomar un determinado valor en la población o, entre qué valores se encuentra alpha en la población, podemos aplicar el estadístico propuesto por Kristof (1963) y Feldt (1965) independientemente. Es decir, una vez que hayamos obtenido un determinado valor de alfa en una muestra de sujetos, podemos plantearnos la hipótesis de si el valor obtenido es compatible con el hecho de que alfa tome un determinado valor en la población. El estadístico de contraste propuesto puede expresarse como:

200

1-a F=-

1- &.. [4.36]

donde:

F=s

a =\

&., = v

N= r

n=n

El sig rencia.

EJEMI

Su por de 35 íte tenido ur tadísticar el coefici

La pri1 dísticamE

como hi~

Puesto blecido se ticamente

La segu tre los que

1 Obsérves

1 PSICOMETRÍA

1-a ---;::::0,67; a:s;1-0,67(1-0,83); a:s;0,89 1-0,83

0,76::::; a::::; 0,89

Al nivel de confianza del 95%, está comprendido entre los valores 0,76 y 0,89. Por tanto, el valor planteado por la Ho no está incluido en el intervalo.

b) Inferencias sobre alfa para muestras independientes

Analizaremos dos situaciones: dos muestras independientes y «K» muestras independientes.

b. 1) Dos muestras independientes

Para el caso de dos muestras independientes, Feldt (1969) propuso el estadístico de contraste W que permite comprobar la Ho: a 1 = a 2

donde:

~ ~

W =se distribuye según F con (N1 - 1) y (N2 - 1) grados de libertad.

&1 y &2 = valores del coeficiente alfa en cada una de las muestras.

N 1 y N2 = número de sujetos de cada muestra.

EJEMPLO:

[4.37]

Hemos aplicado un test de razonamiento, a una muestra de 121 sujetos, obteniendo un valor de alfa igual a 0,55 . Se aplicó el mismo test a otra muestra de 61 sujetos, obteniéndose un valor de alfa igual a 0,62. Queremos saber si existen diferencias estadísticamente significativas entre los valores de ambos coeficientes (N.C. 95%).

202

es E

tre

«K »

m u(

don

L

1<

u

S

a~ 0,76

a S 0,89

D entre los valores 0,76 y 1cluido en el intervalo.

dientes y «K» muestras

(1969) propuso el esta

a1 =a2

os de libertad.

de las muestras.

[4.37]

uestra de 121 sujetos, abIsmo test a otra muestra de . Queremos saber si exis

valores de ambos coefi-


H 0 : a,= a 2

H, =a, -:t- a 2

W= 1-0,55 =118 1-0,62

1

f o ,97s(l2o ,6o ) = 1, 58

fo ,o2s( l2o,6o ) = 0,63

Podemos afirmar, al N.C. 95%, que la diferencia entre ambos coeficientes no es estadísticamente significativa puesto que el valor W = 1,18 se encuentra entre los valores encontrados.

b.2) «K» muestras independientes

Woodruff y Feldt (1986) ampliaron el estudio de Feldt (1969) para el caso de «K» coeficientes obtenidos en K muestras independientes. Bajo la condición de muestras independientes han derivado el estadístico de contraste UX1:

donde:

k [ _X ]2

L (1-&;) , -u UX, = --~--~----~ 52

[4.38]

UX1 =se distribuye aproximadamente como X2 con n-1 grados de libertad.

K= número de muestras o coeficientes.

&; = valor del coeficiente alfa para cada muestra.

u = media de los coeficientes transformados.

S2 = media aritmética de las varianzas de cada muestra.

203

1 PSICOMETRÍA

siendo:

y

Ñ = N¡(n¡ -1)

' n¡ + 1

donde:

N¡= número de sujetos en cada muestra.

n¡ = número de ítems en cada test.

EJEMPLO:

Se ha aplicado un test compuesto por 50 ítems a tres muestras independientes de 25, 40 y 50 sujetos. Para cada una de estas muestras se obtuvieron los siguientes valores de alfa: a 1 = 01551 a 2 = 0170 y a 3 = 0175. Deseamos saber si existen diferencias estadísticamente significativas para los valores de alfa obtenidos (N.C. 95%).

Ha : al = a 2 = a 3

Hl : al * a 2 * a 3

-x -x -x u= (1-0155) 3 + (1-0,70) 3 + (1-0175) 3 = 1457 3 3 3

1

Ñ = 25(50 -1) = 24 02· 1 50+ 1 1 1

2 2 51 = 7j = o 1 o 1 6

9(24102-1)(1-0155) 3

2 2 52= ?j =01013

9(38143 -1)(1- 0170) 3

Ñ = 40(50-1) =38 43· 2 50+ 1 1 1

2 2 53 = 7j = o 1 o 11

9(48104 -1)(1- 0,75) 3 Ñ = 50(50- 1) = 48 04·

3 50+ 1 1 1

52= 01016+01013+01011 =0 013 3 1

204

Pe signii

e) ln1

Er la mi depe1 mos e

Lo traste ficier (198( (198E

C.}

Fel dos vé comiE núme

muestras independienestras se obtuvieron los si-

0,75. Deseamos saber si los valores de alfa obte-

1,457

x =o,o16 -0,55) 3

f----x;;-;- =o, o13 - 0,70) 3

¡.....-----,x;;-;- = o, o 11 -0,75) 3

LA FiAB!L!DAD :lE lAS PU:'iTUACICNES

[(1-0,55)-y3 -1,457 r [(1-o, 7ofX -1,457 r ux = + + 1 O, 013 O, 013

[ V ]2 (1 -0,75) 73 -1,457

+ =1,778+0,104+1,308=3,19 0,013

g./.(n- 1) = 2; X~,97s,2 = 7, 3 8

X~.o2 s ,2 =O, 05

Podemos afirmar, al N.C. 95%, que no existen diferencias estadísticamente significativas entre los distintos valores de alpha.

e) Inferencias sobre alfa para muestras dependientes

En algunos diseños experimentales es posible administrar distintas pruebas a la misma muestra de sujetos. En estas situaciones los coeficientes obtenidos son dependientes y no podemos emplear ninguno de los dos contrastes que acabamos de estudiar.

Los primeros estudios llevados a cabo para establecer un estadístico de contraste que nos permitiera ver si existen diferencias significativas entre dos coeficientes obtenidos en la misma muestra, fueron llevados a cabo por Feldt (1980) y, posteriormente desarrollados para «K» muestras por Woodruff y Feldt (1986).

c. 7) Dos muestras dependientes

Feldt (1980, 1987) propuso el empleo del estadístico de contraste «t » para dos valores de alfa obtenidos a partir de una misma muestra de sujetos. Feldt recomienda el empleo de este estadístico cuando N · n ~ 1.000, siendo N igual al número de sujetos y n el número de ítems. El estadístico se expresa como:

(& -& ).JN-2 t = 1 2

~[ 4 ( 1 - &1 ) ( 1 - &2 ) ( 1 - rx~x2 ) ]

[4 .39]

205

1 PSICOMETRÍA

donde:

t =se distribuye según una distribución t de Student con (N- 2) grados de li-bertad.

&, y &2 = valores del coeficiente alfa.

N= número de sujetos en la muestra.

G x =correlación al cuadrado entre las puntuaciones de los SUJ·etos en los dos 1 2

tests.

EJEMPLO:

Aplicamos dos tests de percepción visual a una muestra de 125 sujetos. La correlación entre las puntuaciones de ambos tests es igual a 0,70. Los valores del coeficiente alfa fueron, respectivamente: 0,75 y 0,84. Queremos saber si la diferencia existente entre ambos valores es estadísticamente significativa o no (N.C. 95%).

t= (0,84-0,75)~(125-2) =3 50

~[ 4(1-0,84)(1-0,75)(1-0,702)] '

t (N-2 ) = t1 23 = 1, 96

Se rechaza la hipótesis nula y podemos establecer que la diferencia entre los coeficientes es estadísticamente significativa.

c.2) rrK» muestras dependientes

Para el caso de «K» muestras, Woodruff y Feldt (1986) presentaron una serie de estadísticos de contraste entre los que cabe resaltar, por su sencillez de aplicación y gran precisión, el estadístico UX2.

[4.40]

206

dond

u; K=

N

u=

donde

siendo

y

donde:

n¡= 1

C=

nt con (N- 2) grados de li-

es de los sujetos en los dos

de 125 sujetos. La coa! a 0,70. Los valores del

. Queremos saber si la diamente significativa o no

=3,50

que la diferencia entre los

986) presentaron una serie r, por su sencillez de apli-

[4.40]


donde:

UX2 =se distribuye aproximadamente igual a X2 con (K-1) grados de libertad.

K= número de muestras o coeficientes.

N= número de sujetos de la muestra.

U; = valor de los coeficientes alfa.

u = media de los coeficientes transformados.

S2 = media aritmética de las varianzas de cada muestra .

donde:

siendo:

y

donde:

Ñ = N(ñ-1) ñ + 1

ñ = -f-- (media armónica de las longitudes de los tests) :¿_!_ i=l n;

n¡ = número de ítems de cada test.

C = media de las covarianzas S¡k.

207

1 PSICOMETRÍA

EJEMPLO:

Se aplicaron 3 versiones de un cuestionario de ansiedad a una muestra de 100 sujetos. Los cuestionarios estaban compuestos de A = 50, B = 60 y e= 65 ítems respectivamente. Los coeficientes alfa obtenidos fueron: aA = 0,60, a 8 = 0,70 y a e = 0,74. Las correlaciones entre las puntuaciones de los sujetos fueron: rAB = 0,50; rAe = 0,58 y r8e = 0,59. Calcular, al N.C. 95%, si existen diferencias significativas entre los valores de los coeficientes a obtenidos:

u= 11(1-0 60)/j + 11(1-0 70)/j + 11(1-0 74)/j =0 25+0 22+0 21=0 68 /3 ' / 3 ' /3 ' ' ' ' '

3 ñ = 1 1 1 =58, 82

- + - +-50 60 65

Ñ = 1 00(58, 82) = 96 65 58,82-1 '

2 S~ = 2 = 0,0042

9(96, 65 -1)(1- O, 60) 3

2 S~= 2 = 0,0052

9(96, 65 -1)(1- o, 70) 3

2 2 Se = 7j =0,0057

9(96,65 -1)(1- 0,74) 3

5 2=± S¡2

= 0,0042 + 0,0052 + 0,0057 = 0,0050 i=l k 3

e = 2(0,50)2 =o 0011 AB 11 1 '

9(96, 65 -1)(1- o, 60)13 (1- 0,70) 3

208

u

9.2

en E

re m cior «alp tima m ay m ay,

T( elerr caso riabl, en el

iedad a una muestra de r = 50, 8 = 60 y e = 65 ¡tueron: uA = 0,60, ua = 1es de los sujetos fueron: %, si existen diferencias

nidos:

25 + 0,22 + 0,21 = 0,68

2

= 0,0050

=0,0011


e = 2(0,58)2 =o oo16 ~ X X ' 9(96,65-1)(1-0,60) 3 (1 - 0,74) 3

e = 2(o; 59)2 =o oo1 9 BC X X 1

9(96,65-1)(1-0,70) 3 (1-0,74) 3

C = o,oo11+0,0016+0,0019 = O 0015 3(3 -1) 1

2

[(1-0,60fx - 0,68 r [(1 - 0,70fx - 0,68 J [(1-0,74fx -0,68 r ux = + + = 2

0,0035 0,0035 0,0035

= 131,03 + 189,22 + 224,68 = 544,93

g.!.(n - 1) = 2; x;9752 = 7,38

x;o2s2 =o,o5

Dado que el valor obtenido está fuera del intervalo podemos afirmar, al N.C. 95%, que existen diferencias estadísticamente significativas entre los distintos valores de alpha y, por lo tanto, rechazar la H 0 .

9.2.2. Casos particulares del coeficiente a

En este punto hacemos referencia a la estimación de la fiabilidad de un test en el caso de que los ítems que lo componen sean dicotómicos, para lo cual haremos referencia a los estudios de Kuder y Richardson (1937, 1939). Las ecuaciones de Kuder-Richardson (1937) representan un caso particular del coeficiente «alpha» de Cronbach, en el supuesto de que los ítems sean dicotómicos. Esta estimación es una función del número de ítems y sus intercorrelaciones. Cuanto mayor sea el número de ítems, y cuanto mayor sea el valor de sus covarianzas, mayor será su consistencia interna, y mayor será la fiabilidad.

Teniendo en cuenta que la ecuación de Kuder-Richardson se basa en que los elementos del test son dicotómicos, éstos vendrán puntuados con un 1, en el caso de acierto (o de respuesta favorable en el caso de que se traten de medir variables no cognitivas) y, con un O, en el caso de fallo (o respuesta desfavorable en el caso de variables no cognitivas).

209

1 PSICOMETRÍA

Como ya se ha visto, el coeficiente «alpha» puede expresarse:

a=-n [1- L5J) n -1 52

X

Sabemos, por otra parte, que la varianza de una variable dicotómica cualquiera, «h», con proporción de aciertos Ph, y proporción de errores qh, siendo qh = 1 - Ph podemos expresarla en los siguientes términos:

1

con lo que la ecuación del coeficiente «alpha» que acabamos de ver puede escribirse:

[4.41]

donde:


Ph =proporción de aciertos en el elemento h. ph = fh, igual también a la me-dia del elemento. N

qh = proporción de errores en el elemento h. qh = 1 - Ph

Phqh =varianza del elemento h.

5; = varianza total del test.

Dicha expresión recibe el nombre de ecuación de Kuder-Richardson20 (KR20).

Si los ítems que componen el test, además de ser dicotómicos, presentan la misma dificultad, podemos aplicar la ecuación de Kuder-Richardson 21 (KR21).

KR = _ n_(1- npq) 21 n - 1 5 2

X

[4.42]

210

expresarse:

variable dicotómica cualción de errores qh, siendo

illinos:

bamos de ver puede es-

[4.41]

~ igual también a la meN'

der-Richardson20 (KR20).

dicotómicos, presentan la r-Richardson 21 (KR21 ).

[4.42]


donde:


npq = suma de las varianzas de los elementos. Al ser iguales las varianzas se sustituye el signo sumatorio por «n» veces la misma varianza.

s; = varianza del test.

La expresión anterior se puede simplificar y expresarse en los siguientes términos:

X- -KR2, =-n- 1- 2 n

[

- ·p l n - 1 Sx

donde:



X media de las puntuaciones empíricas.

EJEMPLO:

[4.43]

Supongamos un test (A) de fluidez verbal y otro test (8) de comprensión lectora, cuyas puntuaciones aparecen en las siguientes matrices de datos. El test de fluidez verbal sólo admite dos posibles puntuaciones, 1 y O. Calcular el valor del coeficiente de fiabilidad de ambos tests.

_ Test A . Test B

Ítems Ítems

Sujetos A B e D E F Sujetos A B e D E F

1 1 1 1 1 1 1 1 3 4 3 3 4 3

2 1 1 1 o 1 1 2 2 3 2 4 4 2

3 1 o 1 o 1 1 3 4 2 2 3 3 4

4 o 1 o 1 o 1 4 2 1 1 2 1 2

5 o o o o o o 5 1 1 1 2 1 2

6 1 o o o o o 6 o o 1 1 1 1

211

1 PSICOMETRÍA

Medias de los ítems en el Test B:

x, = 2; X2 = 11 83; X3 = 1167 ; X4 = 21 5; X5 = 2133 y X6 = 2133

TESTA

4 P =- =0 67

1 6 1

3 P =-=0 50

2 6 1

3 P =- =0 50

3 6 1

2 P = -=0 33

4 6 1

3 P =- =0 50

5 6 1

4 P =-=o 67

6 6 1

XA=3117

S~= 4145

TEST B

q, = 1 - o 1 6 7 = o 1 3 3 p,q, = 0167.0133 = 0122

q2 = 1-0150 = 0150

q2 = 1- 0150 = 0150

q4 = 1- 0133 = 0167 p4q4 = 0133.0167 = 0122

q5 =1-0150 =0150 p5q5 = 0150 · 0150 = 0125

q6 =1-0167=0133

s,2 = ~2 -(xf = 9+4+~6+4+1_(2)2 =1~67

52 = 1 6 + 9 + 4 + 1 + 1 - (1 83)2 = 1 82 2 6 1 1

52= 9+4+4+1+1+1_(167)2 =0 54 3 6 1 1

52 = 9 + 16 + 9 + 4 + 4 + 1 - (2 50)2 =o 92 4 6 1 1

52 = 16 + 16 + 9 + 1 + 1 + 1 - (2 33)2 = 1 90 5 6 1 1

212

(

52-_: 6 -

--r

=O

En el tendrá u

cotómio

Como inferior al

estrictam1

9.3. (o{ The -

Los COE

de Heise)

terna de le dos coefic

El coefi

33 yX6 =2,33

7 ·0,33=0,22

50 ·0,50=0,25

50·0,50=0,25

33 ·0,67=0,22

50·0 50=0,25 ' '

67·0,33 =0,22


52 = 9 + 4 + 16 + 4 + 4 + 1 - (2 33)2 =o 90 6 6 ' '

x = 76

= 12 67 · 582 =

117 4 -12 672 = 35 14

B 6 1 1 6 1 1

R = KR = _n_(1- LPhqh J= aa 20 n -1 52

X

=~(1- 0,22+0,25+0,25+0,22+0,25+0,22)=0 82 5 4,45 '

R =a=-n-[1_:L5J ]=~(1 _1,67+1,82+0,54+0,92+1,90+0,90)= bb n-1 5; 5 35,14

=0,94

En el caso de aplicar KR21 con ítems cuya dificultad no es la misma, se obtendrá un valor inferior al de KR20 • En el test A, que es el que tiene los ítems dicotómicos el valor encontrado sería:

KR = _n_ 1- n = ~ 1- ' l 6 =O 80

[ x _ x

2

] [ 3 1 7

_ ~ l 21 n-1 5; 5 4, 45 '

Como se puede observar el valor obtenido mediante la fórmula KR21 es algo inferior al obtenido mediante la KR20, lo que indica que los ítems del test no son estrictamente paralelos.

9.3. Coeficientes basados en el análisis factorial de los ítems: Theta (9) y Omega (!l)

Los coeficientes Theta (8) de Carmines (Carmines y Zeller, 1979) y Omega (Q)

de Heise y Bohrnstedt (1970) constituyen dos indicadores de la consistencia interna de los ítems de un test y una aproximación al coeficiente alpha. Se trata de dos coeficientes basados en el análisis factorial de los ítems.

El coeficiente e se puede expresar mediante la siguiente fórmula:

213

1 PSICOMETRÍA

e=-n (1-_2_) n -1 A.1

[4.44]

donde:

n = número de ítems del test.

lv1 =primer autovalor de la matriz factorial; es decir, la varianza explicada por el primer factor antes de la rotación.

El coef iciente e es además un indicador de la unidimensionalidad de los ítems. Cuanto mayor sea la varianza que explica el primer factor mayor será el valor de theta y, por consiguiente, la intercorrelación entre los ítems, lo que implica que éstos se distribuyan en torno a una sola dimensión.

El coeficiente n se puede expresar mediante la siguiente fórmula:

donde:

n n

"52 -" 52h2 L.,¡ ¡ L.,¡ ¡¡

n = 1 - ---'--1; -1 ----'-1;- 1

-n n

:¿:¿cov(X1,Xh) j;J h;J

i"h

2.5} = suma de las varianzas de los ítems.

h} = comunalidad estimada del ítem j.

2.2.Cov (Xj, Xh) =suma de las covarianzas entre los ítems j y h.

[4.45]

Otra forma más sencilla de expresar el coeficiente n es en función de lascorrelaciones entre los ítems:

0=1----- [4.46]

Donde rjh representa la correlación entre los ítems j y h.

En general, y para los mismos datos, se verifica que a:::; e:::; n. La igualdad entre los coeficientes se verifica cuando los ítems son paralelos (Carmines y Séller, 1979).

214

EJE~

En 1 cinco f. de las ítems e

9.4. El -Cronl

sistencia con desi test total coeficier de la fial

rar este r test com coeficier de los & es mejor

E

[4.44]

la varianza explicada por

idimensionalidad de los mer factor mayor será el ntre los ítems, lo que im-

iente fórmula:

[4.45]

• ítems j y h.

Q es en función de lasco-

[4.46]

a~ e ~O.. La igualdad enel os (Carmines y Séller,


EJEMPLO:

En la siguiente tabla aparecen los valores de la varianza explicada por los cinco factores obtenidos tras someter a un análisis factorial a 5 variables. La suma de las comunalidades es igual a 4.95 y la suma de las correlaciones entre los ítems es igual a 5.1. Calcular el valor de los coeficientes 8 y n.

Factor Varianza explicada

1 3,286

2 1,346

3 0,224

4 0,128

5 0,014

8 = _n_(1 - _2_)= -5- (1--

1-)= 0,869

n-1 A1 5-1 3,286

n- Lh2 n = 1- ' = 1-

5-

4'95

= o 996

2~ 5 + 2 o 5,1 1

n + L./Jh

9.4. El coeficiente beta (J3) de Raju

Cronbach (1951) introdujo el coeficiente alfa como una medida de la consistencia interna de un test. En el caso de que un test se divida en varios subtests, con desigual número de ítems, y se quiera estimar la consistencia interna del test total a partir de las puntuaciones totales de los sujetos en los subtests, el coeficiente alfa presenta el problema de que proporciona un valor infraestimado de la fiabilidad. El coeficiente f3 propuesto por Raju (Raju, 1977) permite superar este problema y proporciona una estimación adecuada de la fiabilidad de un test compuesto de varios subtests con distinto número de ítems. Se aplica este coeficiente cuando se desconocen las puntuaciones de los sujetos en los ítems de los distintos subtests. En el caso de conocer los valores de estas puntuaciones es mejor emplear el coeficiente a.

El coeficiente f3 viene dado por la expresión:

215

1 PSICOMETRÍA

donde:

k = número de subtests.


Sj = varianza de cada subtest.

nj = número de ítems en cada subtest.

N= número de ítems total de la batería.

EJEMPLO:

[4.47]

Hemos aplicado un test de destreza manual, compuesto de cuatro subtests, a una muestra de 200 empleados de correos. Los subtests están compuestos por A = 18, 8 = 30, C = 45 y O = 55 ítems respectivamente. La varianza total del test es igual a 50 y las varianzas de los respectivos subtests iguales as; = 5, Sb = 7, S~= 9 y S~ = 11. Calcular el valor de los coeficientes a y p.

a= _ 4_ ( 1- 5 + 7 + 9 + 11 )= 0 48 4-1 50

1

~ = 50- (5 + 7 + 9 + 11) =o 50 50[1 - (0,015+0,041+0,092+0,138)]

1

En el caso de que los distintos subtests contengan el mismo número de ítems, entonces el coeficiente p es igual al coeficiente a. (Véase Apéndice al final del tema)

1 O. ESTIMACIÓN DE LA PUNTUACIÓN VERDADERA DE LOS SUJETOS EN El ATRIBUTO DE INTERÉS

Una vez estudiado el problema de cómo poder calcular la fiabilidad de un test mediante los procedimientos descritos anteriormente, estamos en condicio-

216

[4.47]

, esto de cuatro subtests, a

están compuestos por La varianza total del test

iguales a S~ = 5, Sb = 7,

a y~·

ismo número de ítems, enApéndice al final del tema)

ERDADERA DE LOS S

lcular la fiabilidad de un estamos en condicio-


nes de poder abordar el problema de cómo hacer estimaciones acerca del valor de la puntuación verdadera de un sujeto en un test y del error que afecta a las puntuaciones empíricas obtenidas en el mismo. Desgraciadamente no podemos calcular el valor exacto de la puntuación verdadera de un sujeto, pero sí establecer un intervalo confidencial dentro del cual se encontrará dicha puntuación con un determinado nivel de confianza. Dentro de este apartado veremos tres formas de llevar a cabo esta estimación: la primera mediante la desigualdad de Chebychev, la segunda basada en la distribución normal de los errores y, la tercera basada en el modelo de regresión lineal de mínimos cuadrados.

1 0.1. Estimación mediante la desigualdad de Chebychev

Si no se hace ningún supuesto sobre la distribución de las puntuaciones empíricas o de los errores, se aplica la desigualdad de Chebychev:

[4.48]

donde:

1---; =nivel de confianza utilizado. K

Se = error típico de medida.

EJEMPLO:

Habiendo administrado a una muestra de 200 sujetos un test de razonamiento numérico, se obtuvieron los siguientes resultados: X= 52 , Sx = 7 y rxx = 0,73. Estimar la puntuación verdadera de un sujeto que obtuvo en el test una puntuación empírica de 65 puntos. Nivel de confianza del 95%.

se = SX ~1- ( XX = 7 .j1- o, 73 = 3, 64

1 1--

2 =O, 95; K = 4, 5

K

P{l65- VI~ 3,64 . 4,5} 2 o, 95

P{-16,38~IV-65I~16,38}2 0,95

P{48,62 ~V~ 81,38} 2 0,95

217

1 PSICOMETRÍA

Por lo tanto, la puntuación verdadera se encontrará entre los valores 48,62 y 81,38. Este es, sin embargo, un intervalo confidencial demasiado amplio que conlleva una estimación vaga. Esta amplitud exagerada del intervalo confidencial puede ser debida, en primer lugar, a un coeficiente de fiabilidad bajo o, en segundo lugar, a que el método de Chebychev no considera el tipo de distribución de las puntuaciones empíricas.

1 0.2. Estimación basada en la distribución normal de los errores

Este método asume una distribución normal de los errores de medida (con media O y varianza S~) y de las puntuaciones empíricas condicionadas a un determinado valor de V.

Para la determinación del intervalo confidencial dentro del que se encontrará la puntuación verdadera del sujeto seguiremos los siguientes pasos:

1) Se fija un nivel de confianza y se determina el valor Zc correspondiente buscándolo en la tabla de distribución normal. Por ejemplo, para un nivel de confianza del 95% tendremos un valor Zc igual a 1,96.

2) Calcular el error típico de medida Se.

se= sX.J1- (XX ¡ para puntuaciones directas 0 diferenciales

Sze = .j1- rxXI para puntuaciones típicas

3) Calcular el error de medida máximo (fmáxl que estamos dispuestos a admitir. Este error de medida se verá afectado también por el nivel de confianza adoptado.

4) Calcular el intervalo confidencial en el que se encontrará la puntuación verdadera.

IC =X± Emáx

EJEMPLO:

Habiendo administrado a una muestra de 200 sujetos un test de razonamiento

numérico, se obtuvieron los siguientes resultados, X= 52, Sx = 7 y rxx = 0,73. Estimar la puntuación verdadera (en puntuaciones directas, diferenciales y típicas)

218

entre los valores 48,62 y demasiado amplio que del intervalo confidende fiabilidad bajo o, en

idera el tipo de distribu-

mal de los errores

errores de medida (con condicionadas a un de-

del que se encontrará

ientes pasos:

lor Zc correspondiente r ejemplo, para un nivel

a 1 ,96.

renciales

estamos dispuestos a adién por el nivel de con-

contrará la puntuación

un test de razonamiento 2, Sx = 7 y rxx = 0,73. Es

diferenciales y típicas)


de un sujeto que obtuvo en el test una puntuación empírica directa de 65 puntos. N.C. 95%.

X= 65 ; X= 65- 52= 13 ; z = 65- 52 = 1 86 X 7 f

N.C.95%:::::} Zc = ±1, 96

fmáx =Zc ·Se =1,96·3,64=7,13

{72, 13

1 e = X± Emáx = 65 ± 7,13 ~ ; 57,85 ~V~ 72,13 (Puntuaciones 57, 87 Directas)

{20, 13

1 e =X± Emáx = 13 ± 7,13 ~ ; 5,87 ~V~ 20,13 5,87

Sz. = ~1- rxx = .J1- 0,73 =O, 52

fmáx = Zc · Sze = 1, 96 · 0,52 = 1,02

{2,88

l.e = Zx ± fmáx = 1,86 ± 1,02 ~ 0,84

O, 84 ~ Zv ~ 2, 88 (Puntuaciones Típicas)

(Puntuaciones Diferenciales)

Como se puede apreciar, con respecto a la estimación según el procedimiento de Chebychev, el intervalo confidencial se ha reducido sensiblemente.

La principal ventaja que presenta la utilización de un intervalo confidencial, a pesar de las críticas formuladas por Nunnally (1970), es que clarifica el hecho de que una puntuación empírica está afectada por un cierto error de medida. Es decir, si un test presenta un coeficiente de fiabilidad bajo y, consiguientemente, poca precisión de medida, los intervalos confidenciales son muy amplios. A medida que dichos coeficientes van incrementándose, los valores extremos del intervalo se acotan denotando una aproximación a la puntuación verdadera del sujeto (Al len y Yen, 1979; Yela, 1984).

219

1 PSICOMETRÍA

1 0.3. Estimación basada en e l Modelo de Regresión

Así como la correlación entre las puntuaciones verdaderas y los errores de medida es igual a cero (rve = 0), no sucede lo mismo entre la correlación de las puntuaciones empíricas de los sujetos y los errores de medida, puesto que dichas puntuaciones se ven afectadas por un cierto componente de error produciéndose un sesgo. Esta correlación vendrá expresada, como ya hemos visto, como

( Xe = .J1 - (XX

La correlación así establecida es siempre igual o mayor de cero. Su valor máximo se alcanzará cuando la fiabilidad del test sea nula (rxx =O) y su valor mínimo se alcanzará cuando la fiabilidad del test sea perfecta (rxx = 1 ). En el primer caso las puntuaciones empíricas coincidirán con los errores y, en el segundo caso, no habrá errores y las puntuaciones empíricas coincidirán con las verdaderas.

En cualquier caso, como esa correlación es siempre positiva, las puntuaciones empíricas son siempre sesgadas y, por lo tanto, es más conveniente establecer el intervalo confidencial no a partir de las puntuaciones empíricas (que son sesgadas) sino a partir de la puntuación verdadera estimada, que podremos calcular mediante el modelo de regresión lineal según el criterio de mínimos cuadrados.

Las ecuaciones de la recta de regresión de Y sobre X vienen expresadas por las siguientes ecuaciones:

1 - S - S S ( - ) -Puntuaciones Directas: Y'= (Y- rxy _____!:'_X)+ rxy _____!:'_X= rxy _Y X- X +Y

sx sx sx

, sy - Puntuaciones Diferenciales: y = rxy - X siendo X= (X- X)

sx

X-X - Puntuaciones Típicas: ZY, = rxy z x siendo Zx =-S-

x

Nota: El lector interesado puede encontrar una explicación más detallada en los textos de Introducción al Análisis de Datos y Diseños de Investigación.

A partir de dichas ecuaciones de regresión podemos establecer las ecuaciones correspondientes para estimar el valor de la puntuación verdadera. Dichas ecuaciones vendrán expresadas de la siguiente forma:

220

as y los errores de tre la correlación de las

ida, puesto que dichas te de error produciénya hemos visto, como

r de cero. Su valor máa (rxx =O) y su valor mí

cta (rxx = 1 ). En el pris errores y, en el segundo incidirán con las verda-

positiva, las puntuacioás conveniente estable

ones empíricas (que son ada, que podremos cal

criterio de mínimos cua-

X vienen expresadas por

S - ) -X= r _l'_ (X- X +Y xy S

X

establecer las ecuacioción verdadera. Dichas


1. Ecuación de regresión en puntuaciones directas de V sobre X.

[4.49]

S S S - -Sabemos que, rxv ---"é. = ---"é. ---"é. = rx: = rxx y dado que V = X podemos estable-cer que: Sx Sx Sx

- -V' = rxx x + (X - (XX X) [4 .50] V' = rxx(X - X) + X

2. Ecuación de regresión en puntuaciones diferenciales.

sv d 1 s v sv s: COmO rxv = - ten remos que: V = --X = -2

X = r ·X S SS S XX X X X X

1

V=rxx·X

v' = rxx (X- X)

3. Ecuación de regresión en puntuaciones típicas.

EJEMPLO:

[4.51]

[4.52]

Con los datos del ejemplo anterior, estimar la puntuación verdadera de un sujeto que obtuvo en el test una puntuación empírica de 65 puntos. N.C. 95%

Puntuaciones directas:

V'= rxx X +(X- rxx X) = 0,73 · 65 +(52 -0,73 · 52)= 47,45 + 14,04 = 61,49

Puntuaciones diferenciales:

v' = rxx · X= 0,73 · (65 - 52) = 9,49

221

1 PSICOMETRÍA

Puntuaciones típicas:

65-52 zv' = rxv. z x = .JoJ3. = 0,85 ·1,86 = 1,58

7

Una vez estimado el valor de la puntuación verdadera se seguirá el esquema general con el fin de establecer el intervalo confidencial en el que se pueda aceptar, a un determinado nivel de confianza, que se encuentra la puntuación verdadera del sujeto. Los pasos a seguir serían los siguientes:

222

Adoptar un nivel de confianza y determinar el valor zeta crítico (Zc)·

Calcular el error típico de estimación Svx- Siendo:

Svx = Sx_j1- rxx .fr:: (Puntuaciones directas o diferenciales)

Szvzx = _j1- rxx .fr:: (Puntuaciones típicas)

Calcular el error máximo de estimación fmáx· Siendo fmáx = Zc · Svx en puntuaciones directas o diferenciales y Emáx = Zc · Szvzx en puntuaciones típicas.

Establecer el intervalo confidencial a partir de la estimación puntual obtenida al aplicar las ecuaciones de regresión.

Dicho intervalo viene expresado por: V'± Emáx' ó v' ± fmáx' ó Zv' ± fmáx

Para los datos del ejemplo anterior tenemos:

N.C. 95% => Zc = ±1,96

Svx =Sx-J1-rxx .fr:: =7~~1--0-J-3.JOJ3 = 3,09

fmáx = zc. se= 1,96. 3,09 = 6,06

' {67,55 IC =V ± fmáx = 61,49 ± 6,06---7 55,43

{15,55

/.C.=v'±fmáx =9,49 ±6,06---7 3,43

En puntuaciones directas

En puntuaciones diferenciales

Szvzx = .j1- rxx Jr:: = .j1- 0,73.JOJ3 = 0,44

de

Si e

6 = 1,58

rase seguirá el esquema en el que se pueda acepentra la puntuación ver

es:

1lor zeta crítico (Zc).

ferenciales)

do Emáx = Zc · Svx en · Szvzx en puntuaciones

estimación puntual ob-

iones directas

·ones diferenciales

fmáx = Zc · SZvZx = 1,96 · 0,44 = 0,86

{2,44

f.C.= Zv. ± Emáx = 1,58 ± 0,86 ~ 0,72


En puntuaciones típicas

11. FIABILIDAD DE UNA BATERÍA DE TESTS

Se trata de calcular la fiabilidad de la batería en función de los coeficientes de fiabilidad, varianzas y covarianzas de los subtests que la van a conformar.

La fórmula a utilizar en este caso será:

Siendo:

s; = varianza del subtest j.

rjj =coeficiente de fiabilidad del subtestj.

5} = varianza de la batería total.

223

1 PSICOMETRÍA

12. EJERCICIOS DE AUTOEVALUACIÓN

1. La razón entre la desviación típica de los errores y la desviación típica de las puntuaciones empíricas es 0,45. ¿Cuál es el valor del coeficiente de fiabi 1 idad?

2. Calcular el coeficiente de fiabilidad de un test sabiendo que la varianza de

las puntuaciones empíricas es igual a 36 y el error típico de medida es 3.

3. ¿Cuál es el valor del coeficiente de fiabilidad si la proporción de varianza verdadera que hay en la varianza empírica de un test es O, 90?

4. Hemos aplicado un test a un grupo de 100 sujetos. La desviación típica de los errores de medida es 2, lo que significa el 10% de la varianza de las puntuaciones verdaderas. Calcular el coeficiente de fiabilidad de dicho test.

5. Hemos aplicado un test de fluidez verbal a un grupo de 150 sujetos. La varianza de las puntuaciones empíricas de los sujetos de dicho grupo fue 36 y el coeficiente de fiabilidad 0,85.

Calcular:

224

a) El error típico de medida del test.

b) El intervalo confidencial dentro del cual podemos afirmar que se encontrará la puntuación diferencial verdadera de un sujeto cuya puntuación típica empírica fue de 0,75 (N.C. 99%).

6. El Instituto Nacional de Calidad desea examinar el nivel de conocimientos en el área de Humanidades de los alumnos al finalizar la educación obligatoria . Para ello, construye una prueba de cinco preguntas cortas, calificadas en una escala de 1 a 5 cada una de ellas; esta prueba se administra a una muestra representativa de 2.000 alumnos procedentes de todas las comunidades autónomas. En la tabla adjunta se presentan las respuestas dadas a las preguntas de dicha prueba por los seis primeros alumnos de la muestra.

Calcular:

a) La fiabilidad de la prueba.

b) Si se añadieran a la prueba 5 preguntas paralelas a las ya existentes, ¿se obtendría un coeficiente de fiabilidad significativamente diferente al anterior? La correlación entre las puntuaciones del test original y del alargado es 0,85 (N.C. 95%).

~s y la desviación típica de ~1 valor del coeficiente de

abiendo que la varianza de ror típico de medida es 3.

la proporción de varianza

n test es O, 90?

. La desviación típica de O% de la varianza de las te de fiabilidad de dicho

de 150 sujetos. La vade dicho grupo fue 36

mos afirmar que se ende un sujeto cuya pun-

r el nivel de conocimienal finalizar la educación neo preguntas cortas, ca

ll as; esta prueba se admimnos procedentes de toadjunta se presentan las

por los seis primeros

as a las ya existentes, ¿se cativamente diferente al es del test original y del


e) Estimar la puntuación verdadera en el test original del alumno número 4.

1 3 2 4 3 4

2 2 3 4 3 2

3 5 4 3 4 5

4 2 1 3 2 1

5 3 2 2 1 3

6 4 5 4 5 4

7. Ejercicios conceptuales

A continuación se ofrecen una serie de enunciados ante los que tendrá que responder si son verdaderos o falsos:

1. Si dos tests son paralelos, las medias de las puntuaciones empíricas deben ser iguales

2. El coeficiente de fiabilidad expresa la proporción de la varianza verda-dera que hay en la varianza de las puntuaciones empíricas.

3. El coeficiente a es un índice de la estabilidad de las medidas.

4. Un test tiene un único coeficiente de fiabilidad.

5. En el caso de que un test esté formado por ítems dicotómicos de igual nivel de dificultad, el mejor estimador del coeficiente de fiabilidad lo constituye la ecuación KR21.

6. Si un test tiene un coeficiente de fiabilidad igual 0,80, el índice de fiabilidad es igual a 0,64.

7. Si se cumple que 5~ = 5; el coeficiente de fiabilidad rxx = 1.

8. Para calcular la fiabilidad de un test mediante el método de dos mitades, aplicamos el test una sola vez.

9. En la fórmula de Spearman-Brown, n indica el número de ítems del test.

1 O. Se define el error típico de medida como la desviación típica de los errores de medida.

11. El coeficiente de fiabilidad de un test es igual a cero si 5~ =O.

225

1 PSICOMETRÍA

226

12. El coeficiente de fiabi 1 idad varía entre -1 y 1 .

13 . La fiabilidad de un test depende de la longitud del mismo.

14. El valor de a ~ Gv· 15. La correlación entre las puntuaciones empíricas y los errores es siem

pre igual cero.

del mismo.

s y los errores es siem-


13. SOlUCIONES A lOS EJERCICIOS DE AUTOEVAlUACIÓN

1.

5e =o 45 S 1

X

rxx =1- ~~ = 1-0,452 =1-0120=0180 X

2.

o también

5 2 9 rxx =1-~=1--=1-0 25=0 75 52 36 1 1

X

3.

52 =-2-=20

V 011 o

52 20 rxx = ----'¡ =- = 0183 sx 24

5.

a) Se =Sx.J1-rxx =6.J1-0 1 85 =2132

b) N.C. 99% ~ Zc = ±2158

27 'xx =- =01 75

36

227

1 PSICOMETRÍA

Z = 0,75-7 X= 0,75 · 6 = 4,5

svx = seJT: = 2,32..}0,85 = 2,14

V'=rxx · X=0,85·4,5=3,82

fmáx = 2, 58· 2,14 = 5, 52

3, 82 ± 5, 52 -7-1,70::; V::; 9,34

6.

Alumnos x1 x2 x3 x4 Xs

1

2

3

4

5

6

a)

3 2 4 3 4

2 3 4 3

5 4 3 4

2 1 2 2

3 2 2 1

4 5 4 5

I,sl

[

n l a= n~ 1 1- ;~~

S~= 67/6- (19/6)2 = 1, 14

S~= 59/6-(17/6)2 = 1, 81

S~ = 65/6- (19/6)2 =O, 81

2

5

1

3

4

s¡ = 64/6- (18/6)2 = 1, 67

S~= 71/6- (19/6)2 = 1, 81

S~= 1562/6- (92/6)2 = 25,22

Preguntas

X x2 1 x2 2 x;

16 9 4 16

14 4 9 16

21 25 16 9

8 4 1 4

11 9 4 4

22 16 25 16

65

a= _2__(1_1,14+1,81+0,81+1,67+1,81]= 0 89 5-1 25, 22 '

228

x¡ X~ X2

9 16 256

9 4 196

16 25 441

4 1 64

1 9 121

25 16 484

64 71 1562

7

x; X~ X~

16 9 16

16 9 4

9 16 25

4 4 1

4 1 9

16 25 16

71

0,89

X?

256

196

441

64

121

484

1562

b)

e)


Teniendo en cuenta el resultado obtenido, podemos concluir que el test constituye un buen instrumento para medir el nivel de conocimientos en el área de Humanidades.

n = EF 1 El= 1 O 15 = 2

r = 2·0,89 =0 94 XX 1 + 0,89 l

(á, - á2 ) ~N - 2

t= ~4(1-á1 )(1-á2 )(1-r¡~ ) :=TN-2

(0, 94-0,89)~6-2 t = = 1,1 7 < t 95 4 = 2, 78

~4(1-0,94)(1-0,89)(1-0,852 ) . '

No parecen existir diferencias estadísticamente significativas entre las pruebas de 5 y 1 O preguntas, a ese nivel de confianza.

V' = rxx (X - X) + X

V'= 0,89(8 -15,33) + 15,33 = 8,81

7. Soluciones a los ejercicios conceptuales

1. El enunciado es verdadero.

Teniendo en cuenta que la esperanza matemática de los errores de medida es cero y que las puntuaciones verdaderas de los sujetos son iguales en ambos tests, podemos concluir la existencia de igualdad entre las medias de las puntuaciones empíricas.


Se expresa como el cociente entre la varianza de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas y se puede interpretar como la proporción de la varianza de las puntuaciones empíricas de los sujetos que se debe a la varianza verdadera o lo que es lo mismo, la proporción de varianza verdadera que hay en la varianza empírica.

229

1 PSICOMETRÍA

230

3. El enunciado es falso.

El coeficiente a es un estimador de la consistencia interna del test.


El valor del coeficiente de fiabilidad no depende únicamente de las características propias del test, sino de otros factores como la variabilidad de la muestra en la que es aplicado y la longitud del test.



rxv = JT:: =.Jo, 80 =O, 89




((n» indica el número de veces que hay que alargar o reducir la longitud del test.

1 O. El enunciado es verdadero.


52 rxx = 1, puesto que rxx = 1- --T

sx 12 . El enunciado es falso.

El coeficiente de fiabilidad varía entre O y 1. Definimos el coeficiente de fiabilidad como el cociente entre la varianza de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas. Esta forma de expresar el coeficiente de fiabilidad nos indica la proporción de la varianza verdadera que se puede explicar a partir de la varianza empírica de las puntuaciones de los sujetos. A medida que dicha proporción aumenta, disminuye el error de medida. Si rxx' = 1, el error es cero lo que implica una fiabilidad perfecta del test. Sin embargo, a medida que dicha proporción disminuye se produce un incremento en el error de medida. En el caso de que rxx' = O, la varianza de los errores de medida sería igual a la varianza de las puntuaciones empíricas.

cia interna del test.

e únicamente de las cares como la variabilidad

d del test.

=1

largar o reducir la longi-

Definimos el coeficiente nza de las puntuaciones

. empíricas. Esta forma de ica la proporción de la a partir de la varianza . A medida que dicha

ida. Si rxx' = 1, el error del test. Sin embargo, a

1 roduce un incremento en la varianza de los errores tuaciones empíricas.



Uno de los factores que influye en la fiabilidad de un test es su longitud, es decir, el número de ítems que lo componen. Cuantos más ítems representativos del rasgo a medir se utilicen mayor será la información que obtengamos acerca del atributo que estemos estudiando y, consiguientemente, cabe pensar que menor será el error que cometamos al pronosticar la puntuación verdadera de un sujeto. Por lo tanto, la fiabilidad del test se incrementará. Ahora bien, llega un momento en que por más que se aumente el número de ítems ya no se produce un aumento significativo.


El coeficiente alpha puede ser considerado como una estimación del límite inferior del coeficiente de fiabilidad de un test.


Esta correlación viene expresada como: rxe = .J1- rxx · La correlación así establecida es igual o mayor de cero. Su valor máximo se alcanzará cuando la fiabilidad del test es nula (rxx = O) y su valor mínimo se alcanzará cuando la fiabilidad del test es perfecta (rxx =1 ).

231

1 PSICOMETRÍA

14. APÉNDICE

A continuación se ofrecen las demostraciones de las fórmulas que han ido apareciendo a lo largo del tema.

4.3

4.5

4.6

4.8

4.9

4 .1 o

232

I,ve I,ve 1 I,ve r =--=----.Como --=O~r =0 ve NS S N S S N ve

v e v e

E=X- V

Por definición, la ecuación del modelo establece que: X= V+ E. Despejando: E = X- V

E(e) =O

e= X- V, luego la E(e)= E(X)- E(V). Según el primer supuesto del modelo sabemos que: E(X) =V, por lo tanto: E(e) =V- E(V) =V- V= O

Dado que la covarianza es, Cov (v:,e) = r ve Sx Se, y, según el segundo supuesto, rve =O podemos inferir que Cov (v:,e) =O

La varianza de una variable que es suma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas. s; = S(v+e) = S~ + S~ + 2Cov(v,e). Partiendo del segundo supuesto del mo-

Cov(v e) . . delo sabemos que, rve = ' , de donde podemos concluir que el va

sxse lor de Cov(v:,e) = O. Por lo tantos; = S~ + S~

Cov(X, V) =S~

La Cov(X, V) = E(XV)-E(X)E(V). Según el modelo lineal X= V+ e, sustituyendo

4

4.1

as fórmulas que han ido

que: X = V + E. Despe-

er supuesto del modelo )=V-V=O

y, según el segundo su-

dos es igual a la suma de doble de las covarianzas.

supuesto del mo-

mos concluir que el va

lineal X= V+ e, sustitu-

4.11

4.12


Cov(X,V) = E((V+e)V)-E(V+e)E(V) = E(VJ2+E(Ve)-E(V)E(V)-E(e)E(V)

Puesto que: E(Ve)-E(e)E(V) = Cov(~~¡e), y la Cov(~e) = O, podemos establecer,

Cov(X, V)=E(V2)-(E(V))2 =S~

S r= ---"-xe S

X

En puntuaciones diferenciales:

r = Ixe = L(v+e)e =:¿ve+ :¿e2 =:¿ve+ :¿e

2

xe NSxSe NSxSe NSxSe NSxSe NSxSe

"" "" 2 ~ve ~e como -- = rveSvSe, y -- = s;, podemos establecer que

N N

rxe = rve SvSe + l = Se ya que r ve Sv Se = O, por ser igual a la covarianza SxSe SxSe Sx

entre las puntuaciones verdaderas y los errores.

Cov (X1,X2) = Cov (V1,V2) = f(X1,X2)- f(X1) f(X2). Según el modelo lineal X= V+ e, sustituyendo en X1 y X2 .

Cov (X1,X2) = f((V1+e1) (V2+e2))- f(V1+e1) f(V2+e2) = f(V1 V2) + f(V1e2) + + f(e1 V2) + f(e1e2)- f(V1) f(V2)- f(V1) f(e2)- f(e1) f(V2)- f(e1) f(e2)

Como: f(V1 e2) - f(V1) f(e2) - Cov (V1 ,e2) = O

f(e1 V2)- f(e1) f(V2)- Cov (e1,V2) =O

f(e1 e2) - f(e1) f(e2) - Cov (e1 ,e2) = O

Es decir, no existe covariación entre las puntuaciones verdaderas y los errores, y tampoco entre los errores entre sí, por lo que podemos concluir que:

Cov (X1 ,X2 ) = f(V1 V2) - f(V1) f(V2) = Cov (V1, V2)

Si tenemos formas paralelas entonces, Cov (X1,X2) = Cov (V1,V2) = Var (V)

233

1 PSICOMETRÍA

4.13

4 .14

4.17

4 .18

234

Por definición sabemos que la correlación entre las puntuaciones obtenidas por una muestra de sujetos en dos formas paralelas la podemos expresar

Cov(X, X') S ' 1 . ' (3 1 O) C (X X' ) 52 como rxx· = . egun a expres1on . : ov , = v .

SxSx·

Asímismo, hemos establecido que las varianzas de las puntuaciones empíricas en dos tests paralelos son iguales, luego podemos establecer la igual-

dad: Sx = Sx· y que Sx Sx = s;. De donde se concluye que rxx· = 5~ = r}v . Sx

Como consecuencia de la expresión 4.13, se deduce fácilmente que rx1x2 = rx1x3 = rx2x3 = .... · = rx¡xk

Sabemos que la correlación entre dos formas paralelas de un test (X, X')

d Cov(X,X') S , h . C pue e expresarse como: rxx· = . egun emos v1sto ov (X,X') = SxSx·

= S~ y, por ser formas paralelas, Sx = Sx·

Podemos establecer rxx· = 5~ y que el coeficiente de fiabilidad, dados dos Sx

o mas tests paralelos, es el mismo para todos puesto que se mantiene constante tanto el valor de la varianza verdadera como el de la varianza empírica.

s: 52 52 52 ( XX' = 21 puesto que X = V + e tenemos,

sx

as puntuaciones obtenidas elas la podemos expresar

3.10): Cov (X,X') = S~.

de las puntuaciones em,demos establecer la igual-

5~ 2 ·luye que rxx' = - 2 = fxv ·

Sx

uce fácilmente que

ralelas de un test (X, X')

hemos visto Cov (X,X') =

de fiabilidad, dados dos

puesto que se mantiene como el de la varianza

4.19

4.20

4.21


S , h . 1 s: d s; - s: s2 s2 s2 egun emos VIStO, rxx' = --2' operan o rxx' = 2 ::::? rxx' X = X - e ' sx sx

despejando 5~ tenemos s: = s;- s;rxx' = s;- s;(1- rxx' ) de donde:

se = 5x~1- rxx'

2 - L(v- v')2 En puntuaciones diferenciales podemos expresar: Svx - -=--

n

Mediante la ecuación de regresión en puntuaciones diferenciales v' = rxxx,

Sustituyendo:

S 52

Como hemos visto: rxv = ~ y rxx = 5~ de donde: SX X

s; + (XXs; - 2rXXSVSX 5v = s; + (XXs;- 2rXXs; = s;- s;rXX = s;(1- (XX), teniendo

sx

en cuenta que, Sv = Sx .¡¡:: sustituyendo en la expresión anterior:

235

1 PSICOMETRÍA

4.24

236

Por lo general, la puntuación V' estimada a partir de las ecuaciones de la recta de regresión no coincide con la puntuación verdadera del sujeto V. La diferencia entre la puntuación verdadera del sujeto (V) y la puntuación verdadera estimada (V') es lo que conocemos como el error de estimación. Definimos el error típico de estimación (5vxl, como la desviación típica de los errores de estimación.

Según el modelo, las varianzas en los tests paralelos son iguales por lo que:

5x1-x

2 = 2s; - 2rxx's; = 25;(1- rxx') simplificando y sacando la raíz cuadrada:

SX¡-X2 =5x ~1-rxx'..Ji

R = nrxx xx 1 + (n - 1)rxx

Partimos de la definición del coeficiente de fiabilidad como cociente entre la varianza verdadera y la varianza empírica de las puntuaciones de los sujetos en un test.

R = S~v XX 52

nx

A continuación descomponemos tanto la varianza verdadera como la varianza empírica del test total.

La varianza de las puntuaciones verdaderas, S~v' será igual a la suma de las «n» varianzas de las puntuaciones verdaderas más la suma de las «n(n-1 )»

covarianzas: S~v = L,.s;a + L,.rvav65va 5v

6• Puesto que partimos del supuesto

de ítems paralelos, tanto las varianzas como las covarianzas son iguales, por lo que la expresión anterior puede formularse como:

s~v = ns; + n(n -1)rv V sv svb' También sabemos que la correlación rv V = 1 a aba ab 1

ya que es la correlación entre las puntuaciones verdaderas, y que Sva = 5v6,

Por lo tanto: s~v = ns; + n(n -1)5; . a a

tir de las ecuaciones de la )n verdadera del sujeto V. sujeto (V) y la puntuación mo el error de estimación. mo la desviación típica de

~los son iguales por lo que:

, sacando la raíz cuadrada:

lidad como cociente entre las puntuaciones de los su-

verdadera como la va-

será igual a la suma de las la suma de las «n(n-1 )»

que partimos del supuesto

covarianzas son iguales,

como:

u e la correlación r vavb = 1,

verdaderas, y que Sva = 5v6,


Sacando factor común a ns;a, S~v = ns;a (1 + (n - 1)). Simplificando podemos

concluir que la varianza de las puntuaciones verdaderas en el test total puede expresarse: S~v = nS~a

Veamos ahora lo que ocurre en el caso de la varianza empírica, S~x · La varianza de las puntuaciones empíricas será igual a la suma de las «n» varianzas de las puntuaciones empíricas más la suma de las «n(n-1 )» cova-

rianzas: s; = L,.s;a + L,.rXaXb s Xa sXb" Puesto que partimos del supuesto de

ítems paralelos, tanto las varianzas como las covarianzas son iguales entre,

por lo que la expresión anterior puede formularse como S~x = nS~ +

+ n(n -1)rXaXb s ;a 1 por ser SXa = SXb

Sacando factor común a ns; 1 s~x = ns; (1 + (n -1)rx Xb ). a a a

Sustituyendo el valor de la varianza verdadera y la varianza empírica en la expresión del coeficiente de fiabilidad, tenemos:

2 n52 52 R - 5

nv - Va = n ~ . Si tenemos en cuenta que XX s~X ns;a (1 + (n -1)rXaXb ) SXa 1 + (n -1)rXaXb

52 ~2a = rx x y que las intercorrelaciones entre cada dos o mas tests paralelos 5 a a

X a

son iguales, es decir, rx X = rx Xb =(XXI podemos concluir: Rxx = nrxx a a a 1 + (n - 1)rxx

Partiendo de lo anterior, cuando se aumenta «n» veces la longitud del test la varianza de los errores sería: s~e = ns; + n(n -1)rxx

Un caso particular de esta fórmula es cuando se duplica la longitud del test inicial.

En ocasiones lo que pretendemos es que un test tenga una determinada fiabilidad, y lo que nos planteamos es saber cuántos ítems tendríamos que aumentar el test para conseguir dicho coeficiente.

El número de ítems que tenemos que aumentar dicho test lo podemos hallar despejando el término «n» de la ecuación general de Spearman-Brown.

R = nrxx xx 1 + (n - 1)rxx

237

1 PSICOMETRÍA

4.28

238

Una vez conocido el valor de «n» podemos calcular el número de elementos finales (EF) . EF = El · n. La diferencia entre los ítems finales y los ítems iniciales nos dará el número de elementos que habría que añadir o disminuir un test para obtener el coeficiente de fiabilidad deseado.

R = 2rxx XX 1 + rxx

Supongamos que tenemos una serie de formas paralelas y que juntamos

éstas de dos en dos: xa + xb, xe + xd·

Puesto que dichos tests son paralelos podemos establecer: rxx = rab = rae =

... = red' es decir, dados dos o mas tests paralelos, las intercorrelaciones entre cada dos de ellos son iguales.

Por definición el coeficiente de fiabilidad del test Rxx puede expresarse, en

. . . L(Xa +xb)(xc +xd) puntuaciones d1ferenc1ales como: R xx = , al ser formas

N s (Xa +xb )s (Xc +xd)

paralelaS, laS deSViaCiOneS típiCaS Serán igualeS (S(Xa+Xb) = s (Xc+xd) )t p0r 10 que podemos expresar el denominador como S(xa+xb)' y sustituyendo:

L(Xa + xb)(xc + xd) R xx = N -----,--2--

S (xa +xb) .

Si desarrollamos el primer término tendremos:

L(Xa + xb)(xc + xd) = LXaXc + LXaXd + LXbXc + LXbXd

N N N N N

puesto que estos cuatro términos expresan covarianza, les podemos susti

tuir por rae Sa Se+ rad S a Sd + rbe Sb Se + rbd Sd Sd y, al ser formas paralelas, la expresión puede escribirse como: 4S;rxx·

Si desarrollamos el término S(xa+x6¡, puesto que la varianza de una variable

que es suma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas:

tl cular el número de elelos ítems finales y los

que habría que añadir o abilidad deseado.

aralelas y que juntamos

stablecer: rxx = rab = rae = s, las intercorrelaciones

Rxx puede expresarse, en

)(x + x ) e d 1 al ser formas

J5 (xc+xdl

(Xa+Xb) = 5 (Xc+Xd) )t pOr lO que y sustituyendo:

ianza, les podemos sustiy, al ser formas paralelas,

• varianza de una variable as varianzas de cada una


Sustituyendo,

y simplificando,

R = 2rxx XX 1 + rxx

Esta misma expresión puede obtenerse a partir de la influencia del aumento de la longitud de un test sobre la varianza verdadera, la varianza empírica y la varianza de error.

En primer lugar veamos como se ve afectada la varianza de las puntuaciones empíricas de los sujetos, cuando se duplica la longitud del test. Supuesto los ítems paralelos, las varianzas de las dos mitades son iguales, es decir, 5~ =51, con lo que la varianza total del test puede expresarse como,

5~x · Puesto que, como ya hemos dicho, la varianza de una variable que es suma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas, tendremos:

Veamos ahora lo que sucede respecto a la varianza verdadera. La varianza de la distribución de las puntuaciones verdaderas, 5~, puede expresarse

2 2 2 como 52V = 5V + 5V + 2rV V 5V 5V a b ab a b

Las puntuaciones verdaderas en los dos tests paralelos son iguales y la correlación r vavb = 1, ya que es la correlación entre las puntuaciones verdaderas. Luego:

239

1 PSICOMETRÍA

4.31

240

Es decir, cuando se duplica la longitud de un test dado, la varianza de las puntuaciones verdaderas de los sujetos es igual a cuatro veces la varianza de las puntuaciones verdaderas de cada una de las mitades.

Por último, veamos lo que sucede respecto a la varianza de error. Por ser tests paralelos, partimos del supuesto de que las varianzas s~a = s~ b y que la correlación entre los errores reaeb =O. La varianza de error (52e) puede

expresarse en los siguientes términos: Sie = s;a + s;b + 2reaebsea seb = 2s;,

puesto que la covarianza se anularía al ser la correlación entre errores igual a cero.

Dado que el coeficiente de fiabilidad (rxx) es igual al cociente entre la varianza verdadera (5~ ) y la varianza empírica (5; ), tendremos que el coeficiente de fiabilidad, al duplicar la longitud del test viene expresado por:

R _ Siv = 45~ = 2rxx xx Six 25; (1 + rxx ) 1 + rxx

que es precisamente la expresión a la cual habíamos llegado anteriormente.

a=-n (1- :¿s; J n -1 52

X

Como ya hemos comentado, la varianza de una variable, suma de «n» variables, es definida como la suma de las varianzas, más la suma de las cavarianzas, con lo que la varianza total de las puntuaciones empíricas de los sujetos en un test la podemos expresar como:

es decir, suma de las varianzas de cada uno de los elementos más la de las covarianzas entre todos ellos.

Si los ítems son paralelos, se puede calcular la varianza media y la covarianza media de los items.

;t dado, la varianza de las a cuatro veces la varianza

las mitades.

varianza de error. Por ser

; varianzas s~a = s~b y que 1nza de error (52 e ) puede 2 52 + 2 S S - 252 ea + eb reaeb ea eb - et

·elación entre errores igual

Jal al cociente entre la va), tendremos que el coefi

viene expresado por:

bíamos llegado anterior-

variable, suma de «n » vaas, más la suma de las co

aciones empíricas de los

os elementos más la de las

varianza media y la cova-


Ls2 52 52 Is: . = n . , ya que . = --1 1 1 n

de donde:

n --

S~ = L Sf + n(n - 1)r¡k Sf

y despejando:

n

52-" 52 X L._¡ 1

r ----=-¡k- (n -1)LSf

En el caso de querer estimar la fiabilidad del test total aplicaremos la ecuación general de Spearman-Brown para el caso de un test de longitud «n».

donde «n» representa el número de ítems y, rjk representa la correlación promedio de las n(n-1) correlaciones entre los ítems. Si lo sustituimos por la expresión anterior:

n

52-" 52 X L._¡ 1

n . ----=;--:

(n-1)LS f r" = ----==---'-----5::-2 -- ---;"=-s----:-2 --

1 + (n - 1) x L._¡ 1

(n-1)LS f

despejando,

a=-n [5~ -Isf ]=-n (1_Isfl n -1 52 n -1 52

X X

241

1 PSICOMETRÍA

4.33

242

a = & 1 cuando n ----¿ 00

- (N-3)&+2 (N-3)& 2 N&-3& 2 a= N-1 = N-1 + N-1 = N-1 + N - 1 =

N& 3& 2 & 3& 2 = N-1- N-1 + N-1 = N-1- N -1 +N -1 =

N

& 3& 2 & 3& 2 = ---+--= ---+--(N / N)-(1 / N) N-1 N-1 1-(1 / n) N-1 N-1

Si n---¿oo entonces 1/N=O, 3a/N-1=0, 2/N-1=0; de donde podemos deducir que a= &

- Relación entre la ecuación de Rulan y la ecuación de Cuttman-Fianagan

52 . 52-52 . (xx = 1- p;1

= x 2

p-I 1 pueStO que la Varianza de Una Variable que eS SU-s x s x

ma de otras dos es igual a la suma de las varianzas de cada una de las variables más el doble de las covarianzas, tenemos:

Si desarrollamos ahora la ecuación de Guttman, tendremos:

( 52

+ S2

) (52

- S2

- S2

) rxx = 2 1- p s; 1 = 2 X S~

1

• Puesto que la varianza de una varia-

ble, suma de «n» variables, es definida como la suma de sus varianzas, más la suma de las covarianzas, podemos establecer que s; = S~ + 5;2 + 2rpiSp5; de donde

Como puede observarse, en ambos casos, llegamos a la misma expresión fina l.

): 2 -+---1 N -1

v -1 =O; de donde pode-

de Cuttman-Fianagan

de una variable que es su-

zas de cada una de las va-

tendremos:

e la varianza de una varia-

suma de sus varianzas, más que s; =S~ + 5,2 + 2rpiSpS;

mos a la misma expresión


-Relación entre «a» y «{3»

P=a Bajo este supuesto podemos establecer que: n = knj, donde:

n = número de subtests

2 ( ]2 n n n n 1 k-1 1-I(_j_J =1- I -.~ =1-k -2 =-

1=1 n 1=1 k n1 k k

Sustituyendo en P,

n n n

s2- :¿s2 s2- :¿s2 :¿s; X 1 k

X 1 k ~=

}=1 }=1 1-_E__ = = =a 2 k -1 k -1 52 k -1 52

S - X X

X k

243

1 PSICOMETRÍA

15. BIBLIOGRAFÍA COMPlEMENTARIA

MARTÍNEZ-ARIAS, R.; HERNÁNDEZ LLOREDA, Ma J.; HERNÁNDEZ LLOREDA, Ma V. (2006). Psicometría. Madrid: Alianza editorial.

MARTÍNEZ-ARIAS, R.(1995). Psicometría: Teoría de los Tests Psicológicos y Edu-cativos. Madrid: Editorial Síntesis.

MUÑIZ, J. (1998, 2002) . Teoría Clásica de los Tests. Madrid: Editorial Pirámide.

MUÑIZ, J. (1996). Psicometría . Madrid: Universitas.

SANTISTEBAN, C.(1990). Psicometría. Teoría y práctica en la construcción de tests. Madrid: Editorial Norma.

244

tema-4 (79).pdf

Documents