Programa Interinstitucional Doctorado en Educación CONFIABILIDAD

Documentos relacionados
Métodos de Previsión de la Demanda Pronóstico para Series Temporales Niveladas Representación Gráfica

PATRON = TENDENCIA, CICLO Y ESTACIONALIDAD

INCERTIDUMBRE EN LA CALIBRACIÓN DE VISCOSÍMETROS CAPILARES

Circuitos para observar la descarga y carga de un capacitor.

ANEXO Las instituciones calcularán mensualmente los puntos en riesgo utilizando el procedimiento que a continuación se detalla:

Determinación de las garantías para el contrato de futuros de soja en pesos. Value at Risk

PREVISIÓN DE LA DEMANDA

USO DE LAS TRANSFORMADAS DE LAPLACE Y Z EN EL ÁREA DE PROBABILIDAD

LECTURA 07: PRUEBA DE HIPÓTESIS (PARTE I) TEMA 15: PRUEBA DE HIPOTESIS: DEFINICIONES GENERALES

Métodos de Previsión de la Demanda Datos

C cos x sen x 0 x sen x x cos x x sen x cos x x C 1 x 0. Calculamos la matriz adjunta de C: sen x 0 cox 0 cos x sen x. sen x x 1 x 1 sen x

Modelo de regresión lineal simple

ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN

ASPECTOS METODOLÓGICOS DE INDICADORES DE VOLUMEN DE VENTAS, DE ARTÍCULOS ELABORADOS POR LA ACTIVIDAD MANUFACTURERA. Lima noviembre 2008

PROPIEDADES DE LOS ESTIMADORES MCO Profesor Rafael de Arce

Técnicas cualitativas para las Ecuaciones diferenciales de primer orden: Campos de pendientes y líneas de fase

1. Derivadas de funciones de una variable. Recta tangente.

ω ω ω y '' + 3 y ' y = 0 en la que al resolver se debe obtener la función y. dx = + d y y+ m = mg k dt d y dy dx dx = x y z d y dy u u x t t

Indicador de tiempo de respuesta a solicitudes de información y calidad de las mismas (ITRC)

INSTITUTO NACIONAL DE ESTADÍSTICA SISTEMA DE METADATOS HIDROCARBUROS. 1.0 Agregado Estadístico- Estadísticas e Indicadores de Hidrocarburos

RE01 DIFERENCIA DEL LOGRO PROMEDIO EN COMPRENSIÓN LECTORA Y MATEMÁTICAS PARA 6 DE PRIMARIA Y 3 DE SECUNDARIA ENTRE 2000 Y 2005

PRÁCTICA 5. Carga y descarga del condensador

SOLUCION NUMERICA DE ECUACIONES DIFERENCIALES ORDINARIAS.

UNA APROXIMACION A LA SOSTENIBILIDAD FISCAL EN REPUBLICA DOMINICANA Juan Temístocles Montás

Análisis Estadístico de Datos Climáticos

VALIDEZ. Programa Interinstitucional Doctorado en Educación. Carlos Ruiz Bolívar, PhD Profesor Titular UPEL / PIDE cruizbol@intercable.net.

Las señales pueden ser también, señales continuas o señales alternas.

TEMA 1 INTRODUCCIÓN A LA ELECTRÓNICA DIGITAL. 1. Sistemas analógicos y digitales.

Notas sobre Análisis de Series de Tiempo: Estacionariedad, Integración y Cointegración

Departamento de Ingeniería Hidráulica y M.A. de la U.P.V HIDROGRAMA UNITARIO

1 Física General I Paralelos 05 y 22. Profesor RodrigoVergara R 0102) Movimiento Rectilíneo Horizontal

Cobertura de una cartera de bonos con forwards en tiempo continuo

March 2, 2009 CAPÍTULO 3: DERIVADAS PARCIALES Y DIFERENCIACIÓN

Facultad de Ciencias del Mar. Curso 2007/08 11/07/08

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE.

ECONOMETRÍA EMPRESARIAL II ADE

Señales. Apéndice 3. A3.1 Representación de formas de ondas. Una señal es una función del tiempo. La gráfica de una señal se denomina forma de onda.

PRÁCTICA 2: Ejercicios del capítulo 4

1 Introducción Tiempo de vida Función de fiabilidad Vida media Tasa de fallo Relación entre conceptos...

V () t que es la diferencia de potencial entre la placa positiva y la negativa del

Y t = Y t Y t-1. Y t plantea problemas a la hora de efectuar comparaciones entre series de valores de distintas variables.

Método desarrollado en el año de 1889, pero por su sencillez todavía se sigue utilizando.

Luis H. Villalpando Venegas,

MECANISMOS DE TRANSMISIÓN

Aislante. Coulomb voltio

Experimento 3. Análisis del movimiento en una dimensión. Objetivos. Teoría

En esta práctica vamos a analizar el comportamiento del diodo obteniendo la curva característica tensión-intensidad.

PRÁCTICA 3: Sistemas de Orden Superior:

Tema 3. Circuitos capacitivos

CONSIDERACIONES RESPECTO AL INDICADOR DÉFICIT FISCAL/PIB Juan Carlos Requena I N T R O D U C C I O N

MACROECONOMIA II. Grado Economía

h + para cualquier m 1, 5.2. Modelo E-GARCH Introducción

5. MODELOS DE FLUJO EN REACTORES REALES

Cómo se debe contabilizar la deuda de pensiones en el sector público? 1/

Material sobre Diagramas de Fase

MMII_L3_C5: Problema de la cuerda finita: Métodos directo y de las imágenes. Guión:

Tema 2: El modelo de Solow y Swan: análisis teórico

TEMA 2 LOS MODELOS ECONOMETRICOS Y SU PROBLEMATICA

Metodología de cálculo del diferencial base

Análisis de inversiones y proyectos de inversión

Capítulo 5 Sistemas lineales de segundo orden

Unidad 1 Matrices PÁGINA 7 SOLUCIONES. 1. La resolución de los sistemas puede expresarse de la forma siguiente:

UNIDAD 6: CONGELACIÓN DE ALIMENTOS. GUIA DE PROBLEMAS RESUELTOS (Versión ALFA)

Medición del tiempo de alza y de estabilización.

PROPAGACIÓN DE INCERTIDUMBRE EN LA CONVERSIÓN DE ALGUNAS MAGNITUDES DE HUMEDAD

Estadística de Vivienda Libre

Nota Técnica Índice de Tipo de Cambio Efectivo Real Multilateral con ponderadores móviles

CORRELACIÓN LINEAL Y ANÁLISIS DE REGRESIÓN

Prácticas de Tecnología de Fluidos y Calor (Departamento de Física Aplicada I - E.U.P. Universidad de Sevilla)

6 METODOLOGÍA PROPUESTA PARA VALORAR USOS IN SITU DEL AGUA

Ejercicios Selectividad Matemáticas Apl. CCSS II. Operaciones con matrices. Matrices inversas. Ecuaciones matriciales. Rango de una matriz.

Solvencia II. Los Conceptos Básicos. Por: P. Aguilar. Febrero de 2008

Series de Fourier. Roberto S. Costas Santos. October 10, Durante este capítulo analizaremos el comportamiento de la serie 1

CONTRASTES DE SIGNIFICATIVIDAD INDIVIDUAL DE LOS PARÁMETROS

Ecuaciones diferenciales, conceptos básicos y aplicaciones

APLICACIONES DEL PROCESO DE POISSON EN CONFIABILIDAD

TEMA 1: SISTEMAS DE ECUACIONES LINEALES. MÉTODO DE GAUSS.

CAPÍTULO 3: INFILTRACIÓN

Las derivadas de los instrumentos de renta fija

13.0 COSTOS Y VALORACIÓN ECONÓMICA

GUIA TEORICA N 2 DESCRIPCIÓN DEL MOVIMIENTO. Apoyo el sistema copernicano y entre sus obras destacan Sidereus Nuntius,

DERIVACIÓN BAJO EL SIGNO INTEGRAL. 1. Hallar el punto del intervalo [0,2] en el que la función =

Estimación de modelos de volatilidad estocástica asimétrica. Aplicación en series de rendimientos de índices bursátiles.

NORMA DE CARACTER GENERAL N

Tema 3. El modelo neoclásico de crecimiento: el modelo de Solow-Swan

UNIDAD IX. Técnicas de Suavización

APROXIMACIÓN A LA EXTENSIÓN MULTIDIMENSIONAL DE LA METODOLOGÍA TIR

Observatorio * EL AUMENTO DEL IVA EN ESPAÑA: UNA CUANTIFICACIÓN ANTICIPADA DE SUS EFECTOS **

SOLUCIONARIO GUÍA ESTÁNDAR ANUAL Energía I: trabajo y potencia mecánica

DPTO. DE ÁREA DE FÍSICA

PROBLEMAS DE CINÉTICA QUÍMICA RESUELTOS.

ANÁLISIS MULTIVARIADO DE LAS VENTAS DE UNA EMPRESA DE ALIMENTOS MARZO 1994-SEPTIEMBRE 2006

Práctica 20. CARGA Y DESCARGA DE UN CONDENSADOR ELÉCTRICO

Solución: En ambos casos se observa que los determinantes de las matrices de coeficientes son distintos de cero. Veamos: a)

FÍSICA - LAB. 2. x = x ( t ) v = v ( t ) a = a ( t )

MATEMÁTICAS I. TEMA 1: ECUACIONES Y SISTEMAS DE ECUACIONES

Capítulo 5. Búsqueda de empleo desde el empleo y satisfacción laboral

CAPÍTULO II. Conceptos de Confiabilidad

PRÁCTICA 4 TEMA 6: SERIES TEMPORALES

MATADEROS DE GANADO DOCUMENTO METODOLÓGICO INSTITUTO NACIONAL DE ESTADÍSTICAS

Transcripción:

Programa Inerinsiucional Docorado en Educación CONFIABILIDAD Carlos Ruiz Bolívar, PhD Profesor Tiular UPEL / PIDE cruizbol@inercable.ne.ve Al evaluar la uilidad de una prueba o es, a menudo hay dos pregunas que es necesario formularse, las cuales aunque son diferenes, de alguna manera esán relacionadas. La primera preguna es: con cuána exaciud la muesra de íemes o areas represena al universo de donde fueron seleccionados? La segunda preguna es con qué fidelidad corresponde ese universo al aribuo laene que se va a medir? La primera preguna se relaciona con lo que comúnmene se denomina confiabilidad de la medida; mienras que la segunda se refiere a su validez. En ese arículo nos referiremos, paricularmene, a la primera de esas dos caracerísicas de las pruebas y escalas, por ser ésos los insrumenos que planean mayores exigencias écnicas en su proceso de desarrollo. Esa caracerísica es fundamenal cuando se raa de medir rasgos o aribuos psicológicos. De allí que deban ser cuidadosamene esablecidas en las llamadas pruebas formales, como pare de lo que hemos denominado el esudio écnico del insrumeno. Confiabilidad Una de las caracerísicas écnicas que deerminan la uilidad de los resulados de un insrumeno de medición es su grado de reproducibilidad. Esa se refiere al hecho de que los resulados obenidos con el insrumeno en una deerminada ocasión, bajo cieras condiciones, deberían similares si volviéramos a medir el mismo rasgo en condiciones idénicas. Ese aspeco de la exaciud con que un insrumeno mide lo que se preende medir es lo que se denomina la confiabilidad de la medida. En ese senido, el érmino confiabilidad es equivalene a los de esabilidad y predicibilidad. Esa es la acepción que más comúnmene se le da a ese érmino. No obsane, ora manera de aproximarse al concepo de confiabilidad es pregunarse: Hasa dónde los resulados obenidos con un insrumeno de medición 1

consiuyen la medida verdadera de la propiedad que se preende medir? Esa acepción del érmino confiabilidad es sinónimo de seguridad. Todavía exise una ercera posibilidad de cómo podemos enfocar la confiabilidad de un insrumeno de medición; ella responde a la siguiene cuesión: cuáno error esá implício en la medición de un insrumeno? e eniende que un insrumeno es menos confiable en la medida que hay un mayor margen de error implício en la medición. De acuerdo con eso, la confiabilidad puede ser definida como la ausencia relaiva de error de medición en el insrumeno; es decir, en ese conexo, el érmino confiabilidad es sinónimo de precisión. Finalmene, la confiabilidad puede ser enfocada como el grado de homogeneidad de los íemes del insrumeno en relación con la caracerísica que preende medir. Es lo que se denomina la confiabilidad de consisencia inerna u homogeneidad. El Modelo Clásico de Confiabilidad De acuerdo con la eoría clásica, oda medición que se hace de un objeo físico o psicológico lleva implício un error; es decir, se considera que oda punuación que se obiene en una prueba esá formada por dos componenes adiivos, que son la punuación verdadera y el error aleaorio. La punuación verdadera se define como el valor promedio de un número grande de adminisración de una prueba a la misma persona (Thorndike, 1989; Kerlinger, 00). Es decir, la punuación verdadera puede ser considerada como la punuación obenida por un individuo si odas las condiciones, ano inernas como exernas, esuvieran conroladas y el insrumeno de medición fuera perfeco. Pero, esa condición es sólo hipoéica, ya que como sabemos en oda medición hay un error de medición implício. La definición anerior iene un valor meramene eórico, ya que en la prácica nunca se puede conocer direcamene el componene de medición verdadera de la caracerísica de un objeo. El error, por su pare, se refiere al aumeno o disminución de la medición, como resulado de diferenes facores que deerminan el error de medición; ésos dependen, algunas veces, de una validación inadecuada del insrumeno de medida y oras, de las condiciones exernas bajo las cuales se realiza la medición. Esa relación puede ser expresada en los érminos siguienes: X = X v X e X = punaje oal; X v = punaje verdadero; y X e = punaje de error. Esa ecuación permie esimar el componene de punuación verdadera en una medición, el cual esaría deerminado por la diferencia enre el punaje oal obenido y la punuación de error; o sea, X = X + X v e En érmino de varianza, los planeamienos aneriores pueden ser expresados como sigue: la varianza oal (V ) de una disribución de mediciones se descompone en una Error! yle no defined.

varianza verdadera (V v ) y una varianza de error (Ve), lo cual nos llevaría a la fórmula siguiene: V = V + V v En consecuencia, V = V V v e e En resumen, la confiabilidad enfocada desde el puno de visa de la eoría del error de medición, nos llevaría a esablecer una relación inversa con respeco a la confiabilidad, en los érminos siguienes: a mayor error implício en la medición, menor confiabilidad; mienras que a menor error, mayor confiabilidad. En érminos prácicos, eso significa que si podemos esimar la varianza de error de una medida, ambién podemos esimar su confiabilidad. Todo lo cual nos lleva a una reconcepualización de la confiabilidad en el senido siguiene: 1. La confiabilidad puede ser visa como la proporción de la varianza verdadera con respeco a la varianza oal obenida en la adminisración de un insrumeno de medición, o sea: V r = V v. La confiabilidad puede ser enendida como la diferencia enre 1.00 y la proporción del error de la varianza con respeco a la varianza oal obenida en la adminisración de un insrumeno de medición, o sea: V e r = 1 V Como el lecor especializado debe recordar, el modelo de análisis de varianza (ANAVA) de una via permie descomponer la varianza oal de la variable dependiene en dos ipos de varianzas: la varianza enre grupos (varianza experimenal o verdadera) y la varianza de error. En consecuencia, ese modelo de ANAVA podría ser uilizado para esimar: V, Vv y Ve, y de esa manera calcular el coeficiene de confiabilidad de un insrumeno de medición (ver Hoy, 1941 y Kerlinger, 1988). Ora manera de esimar la confiabilidad, a parir de la varianza de error, es esimando direcamene el error esándar de medición, como sigue: E EM = y 1 r E EM = error esándar de medición; y = desviación esándar de la disribución de punajes oales de la prueba; y r = coeficiene de confiabilidad. Procedimienos para Esimar la Confiabilidad Exisen varias maneras para esimar la confiabilidad de una medida. En esa sección desarrollaremos res de las más conocidas: (a) confiabilidad de reaplicación de pruebas Error! yle no defined. 3

(es-rees); (b) confiabilidad de versiones equivalenes (pruebas paralelas); y (c) confiabilidad de consisencia inerna (homogeneidad). La confiabilidad de reaplicación de pruebas. Esa consise en adminisrar dos veces una misma prueba a un mismo grupo de sujeos en un inervalo relaivamene coro de iempo (no más de res meses enre una y ora medición). Esas dos disribuciones de punajes se correlacionan y el coeficiene obenido represena una esimación de la confiabilidad del insrumeno (ver Anasasi, 1976). En el caso anerior, el error de la varianza corresponde a las flucuaciones aleaorias en las punuaciones obenidas enre la primera y la segunda aplicación de la prueba. Esas variaciones resulan, en pare, de cieras condiciones no conroladas durane la adminisración de la prueba, como, por ejemplo, ruidos, cambios de emperaura o cualquier oro disracor. También, esas variaciones pueden ser debidas a cambios ocurridos en los propios sujeos, ales como: enfermedades, faiga, siuación emocional, preocupación, esrés, ec). La confiabilidad de reaplicación de pruebas muesra hasa donde los punajes obenidos en un insrumeno pueden ser generalizados a ravés del iempo. En la medida que la confiabilidad es mayor, menos suscepibles son los punajes de ser modificados por las condiciones aleaorias asociadas con la siuación de medición o con los cambios de los propios sujeos. El coeficiene de confiabilidad obenido es una medida de la esabilidad de la prueba. A coninuación se presena un ejemplo acerca del cálculo de ese ipo de coeficiene de confiabilidad (ver Cuadro 1). Cuadro 1 Esimación del coeficiene de confiabilidad de una prueba por el méodo de reaplicación (es-rees) ujeos 1ª Aplicación ª Aplicación X X Y Y XY 1 35 15 36 196 160 40 1600 38 1444 150 3 0 400 19 361 380 4 30 900 30 900 900 5 33 1089 31 961 103 6 4 576 484 58 7 18 34 0 400 360 8 5 65 5 65 65 9 484 4 576 58 10 17 89 17 89 89 64 751 6 7336 7413 En el Cuadro 1, se presena la simulación de dos aplicaciones de un insrumeno a una muesra de 10 sujeos, con inervalo de dos semanas enre la primera y la segunda aplicación. Las Punuaciones correspondienes a la primera aplicación aparecen debajo de la columna idenificada con la lera X; mienras que las calificaciones de la segunda aplicación aparecen debajo de la columna Y. Para los fines de los cómpuos necesarios para calcular el coeficiene de confiabilidad se calcularon los valores de X, Y y XY. Luego se aplicó la Error! yle no defined. 4

fórmula para obener el coeficiene de correlación por el méodo de los punajes direcos, el cual se expresa en la fórmula siguiene: r = r = N XY X Y [ N X ( X ) ] N Y ( Y ) [ ] r, es el coeficiene de correlación enre las dos adminisraciones de la prueba. N = número de sujeos XY = resulado de sumar el produco de cada valor de X por su correspondiene valor en Y. X = suma oal de los valores de X (primera aplicación). Y = suma oal de los valores de Y (segunda aplicación). X = resulado de sumar los valores de X elevados al cuadrado. Y = resulado de sumar los valores de Y elevados al cuadrado. X Y ( ) = ( ) = suma oal de los valores de X, elevada al cuadrado. suma oal de los valores de Y, elevada al cuadrado. usiuyendo los valores correspondienes en la fórmula, enemos: 10(7413) (64)(6) [ 10(751) (64) ] [ 10(7336) (6) ] = 496 5057,6 = 0,98 Como se puede observar la r = 0,98. Ese resulado indica que exise una correlación muy ala enre las punuaciones de la primera y la segunda medición, lo cual equivale a decir que el insrumeno analizado es alamene confiable, en cuano a la esabilidad de las punuaciones a ravés del iempo. La confiabilidad de versiones equivalenes. Esa se uiliza en el caso dos o más pruebas que miden el mismo consruco. Para ello, se preparan dos versiones de la misma prueba y se adminisran a la misma muesra de sujeos; luego esas dos disribuciones de punajes son correlacionadas, para esimar el coeficiene de confiabilidad. Dicho coeficiene combina dos ipos de confiabilidad: esabilidad emporal y consisencia de las repuesas a las diferenes muesras de íemes (ver Helmsader, 1964). En relación con la confiabilidad de versiones equivalenes es crucial considerar el concepo de muesreo de conenido; en el senido de que es necesario esar seguro que las dos pruebas son realmene equivalenes; es decir, esán inegradas por muesras de íemes que son represenaivas del dominio de conenido bajo medición. Al respeco, es conveniene ambién que ambas pruebas sean presenadas de la misma manera, cubrir la misma canidad de conenido, ener el mismo número de íemes y ser equivalenes en cuano al nivel de dificulad de los íemes. Así mismo, se espera que las pruebas sean similares en cuano a las insrucciones, límie de iempo, ejemplos ilusraivos y formao de presenación. Error! yle no defined. 5

El procedimieno para calcular ese coeficiene de confiabilidad es similar al uilizado en el caso de la confiabilidad por reaplicación. La única diferencia consise en que, en el primer caso, usamos la misma prueba en dos ocasiones diferenes para generar las punuaciones; mienras que en el segundo, usamos dos formas de la misma prueba para obener las calificaciones. La confiabilidad de consisencia inerna. Ese ipo de confiabilidad permie deerminar el grado en que los íemes de una prueba esán correlacionados enre si. i los diferenes reacivos de un insrumeno ienen una correlación posiiva y, como mínimo, moderada, dicho insrumeno será homogéneo. En consecuencia, se puede definir la homogeneidad como la consisencia en la ejecución en odos los reacivos de la prueba (Loevinger, 1947; Anasasi, 1961). De allí que en una prueba con un alo grado de consisencia inerna, el saber como se desempeña una persona en un iem, nos permie predecir como lo hará en los demás. Es imporane hacer noar que en el caso de la confiabilidad de consisencia inerna, el énfasis se pone en las punuaciones de los sujeos y no en el conenido o el formao de los reacivos. Por lo ano, si los íemes del insrumeno correlacionan posiivamene enre sí, ése será homogéneo, independienemene del ipo de conenido que se haya uilizado. Por el conrario, la prueba será heerogénea si los reacivos no ienen una correlación posiiva enre sí, aun cuando aparenemene esén midiendo el mismo rasgo. Como se puede comprender, la disinción enre lo homogéneo y lo heerogéneo no es una dicoomía, sino un coninuo. Por ora pare, la homogeneidad esá relacionada con la caracerísica de unidimensionalidad de una prueba, la cual indica que el insrumeno mide una sola variable (un rasgo) en lugar de una combinación de ellas. i una prueba es homogénea, podemos suponer que odos los íemes miden una caracerísica común. in embargo, es concebible que cada reacivo pueda medir una misma combinación de rasgos y, de esa manera, pudieran esar recíprocamene inercorrelacionados. A la inversa, si una prueba no es homogénea, los reacivos o algunos subgrupos de ellos medirán caracerísicas diferenes. Por consiguiene, la homogeneidad es una caracerísica necesaria, pero no suficiene, de una prueba desinada a medir un rasgo uniario (Brown, 1980). En las pruebas mulidimensionales; es decir, aquellas que miden diferenes aspecos o dimensiones de un consruco, esán formadas por subpruebas; por ejemplo, la Prueba de Apiud Académica (CNU-OPU) esá conformada por dos subpruebas que miden Razonamieno verbal y Habilidad numérica. Ese ipo de insrumenos iende a presenar coeficienes de confiabilidad de consisencia inerna de magniud moderada, indicando que no son oalmene homogéneas, sin embargo, sus respecivas subpruebas si lo son. Exisen diferenes procedimienos para esimar la confiabilidad de consisencia inerna. Algunos de los más conocidos son los siguienes: (a) Kuder-Richardson; (b) Alpha de Cronbach; (c) Dos miades, corregido por la fórmula de pearman-brown; y (d) méodo de Hoy. Kuder y Richardson (1937) desarrollaron varios modelos para esimar la confiabilidad de consisencia inerna de una prueba, siendo uno de los más conocidos la denominada fórmula 0, el cual se represena de la siguiene manera: Error! yle no defined. 6

n V pq r = * n 1 V r =coeficiene de confiabilidad. N =número de íemes que coniene el insrumeno. V = varianza oal de la prueba. pq = sumaoria de la varianza individual de los íemes. Para calcular la confiabilidad por el méodo K-R 0, se procede así: en primer lugar, para cada íem se compua p, que es la proporción de sujeos que pasaron un íem sobre el oal de sujeos; luego, se compua q, que es igual a 1 - p; se muliplica pq; y finalmene se suman odos los valores de pq. El resulado obenido es la sumaoria de la varianza individual de los íemes, o sea, pq; en segundo lugar, se calcula la varianza oal de la disribución de calificaciones (V ); y, en ercer lugar, se aplica la fórmula correspondiene. El modelo de Kuder-Richardson es aplicable en las pruebas de íemes dicoómicos en los cuales exisen respuesas correcas e incorrecas. A coninuación se presena un ejemplo numérico, con el propósio de ilusrar cómo se calcula el coeficiene de confiabilidad por el méodo K-R 0, en una prueba de rendimieno académico. upongamos que hemos adminisrado una prueba de cinco íemes en una muesra de nueve esudianes, cuyos resulados se presenan en el Cuadro. Cuadro. Mariz de Iem por ujeo de los Resulados de una Prueba de Rendimieno Académico ujeos Íemes 1 3 4 5 Toal 1!!!!! 5!!!!! 5 3 "!!!! 4 4! "!!! 4 5 "!!!! 4 6!!!! " 4 7!!! " " 3 8 " "!!! 3 9 "!! " " p 0,55 0,77 1,0 0,77 0,66 q (1-p) 0,45 0,3 0,0 0,3 0,34 V =.94 pq 0,5 0,18 0,0 0,18 0, pq =.83 usiuyendo los valores correspondienes en la fórmula, enemos: r 5. 94. 83 = ( K R 0 ) = * = 1, 5*. 117= 0, 146 5 1. 94 Error! yle no defined. 7

De acuerdo con el resulado anerior, se concluye que el insrumeno en esudio iene una confiabilidad de consisencia inerna muy baja. Al respeco, es imporane señalar que ese ipo de resulados es esperable en los casos cuando se uilizan pruebas coras (n < 10 íemes), ya que, como se ha indicado aneriormene, la confiabilidad de una medida es una función direca de su exensión (número de íemes) de la prueba. En los casos de la medición de consrucos a ravés de escalas, en los que no exisen respuesas correcas ni incorrecas, sino que cada sujeo marca el valor de la escala que mejor represena su respuesa, Cronbach (1951) derivó, a parir del modelo de Kuder- Richardson (1937), una variane que permie esimar la confiabilidad de consisencia inerna en esos casos. La fórmula es como sigue: r n = * n 1 r = coeficiene de confiabilidad; n = número de íemes; = varianza oal de la prueba; y es la suma de las varianzas individuales de los íemes. Observe que las dos fórmulas son básicamene iguales. Lo único que varía es la forma de represenar la varianza individual de los íemes en cada caso. A coninuación se presena un ejemplo numérico para ilusrar el procedimieno de cálculo del coeficiene de confiabilidad obenido por el méodo Alpha de Cronbach (1951). upongamos que hemos adminisrado una escala de aciud hacia la maemáica, de 6 íemes, a una muesra de n = 8 esudianes de noveno grado. La escala consaba de cinco posiciones en las cuales el valor 5 indicaba la aciud máxima favorable; mienras que el valor 1 denoaba la aciud máxima desfavorable. Los resulados se presenan en el Cuadro 3. Error! yle no defined. 8

Cuadro 3. Mariz de íem por sujeo sobre los resulados de una escala de aciud hacia la maemáica en esudianes de noveno grado Íemes ujeo 1 3 4 5 6 Toal T-Par T-Impar 1 5 4 3 1 1 16 7 9 4 1 3 3 1 14 6 8 3 5 5 5 5 5 5 30 15 15 4 4 4 3 1 1 15 8 7 5 5 4 3 1 17 7 10 6 5 3 3 4 19 7 1 7 4 5 3 3 19 11 8 8 5 5 5 5 4 15 9 Toal 37 9 7 19 0 154 V i 0,7,6 1,07 1,41,6,85 V i = 10,1 V par = 13,71 V impar = 6,78 = 8,5 usiuyendo los valores correspondienes en la fórmula, enemos: r 6 8, 5 10, 1 = * = 1, * 0, 6449= 0, 77 6 1 8, 5 De acuerdo con el resulado anerior, se concluye que la escala de aciud hacia la maemáica iene una confiabilidad de consisencia inerna ala, aunque no lo suficienemene ala como para ser considerada acepable en el caso de las escalas de aciud, cuyo coeficiene de homogeneidad siempre se espera que caiga en la caegoría de muy alo (enre 0,81 y 1.0). La esimación de la confiabilidad a ravés del méodo de dos miades, consise en: (a) dividir los íemes de la prueba en dos pare iguales; (b) correlacionar las punuaciones oales de las dos miades; (c) muliplicar el coeficiene obenido por y dividir por el érmino 1 (uno) más la correlación de las dos miades, como se expresa en la fórmula que aparece más abajo. rhh r = 1 + rhh r = coeficiene de confiabilidad r hh = correlación enre las dos miades A coninuación se presena un ejemplo numérico con el propósio de ilusrar el procedimieno de cálculo del coeficiene de confiabilidad de consisencia inerna por el méodo de dos miades, corregido por la fórmula de pearman-brown. Error! yle no defined. 9

En el ejemplo anerior, presenado en el Cuadro 3, la correlación de las dos miades de la prueba fue de 0,7. usiuyendo los valores correspondienes en la fórmula enemos: r ( 0, 7) 1. 44 = = = 0, 77 1+ 0, 7 17, El coeficiene de confiabilidad obenido es de r = 0,77, el cual puede ser considerado como alo. i se compara ese valor con el obenido por el méodo Alpha de Cronbach (r = 0,7), podemos observar que el méodo de dos miades iende a inflar ligeramene el coeficiene de confiabilidad. Un modelo alernaivo para calcular la confiabilidad por el méodo de las dos miades fue desarrollado por Rulón (1939). En ese caso sólo se requiere: (a) calcular la diferencia de varianza de las dos miades para cada sujeo; (b) dividir por la varianza de los punajes oales; y (c) resar esa proporción de la unidad (1,00). La fórmula es: d r = 1 r, es el coeficiene de confiabilidad. d, es la varianza diferencial enre las dos miades del es; y, es la varianza oal de la prueba. De acuerdo con los daos reporados en el ejemplo presenado en el Cuadro, se iene que: d = V par - V impar usiuyendo los valores correspondienes enemos: d = 13,71-6,78 = 6,93 = 8,5 Aplicando la fórmula de Rulón endríamos: r 6, 93 = 1 = 1 0, 4 = 0, 76 8, 5 El coeficiene de confiabilidad de consisencia inerna fue de r = 0,76, el cual puede ser considerado como alo. Observe que el valor obenido a ravés del méodo de Rulón se aproxima basane a la magniud del coeficiene obenido mediane el méodo Alpha de Cronbach. Ora manera de calcular la confiabilidad de consisencia inerna es a ravés del méodo de Hoy (1941). Ese consise en aplicar el méodo del Análisis de Varianza para esimar la confiabilidad de consisencia inerna. Para al fin, se procede así: (a) se elabora una mariz de íem por sujeo; (b) se calcula la varianza oal de la disribución de punajes oales; (c) se compuan los diferenes componenes de la varianza oal: varianza debida a los sujeos (Vs), varianza debida a los íemes (Vi) y varianza residual o de error (Ve); (d) se divide Error! yle no defined. 10

Vs/Ve para obener la Fs; y Vi/Ve para obener la Fi; (e) se deermina la significación esadísica de cada F. La fórmula de Hoy es la siguiene: r = 1 e s e = varianza de error; y s = varianza debida a los sujeos. A coninuación uilizaremos un ejemplo numérico para ilusrar cómo se calcula el coeficiene de confiabilidad por el méodo de Hoy. Para al fin, uilizaremos los daos del Cuadro 3. Los daos del resumen del análisis de varianza se presenan en el Cuadro 4. Cuadro 4 Resumen de ANAVA Fuene de variación C gl MC F p Iemes 8,9 5 5,78 5,35 < 0,01 ujeos 33,5 7 4,75 4,40 < 0,01 Residuo 37,75 35 1,08 Toal 99,9 47 Aplicando la fórmula de Hoy enemos: r 1, 08 = 1 = 0, 77 4, 75 De acuerdo con el resulado anerior, se concluye que el insrumeno en esudio iene un coeficiene de confiabilidad alo. En resumen, se podría decir que la escala de aciud hacia la maemáica iene una confiabilidad de consisencia inerna promedio de r = 0,76 (ver Cuadro 5). Cuadro 5 Coeficienes promedio y parciales de confiabilidad de consisencia inerna esimada por varios méodos Méodo r Alpha de Cronbach 0,7 pearman-brown 0,77 Rulón 0,76 Hoy 0,77 Es imporane señalar que los diferenes méodos empleados para esimar la confiabilidad de consisencia inerna dan resulados parecidos. En consecuencia, cuando se Error! yle no defined. 11

desarrolla una prueba no es necesario uilizar odos esos méodos, sino que es suficiene con uilizar sólo uno de ellos. Inerpreación del Coeficiene de Confiabilidad Como ya se ha mencionado aneriormene, la confiabilidad de un insrumeno se expresa mediane un coeficiene de correlación: r, que eóricamene significa correlación del es consigo mismo. us valores oscilan enre cero (0) y uno (1.00). Una manera prácica de inerprear la magniud de un coeficiene de confiabilidad puede ser guiada por la escala siguiene: Rangos Magniud 0,81 a 1,00 Muy Ala 0,61 a 0,80 Ala 0,41 a 0,60 Modearada 0,1 a 0,40 Baja 0,01 a 0,0 Muy Baja Por lo general, un coeficiene de confiabilidad se considera acepable cuando esá por lo menos en el límie superior (0,80) de la caegoría Ala. No obsane, no exise una regla fija para odos los casos. Todo va a depender del ipo de insrumeno bajo esudio, de su propósio y del ipo de confiabilidad de que se rae. Por ejemplo, un coeficiene de confiabilidad de consisencia inerna para una escala de aciud, nunca debería esar por debajo del límie inferior de la caegoría muy alo, o sea, el valor de r = 0,81 para ser considerado como acepable. in embargo, en el caso de una prueba de rendimieno académico, la lieraura repora coeficienes que varían enre 0,61 y 0,80 (ver Thorndike, 1989; Magnusson, 1983). En el caso de insrumenos con coeficienes de confiabilidad moderados, una manera de saber hasa dónde los mismos pueden ser acepables, consise en comparar la desviación esándar de la disribución de punajes ( y ) con el error esándar de medición (E EM ), cuya fórmula se indica más abajo. E = 1 EM y r E EM = error esándar de medición. y = desviación esándar de la disribución de punajes oales. r = coeficiene de confiabilidad. En esos casos se recurre al crierio del error esándar de medición para decidir sobre la acepabilidad de un coeficiene de confiabilidad moderado, se requiere que se cumpla la condición de que y > E EM. Veamos un ejemplo; supongamos que la confiabilidad de un insrumeno fue de 0,58 y enemos duda acerca de su acepación. Asumamos, además que y =,5. i aplicamos la fórmula para esimar el valor del E EM, enemos: E EM = 1, 5 1-0, 58 = 0, 97 Como se puede observar, en el caso anerior el E EM (0,97) no excede el valor de la y (1,5); es decir, que se cumple la condición de acepabilidad señalada aneriormene Error! yle no defined. 1

( y > E EM ). En consecuencia, el insrumeno a pesar de su nivel de confiabilidad podría ser uilizado, pero con reservas. En al senido, el invesigador (o evaluador) endría que ser muy caueloso en la inerpreación de sus resulados. Mejoramieno de la Confiabilidad de una Prueba La confiabilidad de un insrumeno esá en relación direca con su exensión. Eso se explica porque en la medida que la prueba esá formada por pocos íemes (n < 10) el error de medición aumena y, en consecuencia, la confiabilidad iende a bajar. Es decir, cuando la prueba coniene una muesra grande de íemes (n > 30) que son represenaivos del dominio que se preende medir, aumena la probabilidad de acercarnos a la varianza verdadera del insrumeno y, de esa manera, se incremena la confiabilidad. Además, la confiabilidad de una prueba puede ser mejorada, siguiendo el principio del maxmicon sugerido por Kerlinger (00), el cual consise en: maximizar la varianza debida a las diferencias individuales y minimizar la varianza de error. En resumen, el procedimieno recomendado por Kerlinger es el siguiene: Primero, escribir los íemes de manera clara, sin ambigüedad. Un íem ambiguo puede ser inerpreado de muchas maneras, lo cual conribuye a aumenar el error de la varianza y, por lo ano, disminuye la confiabilidad de la prueba. egundo, escribir claramene las insrucciones, conribuye a reducir el error de medición. Las insrucciones ambiguas y o poco claras conribuyen a aumenar el error de la varianza. Tercero, usar condiciones esándares y bien conroladas para adminisrar la prueba. Los facores inernos (referidos al sujeo que oma la prueba) como los exernos (asociados a las condiciones bajos las cuales se oma la prueba, conribuyen a aumenar el error de medición. Imporancia de la Confiabilidad Para que los resulados de un insrumeno puedan ser inerpreables; es decir, para que engan significado y valor heurísicos, es necesario que los mismos sean confiables. No es posible deerminar la relación enre dos o más variables si los insrumenos uilizados para medirlas son poco confiables. Ese ipo de insrumenos, a menudo, inducen al invesigador a inerpreaciones erradas de sus resulados. Por ejemplo, un experimeno educaivo, en el cual se ha evaluado el efeco de una nueva esraegia insruccional, pudiera parecer poco efecivo, aun habiendo enido un impaco alamene significaivo en el aprendizaje de los alumnos, simplemene porque los insrumenos uilizados para medir las variables dependienes eran poco confiables. La confiabilidad, aun cuando no es la caracerísica más imporane de un insrumeno de medición, requiere se le prese oda la aención que sea necesaria. Cieramene, una ala confiabilidad, por si sola, no garaniza buenos resulados cieníficos. Pero, no puede haber buenos resulados cieníficos sin insrumenos confiables. En sínesis, la confiabilidad es una condición necesaria, pero no suficiene para obener resulados de invesigación que sean cieníficamene valiosos y socialmene úiles. Error! yle no defined. 13

Referencias Anasasi, A. (1976). Psychological esing. New York: MacMillan Publishing Co. Anasasi, A. (1961). Psychological es: Uses and abuses. Teacher College Record, 6, 389-393. Brown, F. G. (1980). Principios de la medición en psicología y educación. México: El Manual Moderno. Cronbach, L. J. (1951). Coefficien alpha and he inernal srucure of he es. Psychomerika, 16, 97-334. Helmsader, G. C. (1964). Principles of psychological measuremen. New York: Appleon. Hoy, C. (1941). Tes reliabiliy obained by analysis of variance. Psychomerika, 6, 153-160. Kerlinger, F. N. (00). Invesigación del comporamieno. (da. ed). México: MacGraw- Hill Kuder, G. F., y Richardson, M. W. (1937). The heory of esimaion of es raliabiliy. Psychomerika,, 151-160. Loevinger, J. A. (1947). A sysemaic approach o he consrucion and evaluaion of es of abiliy. Psychological Monographs, 61(4). Magnusson, D. (198). Teoría de los ess. México: Trillas. Rulon, P. J. (1939). A simplified procedure for deerminig he reliabiliy of a es by splihalves. Harvard Educaional Review, 9, 99-103. Thorndike, R. L. (1989). Psicomería aplicada. México: Limusa. Error! yle no defined. 14