Escalas de Medición en Estadística Ing. Byron Humberto González Ramírez Director Centro de Telemática Facultad de Agronomía Universidad de San Carlos de Guatemala Enero del 2004 byrong@softhome.net http://www.byrong.tk 1 Ubicación Temática La Estadística es una disciplina que proporciona principios y herramientas para emitir juicios sobre colectivos basados en datos obtenidos para propósitos específicos. Es decir, brinda el soporte para saber qué datos obtener, cómo, cuándo, dónde obtenerlos, y una vez obtenidos proporciona métodos y procedimientos para organizarlos con diferentes propósitos. La correspondencia entre los análisis aplicados y datos recabados permite construir juicios concluyentes sobre el colectivo en estudio. Los datos que precisamos deben ser generados de alguna forma, la cual siempre está asociada a la definición de variables, que constituyen los conceptos de referencia más importantes en los inicios de una investigación. Variable: Es la característica de la muestra o población que se está estudiando. Los datos son el producto de su medición sobre los elementos o sujetos de estudio. Por ejemplo en un estudio sobre la cantidad mensual devengada por los trabajadores de una empresa, la variable es ingreso y está medida en quetzales (Q)
Una vez definida la variable y obtenidos los datos, los análisis que se apliquen son afectados por la manera en que las variables fijadas se clasifiquen. Dicha clasificación obedece a las escalas de medición propuestas por el Psicólogo Steven en 1946, casi universalmente aceptadas. Los datos están siempre referidos a una de estas escalas. 2 Objetivos de Aprendizaje El presente escrito aporta elementos para que usted pueda: a. Diferenciar cada uno de las cuatro escalas de medición usadas para clasificar variables b. Asociar metodologías y procedimientos estadísticos de análisis en función de la escala de medición definida para una variable dada c. Dada una variable, definir la escala en qué está medida 3 Contenidos Temáticos I. Características de las escalas de medición II. Pruebas estadísticas asociadas a cada una de las escalas de medición 4 Características de la Escalas de Medición De acuerdo a la clasificación de Stevens, las variables pueden clasificarse en: a. Nominales b. Ordinales c. De Intervalo d. De razón
4.1 Nominales Una variable está medida en escala nominal cuando se utilizan nombres para establecer categorías. Para distinguir los agrupamientos se emplean símbolos, letras e incluso números, aunque estos últimos solo cumplen una función de carácter simbólico y no numérico. Los cálculos matemáticos con estos números no tendrían sentido. Como ejemplo, el estado de una persona para determinada enfermedad se puede clasificar como sano o enfermo, o bien como 1 o 2. Adicionalmente debemos mencionar que ninguna de las categorías definidas tiene mayor jerarquía que las otras. Ellas únicamente reflejan diferencias en la variable. 4.2 Ordinales Presidente Vice-presidente Director General Gerente Jefe Empleado
En este nivel también se definen varias categorías, pero además de mostrar un ordenamiento existe una relación de mayor o menor que entre ellas. Las etiquetas, símbolos o números asignados si indican jerarquía, aunque no es posible conocer la magnitud de la diferencia entre cada una de las categorías. En el gráfico, el presidente (10) es más que el director general (8) y así sucesivamente, aunque no puede precisarse en cada caso cuánto más. 4.3 De Intervalo Esta escala mide las variables de manera numérica. Los números de esta escala permiten establecer distancias entre dos individuos, y las operaciones aritméticas de suma y resta son perfectamente realizables y significativas, no así la multiplicación y división. En la escala de intervalo el cero es un valor que no indica ausencia de la característica o variable medida, y es colocado arbitrariamente en algún lugar de la escala. El ejemplo típico es la temperatura (medida en grados centesimales, Fahrenheit o Kelvin) donde un valor de cero no implica que exista ausencia de temperatura.
4.4 De Razón Es la escala más fuerte, dado que usa un sistema numérico en el que el cero es un valor que indica ausencia de la característica que se está midiendo. Las operaciones aritméticas de multiplicación y división adquieren significación. La diferencia entre dos valores es importante y de magnitud definida. Así por ejemplo, el valor de cero quetzales en ingresos de una tienda, puede interpretarse de manera lógica que no se han producido ventas. De la misma manera un artículo con un peso de 6 Kg. tiene el doble de peso de otro que registra 3 Kg. 5 Pruebas estadísticas asociadas a cada una de las escalas de medición Los cuadros 1,2 y 3 contienen las principales pruebas estadísticas que pueden usarse para el análisis de datos. Estos cuadros únicamente representan una guía de elección sobre una prueba o procedimiento estadístico en particular. Esto significa que antes de usar una prueba en definitiva, deberán estudiarse a fondo las condiciones para su empleo.
Cuadro 1: Pruebas estadísticas descriptivas más frecuentes de acuerdo a la escala de medición de la variable en estudio. Tipo de descripción Escala de la variable o asociación Variables individuales Categóricas (nominal y ordinal) Variables individuales Numéricas (intervalo y razón) Método o técnica estadística Frecuencias, proporciones o porcentajes representados por gráficos de barras, pastel o pictogramas. Distribución de frecuencias en clases Frecuencias acumuladas Percentiles Medidas de tendencia centra, dispersión, curtosis y oblicuidad Asociación entre variables Categóricas con Tablas de contigencias categóricas Gráficos de barras Pruebas de Kendall, de Kramer, de Spearman Asociación entre variables Categórica con numérica Tablas con clasificación categórica, con promedios y desviaciones o error estándar en cada entrada Asociación entre variables Numérica con numérica Gráfico de puntos Coeficiente de correlación Recta de regresión
Cuadro 2: Pruebas estadísticas inferenciales más frecuentes de acuerdo a la escala de medición de la variable en estudio. Tipo de descripción Escala de la variable o Método o técnica asociación estadística Variables individuales Nominales Prueba de Z para una proporción poblacional Prueba de X 2 para varias proporciones en un sola población Intervalos de confianza para proporciones Variables individuales Ordinales Prueba del signo o binomial para la mediana poblacional Intervalo de confianza para proporciones Asociación entre variables Muestras grandes con distribución normal Asociación entre variables Muestras pequeñas sin distribución normal Prueba de t para un promedio poblacional Intervalo de confianza para el promedio Prueba del signo o binomial para la mediana poblacional Intervalo de confianza para el promedio
Cuadro 3: Pruebas estadísticas para estudios comparativos más frecuentes de acuerdo a la escala de medición de la variable en estudio. Independientes (sin control de factores de confusión) Ordinal Tipo de descripción Escala de la Método o técnica estadística variable o asociación Independientes (sin control Nominal Prueba exacta de Fisher de factores de confusión) Prueba de X 2 Cálculo de riesgo relativo Modelos logísticos y logarítmicolineales Prueba U de Mann Whitney (dos poblaciones) Prueba de Kruskall Wallis (dos o más poblaciones) Modelos logarítmicos-lineales Independientes Razón Prueba de t (dos poblaciones) Análisis de varianza para la prueba de F (más de dos poblaciones) seguida de prueba de medias de Tukey, Duncan, SNK, etc. Prueba de Logrank para comparar sobreviva Regresión múltiple Dependientes con bloques o igualación de atributos (con control de factores de confusión) Dependientes con bloques o igualación de atributos (con control de factores de confusión) Dependientes con bloques o igualación de atributos (con control de factores de confusión) Nominal Prueba de McNemar Método de Mantel Haenzel Prueba Prueba de X 2 para cada nivel de confusión Modelos logísticos Modelos logísticos y logarítmicolineales Ordinal Prueba de Friedman Prueba de Wilcoxon para rangos señalados Modelos logarítmico-lineales Razón Prueba de t apareada Análisis de varianza para prueba de F con dos criterios de clasificación con prueba de Tukey Regresión múltiple
6 Síntesis Esquemática La complejidad aumenta con cada una de las escalas de medición. Desde la simpleza de la escala nominal hasta el refinamiento de la escala de razón. La mayoría de pruebas estadísticas requieren medidas en escala de intervalo o razón para ser aplicadas (Pruebas Paramétricas basadas en la distribución normal), aunque existen pruebas diseñadas para aplicarse a medidas en escala nominal u ordinal (Pruebas No Paramétricas o de libre distribución) Pruebas Paramétricas Pruebas No Paramétricas 7 Actividades de Aprendizaje a. La revista Lugares en su número 42 ofreció datos sobre condiciones y atracciones de los principales destinos de Guatemala. Algunos de estos datos se reproducen en el cuadro 4.
Cuadro 4: Condiciones y atracciones de los principales destinos turísticos de Guatemala Ciudad Población Promedio de Mejor Hotel Atracción más Tasa de en miles ingreso/hogar (Q) visitada criminalidad /10,000 hab. Antigua G. 45 3500 Radisson Ruinas 84 Cobán 35 2700 Radisson Reserva 26 ecológica Izabal 40 4000 Del Lago Lago 69 Panajachel 27 2500 Hyatt Lago 63 Petén 49 5100 Espléndido Jardín botánico 42 Identifique la escala en que están medidas cada una de las variables del cuadro 4. b. Diríjase a la biblioteca de su Facultad o Universidad y tome al azar 10 títulos diferentes de tesis de grado. Identifique en cada una de ellas por lo menos una de las variables usadas en la investigación y defina en qué escala está medida. Finalmente anote la prueba estadística usada para su análisis y juzgue si fue correctamente aplicada en función de la escala de medición definida. Referencias Bibliográficas Allen L.W. 2000. Estadística aplicada a los negocios y la economía. McGraw-Hill. Anderson R., Sweeney D. 1999. Estadística para administración y economía. Internacional Thomson. Levin R., Rubin D. 1996. Estadística para administradores. Prentice Hall. Levin D. et al. 2000. Estadística: Teoría y aplicaciones usando Microsoft Excel. Prentice Hall. Mendenhall W. 1989. Introducción a la Probabilidad y Estadística. Iberoamericana.