Medidas de Variabilidad y Posición. Jesús Eduardo Pulido Guatire, marzo 010 Cuando trabajamos el aspecto denominado Medidas de Tendencia Central se observó que tanto la media como la mediana y la moda proporcionan un solo valor cada una, el cual es descriptivo de un conjunto de valores que toma una determinada variable; aun cuando la información contenida en una medida de tendencia central puede ser suficiente en algunos casos, hay muchas situaciones en las cuales se requiere describir otras características, atributos o cualidades que se registran en un archivo de datos. Dicho en otros términos para describir una distribución de frecuencias se necesita, por lo menos, de otra medida que posibilite cuantificar la variación de los datos ya que Una medida de variabilidad es un número que nos indica el grado de dispersión en un conjunto de datos. Si este valor es pequeño (respecto de la unidad de medida) entonces hay una gran uniformidad entre los datos. Por el contrario, un gran valor nos indica poca uniformidad (Chao, 93; p. 49). Entre las medidas de dispersión absoluta de mayor uso tenemos la amplitud total o rango, desviación típica y la varianza. Amplitud total o rango. La amplitud total o recorrido de una variable está definida por la diferencia entre su valor más alto y el mínimo. Se utiliza cuando sólo se necesita hacer una comparación rápida entre dos distribuciones; no es muy confiable debido a su inestabilidad ya que puede variar considerablemente de una distribución a otra. Su resultado se fundamenta únicamente en dos de sus valores extremos, los demás datos no interviene en el cálculo. A continuación se muestra la magnitud con la cual varían los valores que toman las variables Y i y Z i. Y i Z i 10 11 1 3 13 4 14 5 1
El rango para Y i = 14 10 = 4 y para Z i su rango = 5 = 3; los resultados indican claramente que los valores que tomó la variable Y i están más separados que los de la variable Z i, el espacio ocupado por Y i es equivalente a 4 unidades, lo cual es un indicador de la existencia de una mayor variabilidad con respecto a la de los valores tomados por la variable Z i, expresado en términos de dispersión; cuanto más grande es el rango mayor es la dispersión de los datos en una distribución. Desviación Típica o Estándar S La desviación típica mide el grado en que las puntuaciones de la variable se aleja de su media aritmética; ejemplo, determinar la desviación típica de la siguiente distribución de frecuencias (Calificaciones en Inglés) X f 10 11 4 1 8 13 3 14 Para obtener la desviación típica nos vamos a apoyar en la siguiente ecuación SC s =. La Suma de Cuadrados (SC) se obtiene del siguiente modo: SC= n fx - fx n los componentes de esta fórmula. Seguidamente se prepara una tabla con todos X f X fx fx 10 100 00 0 11 4 11 484 44 1 8 144 115 96 13 3 169 507 39 14 6 39 8.735 7 SC=.735-7 SC=.735-51.59
SC =.735.71,05 SC=, 95 S =,95 S= 1, 078 = 1,09 puntos 7 La media de la distribución en estudio es 11,95 puntos ( X ) Interpretación. Las calificaciones obtenidas por los alumnos en inglés se alejan del promedio (11,95) en 1,09 puntos; dicho en otros términos, los alumnos lograron un promedio de 11,95 puntos en inglés con una dispersión de 1,09 puntos. La desviación típica presenta una gran utilidad cuando se analiza conjuntamente con la media aritmética en una distribución normal; veamos los siguientes casos: a. La 68 % (el intervalo comprendido entre la media más y menos una desviación estándar contiene aproximadamente el 68% de los casos en estudio). b. La 95% (el intervalo comprendido entre la media más y menos dos desviaciones estándares contiene aproximadamente el 95% de los casos en estudio). c. La 3 99% (el intervalo comprendido entre la media más y menos tres desviaciones estándares contiene aproximadamente el 99% de los casos en estudio). Medidas de Posición. Cuando trabajamos la mediana se hizo con el propósito de encontrar un valor que permitiera localizar la posición de algún caso con relación a otros que están ordenados de manera ascendente o descendente. En ese preciso instante se inició el estudio de las medidas de posición, puesto que se dividió la distribución en dos partes iguales, pero igualmente puede dividirse en cuatro (cuartiles) en diez (deciles) o en cien partes iguales (percentiles). Los cuartiles son tres y se representan por Q 1, Q, y Q 3, respectivamente. El Q 1, significa que por debajo de su valor se encuentra el 5% de los casos en la 3
distribución que se esté analizando; el Q es igual a la mediana y bajo el Q 3 se encuentra el 75% de los casos. De igual modo, el percentil es el punto por debajo del cual se encuentra un determinado porcentaje de casos, por ejemplo, el percentil ochenta (P 80 ) es el punto por debajo del cual se encuentra el 80% de los casos en la distribución. El percentil veinticinco (P 5 ) es igual al cuartil uno (Q 1 ), el percentil cincuenta (P 50 ) es igual a la mediana e igual al cuartil dos (P 50 = Me = Q ) y el percentil setenta y cinco es igual al cuartil tres (P 75 = Q 3 ). En el caso de datos agrupados en distribuciones de frecuencia el cálculo de los percentiles se hace mediante un procedimiento análogo al utilizado para la mediana: Pk = Xri + K N 100 fa anterior fi i Donde: K = Es el percentil que se desea determinar. N = Es la suma de las frecuencias absolutas de la distribución fi N. Los demás componentes de la fórmula ya fueron estudiados en la mediana. Apoyándonos en la distribución de las calificaciones obtenidas por los alumnos en la prueba de Física vamos a ilustrar el cálculo del percentil 5 (P 5 ), el P 65 y completaremos el estudio de esta distribución con el cálculo del Rango y la Desviación Típica. X i f i fa 10 1 1 11 3 1 1 4 13 6 14 8 15 10 16 1 11 11 4
Pasos para determinar un determinado percentil: 1. Localizar la fila que contiene al percentil, en nuestro caso el P 5 ; P 5 = 5 *11 100 =,75; el P 5 está ubicado en la fila de la distribución de frecuencias porque la frecuencia acumulada es 3 y ésta contiene a,75.. Una vez localizada la fila podemos localizar el Límite Real Inferior (Xri), el cual es 10,5 (se le quitó media unidad a 11), la frecuencia acumulada anterior (1), la frecuencia absoluta que contiene al P 5 () y el intervalo que en nuestro caso es 1 (11-10= 1; 1 11= 1; ; 16 15 = 1). 3. Se aplica la ecuación P 5 = 10,5 +,75 1 *1 P 5 = 10,5 0,875 P 5 = 9,6. Utilizando el mismo procedimiento se determinó el P 65 y se obtuvo un resultado de P 65 = 1,9. El rango viene dado por la diferencia entre la calificación más alta y la menor que alcanzaron los estudiantes, en nuestro caso es Rango = 16 10 = 6 La Desviación Típica se determinó utilizando el proceso descrito anteriormente y se obtuvo el siguiente resultado S = 1,83 Los resultados de la distribución de las calificaciones obtenidas por los 11 estudiantes en la prueba de Física se reportan en el siguiente cuadro. Estadísticos Resultados N 11 Media 13,09 Mediana 13,5 Moda 11 Desv. Típica 1,83 Rango 6 P 5 9,6 P 65 1,9 Asimetría Negativa Interpretación. Al analizar los resultados de la tabla se observa que la distribución de las calificaciones obtenidas por los 11 alumnos en la prueba de 5
Física es asimétrica negativa, que su calificación promedio fue de 13,09 puntos con una dispersión de 1,83; que la mitad de los estudiantes obtuvo calificaciones por debajo de 13,5 puntos; que entre el estudiante que logró la mayor calificación y el obtuvo la menor hay una diferencia de 6 puntos. Que el 40% de los estudiantes logró calificaciones que están comprendidas entre 9,6 y 1,9 puntos. Referencia Bibliográfica. Chao, L. (94). Estadística para las ciencias administrativas. (3ª ed). México: McGraw-Hill. 6