Estadística Descriptiva
ESTADÍSTICA DESCRIPTIVA 1 Sesión No. 9 Nombre: Medidas de centralización Contextualización En la sesión anterior has aprendido acerca de una de las medidas de tendencia central denominada como mediana, has asimilado su concepto y apoyado en un ejemplos prácticos, has estudiado la manera de calcularla para los dos tipos de grupos de datos (agrupados y no agrupados). Al terminar esta sesión habrás comprendido la última de las medidas de tendencia central, designada como moda.
ESTADÍSTICA DESCRIPTIVA 2 Introducción al Tema En la presente sesión revisarás el concepto de moda como una medida de tendencia central que guarda estrecha relación con la media y con la mediana. La media es una medida de uso frecuente en diversos estadísticos, no obstante es una medida altamente sensible a valores extremos. Por su parte, el cálculo de la mediana no se ve afectado por valores extremos, pero depende del número de elementos de la muestra. En esta sesión se estudia la moda, la cual mantiene una notable estabilidad ante valores extremos; sin embargo, puede no existir y, si existe, puede ser única o múltiple.
ESTADÍSTICA DESCRIPTIVA 3 Explicación III.3 Moda La moda, que se denota por x mod, es el valor o valores que se repiten con mayor frecuencia en una muestra, con la circunstancia de que en un conjunto de datos no agrupados puede no existir y, en caso de que exista, puede no ser único. Consideremos el siguiente conjunto de datos: A = {0, 1, 2, 3, 4, 5, 6, 23, 51, 75} Como puede apreciarse, el conjunto no contiene elementos repetidos, lo que implica que no tiene moda. Consideremos ahora el siguiente conjunto: B = {2, 4, 4, 4, 7, 8, 9, 10} En este conjunto existe un valor que se repite. Esto significa que la moda es única: x mod = 4 De ahí que se diga que este conjunto de datos es unimodal. Analicemos ahora el siguiente conjunto: C = {2, 4, 4, 4, 5, 5, 7, 8, 9, 10} Podemos apreciar que este conjunto incluye dos valores que se repiten: el número cuatro (que se repite tres veces) y el cinco (que se repite dos veces). Este tipo de conjuntos que tienen dos modas se conocen como bimodales. Finalmente, consideremos el siguiente conjunto: D = {2, 4, 4, 4, 5, 5, 7, 8, 9, 10, 10} En el cual observamos tres valores que se repiten: el número cuatro (que se repite tres veces), el cinco (que se repite dos veces) y el diez (que se repite dos veces). Dado que el conjunto dispone de más de dos modas (en este caso tiene tres), se dice que es multimodal. Las siguientes ilustraciones muestran la representación gráfica de conjuntos unimodal, bimodal y multimodal.
ESTADÍSTICA DESCRIPTIVA 4 Conjunto unimodal Conjunto bimodal Conjunto multimodal Con datos agrupados, la moda siempre existe y se calcula con la siguiente fórmula: Dónde: Límite inferior del intervalo de clase en donde se encuentra la moda. En la tabla de datos agrupados, este valor corresponde a la clase con la mayor frecuencia. Frecuencia del intervalo de clase en donde se encuentra la moda menos la frecuencia del intervalo de clase contiguo inferior. Frecuencia del intervalo de clase en donde se encuentra la moda menos la frecuencia del intervalo de clase contiguo superior. Longitud del intervalo de clase. Cada elemento de la fórmula se toma directamente de la tabla de datos agrupados. Considerando nuestro caso práctico sobre el estudio estadístico para lanzar una nueva bebida refrescante de venta en cines, tomamos de nuestra tabla de datos agrupados la columna referente a las frecuencias de clase (fi).
ESTADÍSTICA DESCRIPTIVA 5 De esta tabla se obtienen los siguientes valores para las frecuencias de clase: f1 = 5 f2 = 10 f3 = 30 f4 = 40 f5 = 15 Observamos que el intervalo de clase con la mayor frecuencia (40) corresponde a: [20,25) Dado que su límite inferior es igual a 20, se desprende que: L1 = 20 El intervalo de clase contiguo inferior al intervalo de clase que contiene a la moda es: [15,20) Con una frecuencia de 30. De ahí que la diferencia de la frecuencia del intervalo de clase que contiene a la moda (intervalo de clase con la mayor frecuencia) menos la frecuencia del intervalo de clase contiguo inferior a éste sea: Por su parte, el intervalo de clase contiguo superior al intervalo de clase que contiene a la moda es: [25,30] Con una frecuencia de 15. Consecuentemente, la diferencia de la frecuencia del intervalo de clase que contiene a la moda (intervalo de clase con la mayor frecuencia) menos la frecuencia del intervalo de clase contiguo superior a éste es: Finalmente, se observa que la longitud de cada intervalo de clase es igual a cinco, es decir: c = 5
ESTADÍSTICA DESCRIPTIVA 6 Sustituyendo valores para calcular la moda para datos agrupados, tenemos que: El valor de la moda es cercano al de la media aritmética y al de la mediana:
ESTADÍSTICA DESCRIPTIVA 7 Conclusión A lo largo de esta sesión se ha descrito la última de las medidas de tendencia central, denominada como moda, ésta, es el valor o valores que se repiten con mayor frecuencia en una muestra y puede o no ser única. Existen tres diferentes tipos de conjuntos: unimodal, bimodal y multimodal, y a lo largo de esta sesión aprendiste a realizar el cálculo de la moda para cada caso. Con esto, se concluyen los temas relacionados a las medidas de tendencia central correspondientes a esta unidad. Con la siguiente sesión darás inicio a los temas correspondientes a la siguiente unidad, en la cual abordaras los temas correspondientes a las medidas de dispersión.
ESTADÍSTICA DESCRIPTIVA 8 Actividad de Aprendizaje Para fortalecer los conocimientos obtenidos en esta sesión, deberás realizar la siguiente actividad. Instrucciones Calcula la MODA en base a la siguiente tabla de datos agrupados Intervalos de clase Frecuencia de clase f i [5,10) 5 [10,15) 10 [15,20) 30 [20,25) 40 [25,30) 15 100 Sube el documento a la plataforma en el lugar indicado; recuerda que esta actividad equivale al 5% de tu calificación final.
ESTADÍSTICA DESCRIPTIVA 9 Referencias Hernández, A. y O. Hernández (2003). Elementos de probabilidad y estadística. México: Sociedad Matemática Mexicana. Mendenhall, W. y T. Sincich (1997). Probabilidad y estadística para ingeniería y ciencias. Cuarta edición. México: Prentice Hall. Spiegel, M. y L. Stephens (2001). Estadística. México: McGraw Hill. Ulloa, V. y V. Quijada (2006). Estadística aplicada a la comunicación. México: UNAM.