Estadística Descriptiva

1 Sesión No. 11 Nombre: Medidas de dispersión Contextualización En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión, además de los diversos temas relacionados con ella. Esta es una cuantificación del grado de alejamiento de los datos respecto a su media aritmética. Ahora es necesario conocer otra de las medidas de dispersión conocida como desviación típica o estándar y los temas relacionados con esta medida. Al terminar esta sesión habrás comprendido el concepto de desviación estándar relacionado con los estudios estadísticos.

2 Introducción al Tema Las medidas de dispersión se asocian a la precisión estadística de las observaciones o datos muestrales. Cuando la dispersión de un conjunto de datos es muy alta, las estimaciones que se realizan en función de éstas conllevan un notable grado de imprecisión. Y en sentido inverso, cuando un conjunto de datos presenta una dispersión baja, el nivel de incertidumbre disminuye notablemente. En esta sesión estudiarás las características y métodos de cálculo de una de las medidas de dispersión de mayor uso en los estudios estadísticos: la desviación estándar.

3 Explicación IV.2 Desviación típica o estándar La desviación típica o estándar, denotada por la literal s, es una medida de dispersión que se emplea para variables de razón (también conocidas como ratio o cociente) y para variables de intervalo. La desviación estándar se considera una medida cuadrática que representa el promedio de las desviaciones (distancias) de los datos muestrales respecto de su media aritmética, expresada en las mismas unidades que la variable. La fórmula para calcular la desviación estándar para datos no agrupados está dada por la siguiente expresión: Dónde: n = Número de datos o elementos de la muestra. i = Índice de la suma que toma los valores 1, 2, 3...n. x i = Valor del i-ésimo dato de la muestra. = Media aritmética de la muestra. Es importante señalar que la siguiente fórmula se considera más apropiada para una mejor estimación de la desviación estándar de la población a partir de la muestra: Cualquiera de las fórmulas puede usarse indistintamente, pero en la práctica es común el uso de la segunda. En ésta, al cociente n 1 se le denomina corrección de Bessel. Calculemos la desviación estándar para el siguiente conjunto de datos no agrupados:

4 A = {2, 4, 6, 8, 10} De este conjunto se desprende que: n = 5 x 1 = 2 x 2 = 4 x 3 = 6 x 4 = 8 x 5 = 10 Con estos datos, procedemos a calcular la media aritmética del conjunto: Y a continuación se sustituyen los valores anteriores en la fórmula: Tal como se muestra a continuación: Por su parte, la fórmula para calcular la desviación estándar de datos agrupados está dada por la siguiente expresión:

5 Dónde: k = Número de intervalos de clase en la distribución de frecuencias. n = Número de datos o elementos de la muestra. i = Índice de la suma que toma los valores 1,2,3...k. f i = Frecuencia del i-ésimo intervalo de clase. xi = Marca de clase del i-ésimo intervalo de la muestra. Media aritmética de la muestra. Para calcular la desviación estándar en un conjunto de datos agrupados, también empleamos la versión que incorpora la corrección de Bessel. Como puede observarse, cada elemento de la fórmula se toma directamente de la tabla de datos agrupados. Considerando el caso práctico de una bebida, se toma de la tabla de datos agrupados las columnas referentes a las frecuencias de clase (f i ) y a las marcas de clase (x i ). De esta tabla se obtienen los siguientes valores para las frecuencias de clase: f 1 = 5 f 2 = 10 f 3 = 30 f 4 = 40 f 5 = 15 Y para las marcas de clase: x 1 = 7.5 x 2 = 12.5 x 3 = 17.5 x 4 = 22.5 x 5 = 27.5 Asimismo, dado que hay cinco intervalos de clase y la muestra tiene 100 elementos, los valores de k y n respectivamente son: k = 5 n = 100 Y como ya se determinó en ejercicios anteriores: = 20 Ahora, sustituyendo estos valores en la respectiva fórmula se tiene que:

6 La desviación estándar es una medida de dispersión que nos permite evaluar la incertidumbre de los datos obtenidos por la muestra; es decir, analiza todos aquellos datos que se alejan de nuestro promedio para determinar si nuestra predicción o teoría está alejada del modelo que se construyó con la muestra.

7 Conclusión En esta sesión se han explicado la desviación estándar como una medida de dispersión, que sirve para evaluar la incertidumbre de los datos de una muestra, además, se explicó el procedimiento para el correcto cálculo de esta desviación en un conjunto de datos no agrupados y agrupados. En la siguiente sesión conocerás los temas correspondientes a la varianza como la última de las medidas de dispersión, así como el procedimiento para su cálculo en conjuntos de datos agrupados y no agrupados.

8 Actividad de Aprendizaje Instrucciones Para fortalecer los conocimientos obtenidos en esta sesión, deberás realizar la siguiente actividad. I. Calcula la desviación estándar de la siguiente serie de valores que corresponden al peso en kilogramos de un grupo de 20 niños de un año de edad. 9.1 9.4 8.9 9.6 10.5 8.8 9.4 9.2 9.0 8.1 9.3 8.8 9.5 9.7 9.2 9.4 9.6 9.0 9.4 9.6 II. La chef en jefe de The Flying Taco acaba de recibir dos docenas de jitomates de su proveedora, pero todavía no los acepta. Sabe por la factura que el peso promedio de un jitomate es de 7.5 onzas, pero insiste en que todos tengan un peso uniforme. Aceptará los jitomates sólo si el peso promedio es de 7.5 onzas y la desviación estándar es menor que 0.5 onzas. Los pesos de los jitomates son los siguientes: 6.3 7.2 7.3 8.1 7.8 6.8 7.5 7.8 7.2 7.5 8.1 8.2 8.0 7.4 7.6 7.7 7.6 7.4 7.5 8.4 7.4 7.6 6.2 7.4 Cuál es la decisión de la chef y por qué? Sube el documento en formato PDF a la plataforma de la asignatura; recuerda que esta actividad equivale al 5% de tu calificación final.

9 Referencias Hernández, A. y O. Hernández (2003). Elementos de probabilidad y estadística. México: Sociedad Matemática Mexicana. Mendenhall, W. y T. Sincich (1997). Probabilidad y estadística para ingeniería y ciencias. Cuarta edición. México: Prentice Hall. Spiegel, M. y L. Stephens (2001). Estadística. México: McGraw Hill. Ulloa, V. y V. Quijada (2006). Estadística aplicada a la comunicación. México: UNAM.