Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 2016-2 Hermosillo, Sonora, a 28 de septiembre de 2016.
Introducción Las medidas de forma evalúan la apariencia que adopta la distribución de frecuencias respecto al grado de distorsión (inclinación) que registra respecto a valor promedio tomado como centro de gravedad, el grado de apuntamiento (elevamiento) de la distribución de frecuencias. A mayor elevamiento de la distribución de frecuencia significará mayor concentración de los datos en torno al promedio, por tanto, una menor dispersión de los datos. Las medidas que estimaremos en esta presentación son: 1. La asimetría, 2. El sesgo y 3. La curtosis.
Simetría. Se dice que la distribución es simétrica cuando los datos de una población se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media aritmética. 1. Si la distribución de frecuencias es unimodal, entonces Mediana = Moda = Media. Ver caso A. 2. Si la distribución de frecuencia es simétrica, entonces Mediana = Moda = Media (el recíproco no siempre es cierto). Ver caso B C. Para distribuciones bimodales y rectangulares sólo la media y la mediana son idénticas. Ver caso B y caso C. La simetría determina que la población es homogénea en relación a la variable de estudio. 3
Medidas de forma Asimetría. Se clasifica como asimétrica toda distribución donde los datos menores que la media aritmética son más frecuentes que los datos mayores que la media, o viceversa. En este caso, se dice que la población es heterogénea para la variable en estudio. 1.Distribución asimétrica a la derecha: los datos mayores que la media aritmética son menos frecuentes que los datos menores que la media. La media tiene el valor más grande de las tres medidas de tendencia central en una distribución asimétrica positiva. 4
Medidas de forma 2. Distribución asimétrica a la izquierda: los datos por debajo de la media aritmética son menos frecuentes que los mayores. La media tiene el valor más pequeño de las tres medidas de tendencia central en una distribución asimétrica negativa. 5
Coeficiente de asimetría de Pearson. S k 3*(Media Mediana) Desviaciónestándar Resultados posibles: a) Si S k < 0 entonces la distribución es asimétrica a la izquierda. b) Si S k = 0 entonces la distribución es simétrica. a) b) c) c)si S k > 0 entonces la distribución es asimétrica a la derecha. 6
Coeficiente de Asimetría de Fisher. A k i1 ( X ) 3 N Donde A f representa el coeficiente de asimetría de Fisher, X i cada uno de los valores de la población, (µ) la media de la población, σ la desviación estándar de la población, y (f i ) la frecuencia de cada valor. A f f k i1 ( X Donde A f representa el coeficiente de asimetría de Fisher, X i cada uno de los valores en la muestra, X la media de la muestra, S la desviación estándar de la muestra, y (f i ) la frecuencia de cada valor. i i n S X 3 3 3 ) f f i i
Los resultados posibles son: a) Si A f < 0 entonces la distribución está sesgada a la izquierda. b) Si A f = 0 entonces la distribución no está sesgada. c)si A f > 0 entonces la distribución está sesgada a la derecha. a) b) c)
Interpretación del coeficiente de asimetría de Fisher A f. A f < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha). A f = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media). A f > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda).
El Coeficiente de Curtosis de Fisher analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis:
El Coeficiente de Curtosis para la población se calcula usando i1 ( X ) Donde (C f ) representa el coeficiente de curtosis de Fisher, (X i ) cada uno de los valores, (µ) la media de la población, σ la desviación estándar de la población, y (f i ) la frecuencia de cada valor. Para la muestra se usa la fórmula C f C f k k i1 i 4 N ( X i X n S Donde (C f ) representa el coeficiente de curtosis de Fisher, (X i ) cada uno de los valores de la muestra, ( X) la media de la muestra, S la desviación estándar de la muestra, y (f i ) la frecuencia de cada valor. 4 ) 4 4 f f i i 3 3
a) Si A f < 0 La distribución es platicúrtica y presenta un reducido grado de concentración alrededor de los valores centrales de la variable. b) Si A f = 0 la distribución es mesocúrtica y presenta un grado de concentración promedio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). c) A f > 0 la distribución es leptocúrtica y presenta un elevado grado de concentración alrededor de los valores centrales de la variable. a) b) c)
Ejemplo 1: Una granja ganadera regional, registró durante el mes de febrero 2015 el nacimiento de 14 terneros respectivamente, cuyos pesos al nacer (en kilogramos) fueron los siguientes: 22, 31, 32, 44, 35, 36, 37, 38, 44, 49, 40, 50, 41. Resolución. Para calcular el coeficiente de asimetría de Pearson se requiere obtener los valores de la media, la mediana y la desviación estándar que ya fueron obtenidas en clases anteriores. La media es 38.5 kg, la mediana es 39 kg y la desviación estándar es 7.36676529 kg. Así que 3 (38. 5 39) A P = = 0. 20361718 7. 36676529 Se concluye que la distribución de los pesos de los corderos es asimétrica negativa. Es decir, hay más corderos que pesan menos del promedio. Para calcular los coeficientes de asimetría y curtosis de Fisher, elaboramos una tabla como la de la diapositiva siguiente.
Tabla para calcular los coeficientes de asimetría y curtosis de Fisher Ternero X X X X X 2 X X 3 X X 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Totales 22 22 38.5 = 16.5 272.25-4492.125 74120.0625 31 31 38.5 = 7.5 56.25-421.875 3164.0625 32 32 38.5 = 6.5 42.25-274.625 1785.0625 44 44 38.5 = 5.5 30.25 166.375 915.0625 35 35 38.5 = 3.5 12.25-42.875 150.0625 36 36 38.5 = 2.5 6.25-15.625 39.0625 37 37 38.5 = 1.5 2.25-3.375 5.0625 38 38 38.5 = 0.5 0.25-0.125 0.0625 44 44 38.5 = 5.5 30.25 166.375 915.0625 49 49 38.5 = 10.5 110.25 1157.625 12155.0625 40 40 38.5 = 1.5 2.25 3.375 5.0625 40 40 38.5 = 1.5 2.25 3.375 5.0625 50 50 38.5 = 11.5 132.25 1520.875 17490.0625 41 41 38.5 = 2.5 6.25 15.625 39.0625 539 0 705.5-2217 110787.875
Aplicamos las relaciones dadas anteriormente para calcular los coeficientes de asimetría y curtosis de Fisher. Esto es, A f = 2217 14 (7. 36676529) 3 = 0. 39610211 Se concluye que la distribución de los pesos de los corderos está sesgada a la izquierda. Es decir, existe mayor concentración de valores a la izquierda de la media que a su derecha). Similarmente calculamos el coeficiente de curtosis. C f = 110787. 875 3 = 0. 31306683 14 (7. 36676529) 4 Se concluye que la distribución es leptocúrtica y presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
Ejemplo con datos resumidos. Ejemplo 2. Se ha tomado una muestra de 48 personas y se les ha preguntado el número de revistas que leen al mes. Los resultados son los siguientes: Número de revistas Número de personas 1 1 2 20 3 12 4 10 5 3 6 2 Total 48 Calcular e interpretar las medidas de forma siguientes: a) Coeficiente de asimetría de Pearson. a) Coeficiente de asimetría de Fisher b) Coeficiente de curtosis de Fisher
Ejemplo con datos resumidos. Resolución. Para calcular el coeficiente de asimetría de Pearson se requiere obtener los valores de la media, la mediana y la desviación estándar que ya fueron obtenidas en clases anteriores. La media es 3 revistas, la mediana es 3 revistas y la desviación estándar es 1.16691993 revistas. Así que A P = 3 (3 3) 1. 16691993 = 0. Se concluye que la distribución de la lectura de las revistas es simétrica. Es decir, existe la misma concentración de valores a la derecha y a la izquierda de la media). Para calcular los coeficientes de asimetría y curtosis de Fisher, elaboramos una tabla como la de la diapositiva siguiente.
No. de Revistas X i No. de Personas. f i X i f i *(X i X) f i * X i X 2 f i * X i X 3 f i * X i X 4 f i 1 1 1 2 20 40 3 12 36 4 10 40 5 3 15 6 2 12 1*(1-3)= -2 1 (1 3) 2 = 4 1 (1 3) 3 = -8 1 (1 3) 4 = 16 20*(2-3)= -20 20 2 3 2 = 20 20 2 3 3 = 20 20 2 3 4 = 20 12*(3-3)= 0 12 (3 3) 2 = 0 12 (3 3) 3 = 0 12 (3 3) 4 = 0 10*(4-3)= 10 10 (4 3) 2 =10 10 (4 3) 3 =10 10 (4 3) 4 =10 3*(5-3)= 6 3 (5 3) 2 =12 3 (5 3) 3 = 24 3 (5 3) 4 = 48 2*(6-3)= 6 2 (6 3) 2 =18 2 (6 3) 3 = 54 2 (6 3) 2 = 162 Totales 48 144 0 64 60 256
Aplicamos las relaciones dadas anteriormente para calcular los coeficientes de asimetría y curtosis de Fisher. Esto es, A f = 60 6 (1. 16691993) 3 = 6. 29327668 Se concluye que la distribución de la lectura de revistas está sesgada a la derecha. Es decir, existe mayor concentración de valores a la derecha de la media que a su izquierda). Similarmente calculamos el coeficiente de curtosis. C f = 256 6 (1. 16691993) 4 3 = 20. 0104167 Se concluye que la distribución es leptocúrtica y presenta un elevado grado de concentración alrededor de los valores centrales de la variable.