ESTADÍSTICA SEMANA 4



Documentos relacionados
MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

Parámetros y estadísticos

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

Otras medidas descriptivas usuales

Medidas de tendencia central o de posición: situación de los valores alrededor

ANÁLISIS DESCRIPTIVO CON SPSS

Clase 2: Estadística

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

Tema 3. Medidas de tendencia central Introducción. Contenido

Tema 2 Estadística Descriptiva

Estadística: conceptos básicos y definiciones.

1. MEDIDAS DE TENDENCIA CENTRAL

Ejercicio de estadística para 3º de la ESO

Clase 2: Estadística

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

Media vs mediana vs moda Cual medida de tendencia central es mas adecuada? MEDIA conveniencias:

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

Una forma rápida de ordenar datos numéricos (Diagrama de Tallo y Hoja)

PRÁCTICA No. 1 ESTADÍSTICA DESCRIPTIVA PARTE I

1. Análisis de variables cuantitativas (2 a parte)

Medidas de tendencia Central

Covarianza y coeficiente de correlación

1.1. Introducción y conceptos básicos

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Síntesis Numérica de una Variable

Medidas de la tendencia central y las gráficas de caja

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.

UNIDAD III MEDIDAS DE TENDENCIA CENTRAL

Encuesta sobre las Expectativas de los Especialistas en Economía del Sector Privado: Noviembre de 2014

LECCION 1ª Introducción a la Estadística Descriptiva

TASACION DE INMUEBLES URBANOS

ESTIMACIÓN. puntual y por intervalo

Aplicaciones de Estadística Descriptiva

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

Estadística descriptiva con Excel (Cálculo de medidas)

Probabilidad y Estadística Fundamental Tarea # 2 Tema: Medidas descriptivas de resumen

Tema 9 Estadística Matemáticas B 4º E.S.O. 1 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS EN VARIABLES DISCRETAS

Análisis estadístico con Microsoft Excel

SENA: CENTRO BIOTECNOLOGIA INDUSTRIAL PROGRAMA DE FORMACIÓN: TECNOLOGO GESTION LOGISTICA

MEDIDAS DE TENDENCIA CENTRAL

15 PARÁMETROS ESTADÍSTICOS

GRADO TURISMO TEMA 2: ANÁLISIS DE DATOS TURÍSTICOS UNIDIMENSIONALES

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

Semana de dieta (X) Peso en Kg (Y)

ESTADÍSTICA DESCRIPTIVA CON SPSS

INSTITUCION EDUCATIVA LUIS PATRON ROSANO DOCUMENTO PARA ESTUDIAR LOGROS PENDIENTES DE ESTADISTICA DE 10º

ESTIMACION DE INTERVALOS DE CONFIANZA

Distribución de frecuencias gráficas y tablas

Socioestadística I Análisis estadístico en Sociología

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES

Las bebidas Alcohólicas

Análisis e Interpretación de Datos Unidad XI. Prof. Yanilda Rodríguez MSN Prof. Madeline Fonseca MSN Prof. Reina del C.Rivera MSN

II. Estudio de satisfacción de los titulados y empleadores respecto al desempeño laboral de los profesionales de la UBB Introducción

UNIDAD II MEDIDAS DE TENDENCIA CENTRAL. Otras Medidas de tendencia central

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta

Estadística Descriptiva

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en

DIAGRAMAS DE CAJA. Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79

Test de Idioma Francés. Manual del evaluador

Haciendo estadística con SPAC-FL y Minitab

4 Análisis de los principales factores AsociAdos A los resultados en ciencias

de la empresa Al finalizar la unidad, el alumno:

1.4.- D E S I G U A L D A D E S

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Tema 5: Introducción a la inferencia estadística

Estadística I Ejercicios Tema 3 Curso 2015/16

MERCADOS FINANCIEROS: LOS FONDOS DE INVERSIÓN II

Práctica 2 ESTADÍSTICA DESCRIPTIVA

ANÁLISIS DE DATOS NO NUMERICOS

Capítulo 7: Distribuciones muestrales

PANORAMA DE LA EDUCACIÓN INDICADORES DE LA OCDE 2006 ( EDUCATION AT A GLANCE 2006)

Elementos de Estadística stica Financiera para Análisis de Riesgo

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008

Práctico 1. Estadística y Dinámica de Poblaciones

Circuito RL, Respuesta a la frecuencia.

Aula Banca Privada. La importancia de la diversificación

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

13Soluciones a los ejercicios y problemas

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

Anexo 4. Herramientas Estadísticas

Lección 4: Suma y resta de números racionales

Inferencia Estadística

Análisis de componentes principales

Práctica 2. Estadística Descriptiva

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

1 Ejemplo de análisis descriptivo de un conjunto de datos

Funciones, x, y, gráficos

TEMA 5 ESTUDIOS CORRELACIONALES.

Programa de Evaluación del estado de Nueva York Contenidos Básicos Comunes de 3.º a 8.º Evaluación de Artes del idioma inglés

Análisis técnico de una acción: Rentabilidad, riesgo y correlación

ANÁLISIS DINÁMICO DEL RIESGO DE UN PROYECTO

MEDICION DEL TRABAJO

1 Comida Favorita.Cualitativa. 2 Profesión que te gusta.cualitativa. 3 Número de goles marcados por tu equipo favorito en la última

Transcripción:

ESTADÍSTICA SEMANA 4

ÍNDICE MEDIDAS DE DISPERSIÓN... 3 APRENDIZAJES ESPERADOS... 3 DEfinición de Medida de dispersión... 3 Rango o Recorrido... 3 Varianza Muestral (S 2 )... 3 CÁLCULO DE LA VARIANZA... 4 FóRMULA PARA DATOS NO AGRUPADOS... 4 FÓRMULA PARA CALCULAR LA VARIANZA EN DATOS AGRUPADOS... 5 Desviación Típica o Estándar Muestral (S)... 7 CÁLCULO DE LA DESVIACIÓN TÍPICA O ESTÁNDAR CON DATOS NO AGRUPADOS Y AGRUPADOS... 8 Coeficiente de Asimetría... 10 Otras Medidas de Dispersión... 10 Percentiles... 10 CÁLCULO DEL PERCENTIL EN DATOS AGRUPADOS... 11 Cuartiles... 13 Diagrama de Caja... 14 Coeficiente de Variación... 16 FÓRMULAS PARA DATOS NO AGRUPADOS Y AGRUPADOS... 16 COMENTARIO FINAL... 18 REFERENCIAS... 19 2

MEDIDAS DE DISPERSIÓN APRENDIZAJES ESPERADOS Durante esta semana se trabajará el tema correspondiente a las medidas de dispersión. Para esto se presentarán definiciones teóricas apoyadas de ejemplos y ejercicios desarrollados los cuales ilustrarán las principales aplicaciones de estas medidas en el contexto de la estadística. DEFINICIÓN DE MEDIDA DE DISPERSIÓN Las medidas de dispersión son medidas que tienen como objetivo determinar qué tan disperso o diseminado se encuentra el conjunto de observaciones, respecto a un punto, en el caso de la desviación estándar esta dispersión se calcula en relación a la media (promedio). (Anderson, Sweeney & Williams, 2008). RANGO O RECORRIDO En el caso que los datos se encuentren no agrupados se puede definir al estadígrafo como la diferencia entre la mayor y la menor de las observaciones. Si los datos están agrupados, para calcular el recorrido, se tiene que revisar la tabla de distribución de frecuencias. Primero se selecciona el límite superior del último intervalo y, luego, el límite inferior del primer intervalo y se calcula la diferencia entre estos valores la fórmula para calcularlo es: VARIANZA MUESTRAL (S 2 ) La varianza de una distribución de frecuencias es la media aritmética de los cuadrados de las diferencias entre los valores de la distribución y su media aritmética. El valor numérico de la varianza cuantifica el grado de dispersión de los valores de una distribución de frecuencias respecto a su media aritmética. Mientras mayor es la dispersión de las observaciones, mayor es la magnitud de sus desviaciones respecto a la media aritmética y, por ende, más alto el valor numérico de la varianza. Gráficamente: 3

Si se comparan las representaciones gráficas de las distribuciones A y B; claramente la distribución B posee una mayor dispersión de los datos. CÁLCULO DE LA VARIANZA FÓRMULA PARA DATOS NO AGRUPADOS Esta es utilizada para calcular la varianza cuando la muestra de datos no se encuentra agrupada (tabla distribución de frecuencia) es: Xi : corresponde a la i-ésima observación. : corresponde al promedio de las observaciones. N : es el tamaño de la muestra. Por ejemplo, si se compara la dispersión de los siguientes datos, los cuales corresponden a las notas de dos grupos de alumnos: Grupo 1: 4,5 5,2 4,8 5,9 5,7 Grupo 2: 6,5 2,2 3,3 5,0 4,7 Antes de calcular ya se puede adelantar, mirando las distribuciones, que el Grupo 2 tiene mayor dispersión de notas. 4

Calculando: GRUPO 1 GRUPO 2 Reemplazamos: = Resultado: el grupo 2 (2,73) tiene mayor varianza que el grupo 1 (0,348) FÓRMULA PARA CALCULAR LA VARIANZA EN DATOS AGRUPADOS A continuación utilizaremos la siguiente fórmula para calcular la varianza cuando tenemos los datos agrupados en tablas. Por ejemplo, los siguientes datos (agrupados) corresponden a las notas de dos grupos de estudiantes, de los cursos A y B. 5

Curso A Curso B Notas X i n i N i f i Notas X i n i N i f i [1,0-1,8) 1,4 9 9 0,18 [1,0-1,8) 1,4 8 8 0,16 [1,8-2,6) 2,2 4 13 0,08 [1,8-2,6) 2,2 10 18 0,20 [2,6-3,4) 3 14 27 0,28 [2,6-3,4) 3 11 29 0,22 [3,4-4,2) 3,8 8 35 0,16 [3,4-4,2) 3,8 9 38 0,18 [4,2-50) 4,6 7 42 0,14 [4,2-50) 4,6 7 45 0,14 [5,0-5,8) 5,4 6 48 0,12 [5,0-5,8) 5,4 3 48 0,06 [5,8-6,6) 6,2 2 50 0,04 [5,8-6,6) 6,2 2 50 0,04 50 1 50 1 Calculando: Promedio Curso A Remplazamos Promedio Curso B Remplazamos Otra forma de realizar el cálculo en Microsoft Excel 6

Curso A Notas X i n i N i f i [1,0-1,8) 1,4 9 9 0,18 0,25 4,1 36,6 [1,8-2,6) 2,2 4 13 0,08 0,18 1,5 5,9 [2,6-3,4) 3,0 14 27 0,28 0,84 0,2 2,4 [3,4-4,2) 3,8 8 35 0,16 0,61 0,1 1,2 [4,2-50) 4,6 7 42 0,14 0,64 1,4 9,8 [5,0-5,8) 5,4 6 48 0,12 0,65 3,9 23,6 [5,8-6,6) 6,2 2 50 0,04 0,25 7,8 15,5 50 1 3,42 1,939 Otra forma de realizar el cálculo en Microsoft Excel Curso B Notas X i n i N i f i [1,0-1,8) 1,4 8 8 0,16 0,22 3,3 26,6 [1,8-2,6) 2,2 10 18 0,20 0,44 1,0 10,5 [2,6-3,4) 3,0 11 29 0,22 0,66 0,1 0,6 [3,4-4,2) 3,8 9 38 0,18 0,68 0,3 3,0 [4,2-50) 4,6 7 45 0,14 0,64 1,9 13,3 [5,0-5,8) 5,4 3 48 0,06 0,32 4,7 14,2 [5,8-6,6) 6,2 2 50 0,04 0,25 8,9 17,7 50 1 3,22 1,751 DESVIACIÓN TÍPICA O ESTÁNDAR MUESTRAL (S) La desviación estándar se define como la raíz cuadrada de la varianza y se simboliza con un S, por lo tanto, si elevamos al cuadrado la desviación estándar se obtiene la varianza, según esta definición la varianza se expresa en unidades distintas de la variable original (el resultado es un valor al cuadrado), por ejemplo, si se tienen 10 alumnos de un curso de 8º básico y se mide la estatura de cada uno de ellos y, luego, se calcula su promedio y su desviación estándar, el resultado es el siguiente, el promedio de la estatura de los 10 alumnos del curso es de 1,65 centímetros y el valor calculado para la desviación estándar es de 14,3 centímetros. Si se calculas la varianza el valor obtenido es 204,49 centímetros cuadrados (Pagano, 2011). 7

CÁLCULO DE LA DESVIACIÓN TÍPICA O ESTÁNDAR CON DATOS NO AGRUPADOS Y AGRUPADOS Ejemplo para datos no agrupados: Para los siguientes datos de las estaturas de dos grupos de mujeres, comparar dispersión entre el Grupo 1 y el Grupo 2, cuyas estaturas son: Grupo 1: 1,56-1,81-1,75-1,98-1,59-1,80 Y el Grupo 2, siendo las estaturas: 1,76-1,86-1,96-1,76-1,61-1,89 Solución: 8

Ejemplo 2: Los siguientes datos (agrupados) corresponden a las estaturas (en centímetros) de dos grupos de varones. En qué grupo hay mayor dispersión de estaturas? Solución: Grupo A Grupo B Estaturas X i n i N i f i Estaturas X i n i N i f i [149;157) 153 5 5 0,13 [149;157) 153 2 5 0,04 [157;165) 161 4 9 0,10 [157;165) 161 8 9 0,18 [165;173) 169 7 16 0,18 [165;173) 169 7 16 0,16 [173;181) 177 8 24 0,20 [173;181) 177 11 24 0,24 [181;189) 185 10 34 0,25 [181;189) 185 10 34 0,22 [189;197) 193 6 40 0,15 [189;197) 193 7 40 0,16 40 45 Grupo A Estaturas X i n i N i f i [149;157) 153 5 5 0,13 19,13 501,76 2508,8 [157;165) 161 4 9 0,10 16,10 207,36 829,4 [165;173) 169 7 16 0,18 29,58 40,96 286,7 [173;181) 177 8 24 0,20 35,40 2,56 20,5 [181;189) 185 10 34 0,25 46,25 92,16 921,6 [189;197) 193 6 40 0,15 28,95 309,76 1858,6 40 media 175,40 Varianza 164,76 Desv. Standard 12,84 Desarrollo Grupo B Grupo B Estaturas X i n i N i f i [149;157) 153 2 5 0,04 6,80 534,1 1068,2 [157;165) 161 8 9 0,18 28,62 228,3 1826,8 [165;173) 169 7 16 0,16 26,29 50,6 354,0 [173;181) 177 11 24 0,24 43,27 0,8 8,7 [181;189) 185 10 34 0,22 41,11 79,0 790,1 [189;197) 193 7 40 0,16 30,02 285,2 1996,6 45 media 176,11 Varianza 137,4 Desv. Standard 11,7 9

Revisando los resultados el grupo B tiene menor dispersión que el grupo A COEFICIENTE DE ASIMETRÍA Karl Pearson (1895) desarrolló una medida para evaluar el sesgo de una distribución, denominada coeficiente de asimetría (C. A). Ejemplo: En un hospital se midieron los tiempos de estadía en la unidad de tratamiento intensivo, el resultado se organizó en una tabla de distribución de frecuencias, la media fue de 28 días, la mediana de 25 días y la moda de 23 días, se calculó una desviación estándar de 4,2 días. Al calcular el coeficiente de asimetría el resultado obtenido es de 2,14 se encuentra entre -3 y 3, en este caso el valor e indica un grado importante de asimetría con sesgo positivo. OTRAS MEDIDAS DE DISPERSIÓN PERCENTILES Cuando se tiene una muestra de valores perteneciente a una variable continua, se pueden ordenar los valores de menor a mayor y de acuerdo a la posición de cada valor numérico, se puede determinar el porcentaje de elementos (valores) que son menores o mayores a un determinado punto de corte, por lo tanto, cuando se habla de percentiles, se está dividiendo la muestra de datos en 99 puntos de corte que dividen a la población en 100 partes de igual frecuencia. Ejemplo: Si x es 30 y n es 50, entonces el percentil 30 (P 30 ) es un número tal que garantiza que en la muestra un 30% (15 observaciones) son menores que (P 30 ) y un 70% (35 observaciones) son mayores a (P 30 ). Algunos casos particulares son: 10

CÁLCULO DEL PERCENTIL EN DATOS AGRUPADOS La fórmula para el cálculo del percentil es la siguiente: 11

Ejemplo 1: Considérese el siguiente cuadro de distribución, correspondiente a los pesos de un grupo de mujeres: Para encontrar, por ejemplo, el percentil 72 (P 72 ): 12

Consideremos el problema inverso, es decir, se conoce el percentil y queremos determinar qué porcentaje de las observaciones es menor o mayor que él. En el ejemplo anterior de los pesos del grupo de mujeres, se quería determinar, qué porcentaje de ellas pesa menos de 77 kg. Pero al mirar la tabla de frecuencias, el resultado no es tan directo y se tiene que encontrar el intervalo en donde se encuentra el peso (77 kg), es decir i = 4, de este intervalo y aplicando la fórmula, se desprende que: Esto quiere decir que el 69,7% de las mujeres pesa menos de 77 kg. CUARTILES Cuando se habla de cuartiles la definición se basa en los percentiles, ya que los cuartiles generan 3 puntos de corte que dividen el conjunto de datos en cuatro grupos con la misma frecuencia (Pagano, 2011). 13

El primer cuartil Q1 es el valor que corresponde al punto por debajo del cual se encuentra el 25% de las observaciones, el segundo cuartil Q2 corresponde a la mediana, es decir separa el 50% superior de un conjunto de observaciones, del 50% inferior, el tercer cuartil Q3, corresponde al punto que acumula al 75% de las observaciones. La amplitud intercuartil es la diferencia entre el tercer (Q3) y el primer cuartil (Q1). DIAGRAMA DE CAJA El diagrama de caja permite resumir la dispersión de los datos en una gráfica. Ejemplo: Considérense los salarios mensuales de una muestra de 12 egresados de la Escuela de Administración. $550.000 $678.000 $348.000 $923.000 $346.000 $335.000 $890.000 $467.000 $420.000 1.100.000 $490.000 $365.000 El primer paso es ordenar los valores: $335.000 $346.000 $348.000 $365.000 $420.000 $467.000 $490.000 $550.000 $678.000 $890.000 $923.000 $1.100.000 Cálculo de estadígrafos descriptivos: mínimo mediana media máximo $335.000 $478.500 $576.000 $ 1.100.000 14

Diagrama de caja para la variable ingreso 15

COEFICIENTE DE VARIACIÓN El coeficiente de variación es una estandarización de la desviación estándar y su principal utilidad es que permite comparar la variabilidad de dos conjuntos de observaciones en distintas escalas de medidas. Cuando las variables de dos distribuciones se expresan en unidades diferentes (años, centímetros, toneladas, entre otros) no tiene sentido comparar algunos de los estadígrafos de dispersión, pues estos quedan influenciados por el valor numérico de dichas unidades. Esta dificultad se puede superar mediante el coeficiente de variación (Pagano, 2011). Es importante considerar que el coeficiente de variación (C.V.) es una medida muy útil cuando: 1. Los datos están en unidades diferentes (como dólares y días de inasistencia). 2. Los datos están en las mismas unidades, pero las medias muy distantes (como sucede con los ingresos de los ejecutivos y los ingresos de los empleados no calificados). 3. Cuando se desea comparar la variabilidad de dos conjuntos de datos. A continuación, se presentarán las fórmulas que se utilizan para el cálculo del coeficiente de variación con datos no agrupados y agrupados FÓRMULAS PARA DATOS NO AGRUPADOS Y AGRUPADOS Caso población: Caso muestra: El valor del coeficiente por definición se encuentra entre: Ejemplo: Considérese el caso anterior de las estaturas (en centímetros) de dos grupos de varones. En qué grupo hay mayor dispersión de estaturas? 16

Ejemplo de cálculo del coeficiente de variación: En una empresa se desea comparar la variación en los ingresos mensuales de los ejecutivos y los ingresos mensuales de los trabajadores no calificados. Se obtiene una muestra de ejecutivos El resultado de la muestra de trabajadores no calificados es: Un error muy común es afirmar que hay mayor dispersión en los ingresos mensuales de los ejecutivos comparando la desviación estándar $50.000 > $1.200 sin embargo, las medias están tan distantes que se necesitan convertir a un coeficiente para efectuar una comparación significativa de la variación en los ingresos mensuales. Conclusión: Para los ejecutivos, C.V = 10% y para los trabajadores no calificados; C.V = 10% No existe diferencia entre la dispersión relativa de sueldos de los ejecutivos y los trabajadores no calificados. 17

COMENTARIO FINAL Durante esta semana aprendimos a calcular las distintas medidas de dispersión tanto para datos No agrupados como para datos agrupados, cuando la medida de las variables es la misma utilizaremos la desviación estándar como el estadígrafo para realizar el análisis e interpretación de resultados, ya que no cambia la magnitud de la variable, a diferencia de la varianza cuyos valores y obviamente las unidades respectivas se encuentran al cuadrado, además deben recordar que cuando la unidad de las medidas es distinta el mejor estadígrafo que podemos utilizar es el coeficiente de variación, otra de las medidas que podemos aplicar con bastante frecuencia es el cálculo de los percentiles, ya que si quisiéramos saber el porcentaje de casos que se encuentra sobre o bajo un determinado valor, nuestra respuesta tiene que estar relacionada con aplicar la fórmula del cálculo de percentil. 18

REFERENCIAS Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadística para administración y economía (10ª edición). Cencage Learning Canavos, George. (1988). Introducción y estadística descriptiva. Probabilidad y estadística. México: McGraw-Hill/Interamericana S. A. Pagano, Robert R. (2011). Estadística para las ciencias del comportamiento (9ª edición). Cencage Learning. Karl Pearson (1857-1936) PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE: IACC (2012). Estadística. Semana 4. 19