2.2: Resumen numérico

Documentos relacionados
Estadística aplicada al Periodismo

Estadística I. Finanzas y contabilidad

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

Tema 4. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DE DISPERSIÓN Y DE FORMA

Técnicas Cuantitativas para el Management y los Negocios

Se quiere medir la dispersión de una muestra a través de su localización. En primer lugar, definimos una medida relacionada con la media.

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Análisis Exploratorio de Datos Resumen gráfico y numérico

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

LECCIÓN PÚBLICA. Tema 2 Medidas de Tendencia Central, Posición y Variabilidad. Profa. María Fátima Dos Santos

Tema 1. Estadística Unidimensional

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

3.2. Desviación Media

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Estadís-ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 1. Estadís-ca descrip-va

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

LABORATORIO DE REFUERZO PRIMER PARCIAL (2015) GANARE MI PRIMER PARCIAL (UNIREFORZANDO)

Julio Deride Silva. 18 de agosto de 2010

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

CLASE 2 INTRODUCCION A LA ESTADISTICA

TEMA 1: ESTADISTICA DESCRIPTIVA

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

Estadística Descriptiva 2da parte

Estadística I Tema 2: Análisis de datos univariantes

Curso de Estadística Aplicada a las Ciencias Sociales

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

15 PARÁMETROS ESTADÍSTICOS

IMADIL /10/2014

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

ESTADÍSTICA DESCRIPTIVA

UNIDAD 8. ESTADÍSTICA

Estadística aplicada a la comunicación

Módulo de Estadística

Asimetría Coeficiente de Asimetría de Fisher

Estadística ESTADÍSTICA

ESTADÍSTICA Camerina Laura Ramírez Gallegos

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Apuntes de Estadística

UNIDAD 7 Medidas de dispersión

Los estadísticos descriptivos clásicos (Robustez)

Tema 3: Estadística Descriptiva

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Medidas de dispersión

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41

ESTADÍSTICA. Rincón del Maestro:

El Método Científico. Metodología de Investigación. Te sifón Parrón

Estadística Aplicada a la Educación

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Medidas Descriptivas Numéricas

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Conceptos de Estadística

Tema 6 Descripción numérica (2) Curso de Estadística Aplicada a las Ciencias Sociales. 1. La mediana. Introducción. Tema 6. Descripción numérica (2)

DESCRIPCIÓN DE DATOS. Medidas Numéricas

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

UNIVERSIDAD DE SONORA

ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS CON LA HOJA DE CÁLCULO EXCEL

Estadística con R. Nivel Básico

Instrumentos y matriz de datos

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos

Estadística Descriptiva en SPSS

Probabilidad y Estadística, EIC 311

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

Estadística. Análisis de datos.

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

ESTADÍSTICA UNIDIMENSIONAL

Estadística descriptiva y métodos diagnósticos

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

TEMA 11: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA

ÁREAS DE LA ESTADÍSTICA

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Resumenes númericas de una muestra II: medidas basadas en momentos

Universidad Mariano Gálvez Estadística y probabilidad para Ingeniería Sección B. Presenta Dra. En Ing. Rita Victoria de León Ardón

Tema 3. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DE LOCALIZACIÓN

Momentos de una variable

Tema 1: Análisis de datos univariantes

Tabla de frecuencias Los datos obtenidos en estadística se organizan en una tabla, llamada tabla de frecuencias.

Y accedemos al cuadro de diálogo Descriptivos

Estadística Descriptiva 2da parte

1 de 12 15/07/ :49

PRESENTACIÓN N DEL AED

1 POBLACIÓN Y MUESTRA

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Transcripción:

2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas: Capítulos 2 a 6 del libro de Peña y Romo (1997) Capítulos 3 a 7 del libro de Portilla (2004)

Medidas Descriptivas Para qué nos sirven? Se pueden calcular todas con todo tipo de variables? Cuáles son las más adecuadas en cada caso? De qué forma podemos sacar partido a nuestra calculadora?

Medidas de localización Existen tres medidas comunes: la moda, la mediana y la media. Una muestra del número de años en el ayuntamiento de los últimos 24 alcaldes de Madrid 3 1 1 1 1 1 2 1 7 6 13 8 3 2 1 1 2 1 1 7 3 2 12 6

Es el valor más frecuente La moda Clase Frecuencia 1 10 2 4 3 3 4 0 5 0 6 2 7 2 8 1 9 0 10 0 11 0 12 1 13 1 y mayor... 0 Podemos calcular la moda con datos cualitativos? Tiene sentido esta definición con datos continuos? Puede haber más de una moda: bimodal-trimodal-plurimodal

La moda con datos (continuos) agrupados Ingresos y Derechos liquidados (millones de PTAS) Frecuencia absoluta 30 0 (30,45] 2 (45,60] 9 Tenemos una clase modal (60,75] 9 (75,90] 10 (90,105] 3 (105,120] 3 > 120 0 Total 60 Qué hacemos si las clases son de distinto tamaño?

Un valor exacta para la moda con datos agrupados El centro del intervalo modal La moda

La mediana Es la observación que ocupa el lugar central. 5 3 11 21 7 5 2 1 3 Qué valor toma la mediana? 1. Ordenamos los datos de menor a mayor. 2. Tenemos en cuenta también los que se repiten. 3. La mediana, es el CENTRO FÍSICO Cómo cambia el cálculo si N es par o impar? Podemos calcular la mediana para datos cualitativos?

Ejemplo de los alcaldes 3 1 1 1 1 1 2 1 7 6 13 8 3 2 1 1 2 1 1 7 3 2 12 6 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 6 6 7 7 8 12 13 La mediana es ½*(2+2)=2

La mediana a través de la tabla de frecuencias (datos discretos) Mediana x i n i N i f i F i 1 10 10 0,41666667 0,41666667 2 4 14 0,16666667 0,58333333 3 3 17 0,125 0,70833333 4 0 17 0 0,70833333 5 0 17 0 0,70833333 6 2 19 0,08333333 0,79166667 7 2 21 0,08333333 0,875 8 1 22 0,04166667 0,91666667 9 0 22 0 0,91666667 10 0 22 0 0,91666667 11 0 22 0 0,91666667 12 1 23 0,04166667 0,95833333 13 1 24 0,04166667 1 y mayor... 0 24 0 1 <0,5 >0,5

La mediana con datos agrupados Ingresos n i N i f i F i 30 0 0 0 0 (30,45] 2 2 0,05555556 0,05555556 Intervalo mediano (45,60] 9 11 0,25 0,30555556 (60,75] 9 20 0,25 0,55555556 (75,90] 10 30 0,27777778 0,83333333 (90,105] 3 33 0,08333333 0,91666667 (105,120] 3 36 0,08333333 1 > 120 0 36 0 1 Total 36 1

La media La media o media aritmética es el promedio de todos los datos de la muestra. Para el ejemplo de los alcaldes, la suma de los datos es: 3 + 1 + 1 + 1 + 1 + 1 + 2 + 1 7 + 6 + 13 + 8 + 3 + 2 + 1 + 1 2 + 1 + 1 + 7 + 3 + 2 + 12 + 6 = 86 Luego, la media es 86/24 3,583 años. Podemos calcular la media para datos cualitativos?

La media a través de la tabla de frecuencias (datos discretos) x i n i n i * x i 1 10 10 2 4 8 3 3 9 4 0 0 5 0 0 6 2 12 7 2 14 8 1 8 9 0 0 10 0 0 11 0 0 12 1 12 13 1 13 y mayor 0 0 Total 24 86 3,58333333

La fórmula Estadística Aplicada

La media con datos agrupados Ingresos x i n i x i *n i <= 30 22,5 0 0 (30,45] 37,5 2 75 (45,60] 52,5 9 472,5 (60,75] 67,5 9 607,5 (75,90] 82,5 10 825 (90,105] 97,5 3 292,5 (105,120] 112,5 3 337,5 > 120 127,5 0 0 Total 36 2610 72,5 Es la misma fórmula pero usando la marca de clase.

Otros puntos de la distribución: mínimo, máximo y cuartiles Ordenando los datos, el mínimo y máximo son fáciles de calcular. 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 6 6 7 7 8 12 13 Y los cuartiles? 1er cuartil = (1+1)/2 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 6 6 7 7 8 12 13 3er cuartil = (6+6)/2 2º cuartil = mediana = (2+2)/2

Cálculo de cuartiles Tenemos el siguiente conjunto de datos: 47 52 52 57 63 64 69 71 72 72 78 81 81 86 91 1. Ordenamos los datos de menor a mayor. 2. Calculamos c 2, que ocupa la posición correspondiente a la mitad, con qué parámetro visto ya coincide este segundo cuartil? 3. Ahora calculamos, la mitad de la primera parte: c 1. 4. Y la mitad de la segunda parte: c 3.

c2 = 71 47 47 52 52 52 52 57 57 63 63 64 64 69 69 c1 = 60 71 71 71 72 72 72 72 78 78 81 81 81 81 86 86 91 91 c3 = 79,5

Medidas de dispersión Existen varias medidas: El rango El rango intercuartilico La desviación típica El coeficiente de variación Lecturas recomendadas: Capítulos 4 y 5 del libro de Peña y Romo (1997) Capítulos 6 y 7 del libro de Portilla (2004)

El rango intercuartílico El rango y el rango intercuartílico Box-and-Whisker Plot Calculamos el rango y rango intercuartílico en los ejemplos anteriores. 47 57 67 77 87 97 Cuál de los dos es más sensible a datos atípicos? El rango $ $ Notar que en este ejemplo no hay valores atípicos.

La varianza y la desviación típica Podemos mirar las distancias de las observaciones de la media Empresa A x i - X Empresa B x i - X 30700-2800 27500-6000 32500-1000 31600-1900 32900-600 31700-1800 33800 300 33800 300 34100 600 34000 500 34500 1000 35300 1800 36000 2500 40600 7100 Cuánto suman estas dos nuevas columnas?

Entonces, la distancia media no nos vale como medida de dispersión. Cómo podemos resolver el problema?

La varianza Es la distancia cuadrada media Empresa A Empresa B 30700 7840000 27500 36000000 32500 1000000 31600 3610000 32900 360000 31700 3240000 33800 90000 33800 90000 34100 360000 34000 3240000 34500 1000000 35300 250000 36000 6250000 40600 50410000 16900000 96840000 2414285,7 13834285,7 Qué unidades tiene este nuevo estadístico? Podemos cambiarlas?

La desviación típica Es la raíz de la varianza. Empresa A s = 1553,8 Empresa B s = 3719,4 Cuál es más sensible a atípicos: la desviación típica o el rango intercuartílico? Y si queremos una medida sin unidades?

El coeficiente de variación Cuando la media sea distinta de 0, podemos calcular una medida de dispersión normalizada. Nos permite comparar, porque no tiene unidades. Para qué nos sirve con una única base de datos? EJERCICIO: Analizamos el volumen de consultas durante el período de exámenes en 10 bibliotecas universitarias, y se comparan con las anotadas el año anterior. El % de incremento de consultas fue: 10.2 2.9 3.1 6.8 5.9 Son los datos homogéneos? 7.3 7.0 8.2 3.7 4.3

Medidas de forma Las medidas comunes son de asimetría y curtosis. Datos simétricos, asimétricos a la derecha y a la izquierda

El coeficiente de asimetría de Pearson CA=0 CA>0 CA<0 Simétrica Asimétrica derecha Asimétrica izquierda El coeficiente de asimetría de Fisher (cuando existe más de una moda):

Curtosis Podemos verlo gráficamente, comparando con la curva normal: El coeficiente de curtosis de Fisher CC = 0 (mesocúrtica) CC > 0 (leptocúrtica) CC < 0 (platicúrtica)

EJERCICIO: Cálculo de las medidas forma estudiadas. Trabaja con la siguiente base de datos (calificaciones de un grupo de alumnos): 100 112 88 105 100 102 98 113 102 87 93 93 117 100 98 92 100 117 97 100 83 67 76 100 106 117 89 83 100 109 109 93 105 108 104 63 81 109 100 98

Ejercicio (Pregunta de Examen) Se ha tomado una muestra aleatoria de 10 madrileños que están trabajando y se les ha preguntado cuántas horas de trabajo realizan habitualmente cada semana. Los resultados son: 40 40 35 50 50 40 40 60 50 35 Selecciona la respuesta correcta entre las siguientes: a) La moda y la mediana son iguales a 40, y la media es 44. b) La media y la moda son iguales a 40, y la mediana es 44. c) La media y la mediana son iguales a 40, y la moda es 44. d) Ninguna de las anteriores es correcta.

Ejercicio (Pregunta de examen) En el histograma de la izquierda se muestra el tiempo (en segundos) que 406 modelos de coches tardan en pasar de 0 a 100 km/h (aceleración), medido por un trabajador A. Para confirmar los resultados un segundo trabajador B realiza de nuevo la medición de la aceleración en los mismos coches (histograma de la derecha). Analizando estos resultados, cuál de las siguientes afirmaciones es correcta? 140 120 a) La aceleración media medida por A es claramente distinta de la aceleración media medida por B. b) La desviación típica de la aceleración medida por A es menor que la desviación típica de la aceleración medida por B. c) La varianza de la aceleración medida por B es menor que la varianza de la aceleración medida por A. 100 80 60 40 20 0 1 5 9 13 Aceleración 0 a 100 km/h (segundos) 17 21 25 29 33

Ejercicio (Pregunta de examen) Se desea estudiar el tiempo de duración de las ponencias de un portavoz político durante el año 2007/2008. Para ello se contabiliza el tiempo (en minutos) en cada una de las 34 veces que habló: Tiempo n i f i Cuál es aproximadamente el tiempo medio de las ponencias? a) 32.50 minutos b) 27.52 minutos c) 30.96 minutos d) 33.88 minutos (0-25] 6 0.18 (25-35] 13 0.38 (35-40] 13 0.38 (40-60] 2 0.06 Total 34 1

Ejercicio (Pregunta de examen) La tabla muestra las edades y el sexo de un grupo de ministros del gobierno. Nombre Sexo Ministerio Edad Bibiana Aído M Igualdad 33 Carme Chacón M Defensa 38 Ángeles González- M Cultura 44 Sinde Cristina Garmendia M Ciencia e innovación 47 Trinidad Jiménez M Sanidad y Política Social 47 José Blanco V Fomento 48 Ángel Gabilondo V Educación 60 Elena Salgado M Economía y Hacienda 60 Cuál de las siguientes afirmaciones es la correcta? a) El primer cuartil de las edades es 41 y el tercer cuartil es 54. b) El primer cuartil de las edades es 47 y el porcentaje de ministros varones es de 25%. c) El rango de edades es 33 y la frecuencia absoluta de mujeres es 6. d) La moda de las edades es de 60 y la media es 47.