PRESENTACIÓN N DEL AED

Documentos relacionados
Los estadísticos descriptivos clásicos (Robustez)

Módulo de Estadística

ESTADÍSTICA DESCRIPTIVA

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Estadística aplicada al Periodismo

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

3.2. Desviación Media

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

IMADIL /10/2014

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

CLASIFICACIÓN DE LA ESTADÍSTICA

Estadística Descriptiva en SPSS

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

Técnicas Cuantitativas para el Management y los Negocios

TEMA 1: ESTADISTICA DESCRIPTIVA

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

Escala Nominal Permite la clasificación de individuos según escala cualitativa. Ejemplo: Estado civil, profesión, sexo,...

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Análisis descriptivo y exploratorio de datos

Análisis Exploratorio de Datos Resumen gráfico y numérico

Tema 1 Estadística descriptiva: Medidas de posición

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos

Estadística Aplicada. Tema 2: Estadísticos. Universidad Autónoma de Cd. Juarez Tema 2: Estadísticos 1

2.2: Resumen numérico

ESTADÍSTICA 1.- NOCIONES GENERALES

LECCIÓN PÚBLICA. Tema 2 Medidas de Tendencia Central, Posición y Variabilidad. Profa. María Fátima Dos Santos

UNIDAD 7 Medidas de dispersión

Estadística Descriptiva. Tema 1: Estadísticos 1

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

Estadística. Tema 2: Estadísticos. Dagoberto Salgado Horta Tema 2: Estadísticos 1

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Estadística con R. Nivel Básico

DESCRIPCIÓN DE DATOS. Medidas Numéricas

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

CLASE 2 INTRODUCCION A LA ESTADISTICA

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Análisis descriptivo y exploratorio de datos

Tema 3: Estadística Descriptiva

Estadística I. Finanzas y contabilidad

TEMA 5 Estadística descriptiva. Análisis de datos

Estadística aplicada a la comunicación

LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES

LABORATORIO DE REFUERZO PRIMER PARCIAL (2015) GANARE MI PRIMER PARCIAL (UNIREFORZANDO)

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

Medidas de dispersión

ESTADÍSTICA Camerina Laura Ramírez Gallegos

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

DEPARTAMENTO DE SOCIOLOGÍA I. Curso

Estadística Aplicada a la Educación

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Estadística para el análisis de los Mercados S2_A1.1_LECV1

ANÁLISIS DE DATOS UNIDIMENSIONALES

Métodos Estadísticos de la Ingeniería Práctica 2: Estadística Descriptiva

Tema 4. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DE DISPERSIÓN Y DE FORMA

Estadística Descriptiva 2da parte

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

Estadís-ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 1. Estadís-ca descrip-va

EL ENFOQUE DEL ANÁLISIS EXPLORATORIO DE DATOS

Julio Deride Silva. 18 de agosto de 2010

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

Temas de Estadística Práctica

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Guía de Matemática Cuarto Medio

478 Índice alfabético

MEDIDAS DE CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN. Matemáticas PAI 5 (4ºESO)

Medidas Descriptivas Numéricas

Resumenes númericas de una muestra II: medidas basadas en momentos

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

TEMA: 13 y 14 ESTADÍSTICA 3º ESO

Estadística Aplicada

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Tema 1. Estadística Unidimensional

Se quiere medir la dispersión de una muestra a través de su localización. En primer lugar, definimos una medida relacionada con la media.

Instrumentos y matriz de datos

1 de 12 15/07/ :49

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 8. ESTADÍSTICA

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

Temas 2 y 3. Análisis Exploratorio de Datos Grado en Estadística y Empresa 2012/2013

Prueba de Evaluación Continua

Estadística Inferencial. Estadística Descriptiva

Bioestadística: Estadística Descriptiva

Estadística ESTADÍSTICA

Estadística Básica 1er Cuatrimestre 2012

Probabilidad y Estadística, EIC 311

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

Estadística Descriptiva 2da parte

Curso de Estadística Aplicada a las Ciencias Sociales

Universidad Mariano Gálvez Estadística y probabilidad para Ingeniería Sección B. Presenta Dra. En Ing. Rita Victoria de León Ardón

ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS CON LA HOJA DE CÁLCULO EXCEL

Transcripción:

PRESENTACIÓN N DEL AED Inicio del AED: John Tukey (1977) Nuevas técnicas t gráficas y analísticas Perspectiva exploratoria EDC frente al AED EDC Recoge, Ordena, representa Tabla: agrupa Datos. Gráficos Estadísticos Basados en: Distancia (media y varianza) Datos centrados en la media AED Detectar anomalías o errores Nuevas técnicas gráficas Estadísticos: Resistentes Robustos Basados en el Orden y Centrados en la mediana

Inconvenientes de la estadística stica clásica a) Parte de hipótesis difíciles de verificar b) Supone errores repartidos alrededor de un valor central c) Uso exclusivo de modelos lineales (relación entre variables) AED: : nuevo enfoque metodológico, cuyo objetivo es entender el análisis de los datos.

En distribuciones univariantes,, el AED nos informa sobre: a) Localización, desviación n y forma de la distribución n de los datos. b) Número N y localización n de agujeros y puntas. c) Presencia y número n de valores alejados.

Componentes principales del AED 1) Representaciones gráficas *) Steam and leaf (Tronco y hojas) *) Boxplots (Diagrama de cajas) Detectan el conjunto de índices descriptivos. 2) Análisis de datos Diferencias entre datos observados y valores ajustados. (RESIDUOS) Modelos de ajuste (no lineales) 3) Transformación n de datos Simplificación n del análisis. Uso de funciones matemáticas ticas simples como raíz z cuadrada y logaritmo. 4) Resistencia Valores de datos extraños no influyen en los resultados de un análisis. 5) Robustos Busca estadísticos sticos poco sensibles a desviaciones.

Campos de aplicación - Ciencias Sociales - Ciencias Humanas - Ciencias de la Salud.PSICOLOGÍA (tendencias, patrones de conductas, formación n de actividades ).HISTORIA y LINGÜÍ ÜÍSTICA (descubrir indicadores de cambio histórico o lingüí üístico).economía, SOCIOLOGÍA A y PEDAGOGÍA (empleo de técnicas t del AED antes de confirmar modelos).medicina (revelaciones en investigación ).EMPRESAS (rendimiento de plantilla, control de calidad ) Conclusión El AED no es solo un complemento a las técnicas t de la EDC, sino que es una alternativa en caso de incumplimiento de alguna condición n de aplicación, pues no es tan restrictivo en sus supuestos. MEJOR CALIDAD DE ANÁLISIS DE DATOS GLOBALMENTE.

ORGANIZACIÓN, N, REDUCCIÓN N Y REPRESENTACIÓN N DE DATOS ÍNDICES DEL AED El AED desarrolla unos nuevos índices descriptivos basados en la mediana y en los parámetros de forma y posición. Índices Descriptivos AED Localización Estadística stica Clásica Medidas de posición n y tendencia central Dispersión Forma Medidas de dispersión Medidas de forma (simetría a y curtosis)

Lo que llamamos muestra en EDC lote (batch) en AED. Vamos a considerar el siguiente ejemplo con dos lotes: LOTE 1 LOTE 2 10 10 10 10 11 11 12 12 12 12 13 13 14 14 15 15 15 15 15 15 16 16 18 18 19 57 Ejercicio: Calcular los estadísticos sticos clásicos: media, mediana, moda, varianza, simetría a y curtosis.

LOTE1 LOTE2 N Válidos 13 13 Perdidos 0 0 Media 13,85 16,77 Mediana 14,00 14,00 Moda 15 15 Varianza 8,141 151,859 Asimetría,310 3,368 Error típ. de asimetría,616,616 Curtosis -,688 11,774 Error típ. de curtosis 1,191 1,191 A primera vista, los únicos valores no afectados por valores extremos son la media y la moda, que serán n las más m s utilizadas en el AED. La media está basada en todos los datos del lote A veces nos interesa sabes cómo c están n centrados los datos y cuando encontramos valores extremos o outliers (en este caso, la media no es representativa, y utilizamos la mediana). Además, la media se usa bajo condiciones de normalidad, cosa que no es necesaria para la mediana. Por tanto, si hay casos extremos uso la mediana y sino los hay uso la media.además s si hay normalidad uso la media y en otro caso la mediana.

Índices de Localización Al pretender buscar estimadores robustos, usamos los centiles o percentiles,, pues no se ven afectados por valores extremos. Ejercicio: Calcular los percentiles 10, 25, 50,75 y 90

Estadísticos N Percentiles Válidos Perdidos 10 25 50 75 90 LOTE1 LOTE2 13 13 0 0 10,00 10,00 11,50 11,50 14,00 14,00 15,50 15,50 18,60 41,40 El único afectado a primera vista es el percentil 90. Dentro de los índices de localización, vamos a ver los siguientes:

Promedio de cuartiles (Q ) Hace un promedio entre los 2 cuartiles centrales que recoge el 50% de los datos C Q = 25 + C75 Q1 + Q3 Q recoge el 50% de los datos, eliminando la influencia de los valores extremos. Para el lote 1 y para el lote 2 Q = 13, 5 Q = 13,5 Trimedia (TRI) C25 + C75 M M Q d + d + 2 C25 + 2M d + C TRI = = = 2 2 4 2 = 2 75 TRI elimina el 25% de observaciones en cada extremo (eliminando así casos extremos) Para el lote 1 TRI = 13,75, y para el lote 2, TRI = 13,75

Centrimedia o media intercuartílica (MID) MID = x c + + K+ n i x 25 1 75 c 1 Elimina valores repetidos y valores extremos que no nos interesan (promedia datos entre el cuartil 25 y el 75, sin incluirlos). En el cálculo c no deben incluirse los valores repetidos, y debe procurarse que el número n de éstos a un lado y otro de la Md sean los mismo, es decir, ni debe ser un número n impar (se puede incluir uno de los valores repetidos en el lado que presente menos). En estos índices destaca el uso del 50% central de los datos, y en especial de la Md. Si los valores se hallan agrupados, el valor de ésta será muy semejante al de la media aritmética tica clásica, sin embargo en caso de valores muy alejados la Md reflejará mejor el valor promedio del grupo.

Pasos para calcular la centrimedia 1º.. Calcular los cuartiles 25 y 75, y colocar la muestra entre estos, sin coger sus valores. 2º.. Eliminamos un dato de cada extremos (si están n repetidos). 3º Si hubiera algún n valor extremos que se repite también n lo eliminamos (Se procura que el número n de datos sea par, y que no haya valores repetidos.)

Índices de Dispersión Amplitud intercuartílica (IQR) IQR = c75 c25 Es más m s resistente que la desviación n típica t y más m s fácil f de calcular, y nos indica el 50 % de los casos que hay. Se usa para comparar lotes y hacer transformaciones de variables. Lote 1 Lote 2 IQR = 4 IQR = 4

Mediana de las desviaciones absolutas (MAD) Pasos: MAD = Md ( xi Md ) 1º) ) Cálculo C Md 2º) ) Calcular xi Md 3º) ) Reordenar los datos 4º) ) Calcular la nueva Md MAD Ejercicio: Calcular la MAD de los lotes 1 y 2

Coeficiente de variación intercuartílico Sirve para comparar distribuciones, y no está afectado por valores extremos: = IQR 2 = c c c 75 CV c Q c75 + 25 25 Lote 1 Lote 2 CV c = 0.15 CV c = 0.15 El que sea más m s alto, indica que hay más m s dispersión.

Índices de FORMA Índice de simetría a de Yule (H 1 ) (Mide la simetría a en el centro de la distribución) Interpretación: n: H 1 = c 25 + c75 2M H 1 = 0 Simetría H 1 > 0 Asimétrica positiva (sesgada derecha) H 1 < 0 Asimétrica negativa (sesgada izqda.) d 2M d Lote 1 Lote 2 H 1 = - 0.03 H 1 = -0.03

Índice de simetría a de Kelly (H 2 ) Mide la simetría a en las colas H 2 = M d c 10 + 2 c 90 Misma interpretación n que el índice de Yule. Juntando ambos índices obtenemos el siguiente: = c + c 2M H = 10 90 d 2 H 3 2M d M d Misma interpretación n que los otros dos.

Coeficiente de CURTOSIS K Indica el apuntamiento de la distribución. Compara la dispersión n entre el 90% de los casos centrales y la existente en el 50%. Interpretación: n: K 1 > 1 leptocúrtica (concentrada en el centro) K 1 = 1 mesocúrtica (normal) 1 = K 1 < 1 platicúrtica. c90 c10 1,9( c75 c25) Lote 1 Lote 2 K 1 = 1,13 K 1 = 4,13

Ejemplo Supongamos que conocemos las calificaciones en una asignatura por r un grupo de chicos y chicas: 2.1 5.0 6.1 8.7 2.2 4.0 5.0 7.5 2.2 5.0 6.5 8.7 2.3 4.0 5.2 7.5 2.7 5.0 7.2 8.8 2.5 4.2 5.3 8.2 3.2 5.0 7.3 8.8 2.9 4.3 5.5 9.0 3.5 5.0 7.5 9.2 3.0 4.4 5.6 10.0 3.7 5.1 7.5 9.2 3.5 4.5 6.0 10.0 4.0 5.2 7.7 9.5 3.5 5.0 6.0 10.0 4.0 5.3 8.2 10.0 3.5 5.0 6.0 5.0 5.4 8.4 10.0 3.7 5.0 6.2 1º) ) Calcular los estadísticos sticos tradicionales y los del AED.

N Media Moda Varianza Simetría Curtosis NIÑOS NIÑAS