Medidas de Posición n y. Boxplot Lección n 11 Secc Prof. Pedro A. Torres ESMA febrero de Prof. Pedro A. Torres, ESMA 3015 UPRM

Documentos relacionados
MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Procedimiento "Explorar..."

Exploración de datos

Datos cuantitativos. Método tabular

DESCRIPCIÓN DE DATOS. Medidas Numéricas

Medidas de Tendencia Central.

Dr. Abner A. Fonseca Livias

Estadística ESTADÍSTICA

Tema 4. Herramientas de representación gráfica

RELACIÒN ENTRE LOS PROMEDIOS

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Módulo de Estadística

Estadística Descriptiva

Medidas de Tendencia Central, Medidas de Dispersión & Otros Estadísticos (Cap. 2) Math. 298 Prof. Gaspar Torres Rivera

PRÁCTICAS DE ESTADÍSTICA CON R

Estadística Descriptiva 2da parte

Construcción de Gráficas en forma manual y con programados

Medidas de Posición Preparado por: Dra. Noemí L. Ruiz Limardo 2007 Derechos de Autor Reservados Revisado 2010

Curso de Estadística Unidad de Medidas Descriptivas. Lección 7: Medidas de Posición para Datos Crudos

Tema 3: Estadística Descriptiva

CUARTIL Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.

Estadística Aplicada

Tema 2 Estadística Descriptiva

Estadística y Diseño de experimentos. PRÁCTICA No. 1. Estadística Descriptiva

Práctica 4 de Estadística

Apuntes de Estadística

2 Pasos en un estudio estadístico.

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA UNIDIMENSIONAL

Estadística. Análisis de datos.

COMPARACIÓN Y REPRESENTACIÓN DE DATOS

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

ÁREAS DE LA ESTADÍSTICA

ESTADÍSTICA APLICADA I

INTRODUCCIÓN AL MANEJO DE STATGRAPHICS

Bioestadística: Estadística Descriptiva

Medidas de posición relativa

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS

Estadísticas Elemental Tema 3: Describir, Explorar, y Comparar Data

UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ DEPARTAMENTO DE MATEMATICAS PRIMER EXAMEN DE ESMA EDGAR ACUNA Stre. 97-I NOMBRE...

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Estadística Descriptiva en SPSS

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Conceptos de Estadística

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

DIAGRAMAS DE CAJA. Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Estadísticas Elemental Medidas de dispersión 3.1-1

PRIMER SIMPOSIO LATINOAMERICANO PARA LA INTEGRACIÓN DE LA TECNOLOGÍA EN EL AULA DE MATEMÁTICAS Y CIENCIA. 9, 10 y 11 de julio

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

Curso de Estadística Aplicada a las Ciencias Sociales

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

El Método Científico. Metodología de Investigación. Te sifón Parrón

Estadística para el análisis de los Mercados S2_A1.1_LECV1

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

MEDIDAS DE CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN. Matemáticas PAI 5 (4ºESO)

3 ANALISIS DESCRIPTIVO DE LOS DATOS

DIAGRAMAS DE CAJAS Y BIGOTES Abel MARTÍN. Profesor de Matemáticas del IES de Llanera (Asturias)

IMADIL /10/2014

PROBABILIDAD. Unidad I Ordenamiento de la Información

CUARTILES, DIAGRAMA DE CAJA Y BIGOTES, DECILES Y PERCENTILES CON EXCEL Y CON GEOGEBRA

Estadística Aplicada a la Educación

Tema 1: Análisis de datos univariantes

Guía de Matemática Cuarto Medio

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Análisis de Datos. Liza V. Rodríguez INTER CAMMC Matemática 4-6. Profa. Liza V. Rodríguez

Julio Deride Silva. 27 de agosto de 2010

Medidas de posición relativa

QUÉ ES EL RATING TELEVISIVO? Adriana Rabino

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

Distribuciones de Frecuencia

Estadística aplicada a la comunicación

Estadística Inferencial. Estadística Descriptiva

Origen de la Estadística. Ejercicio de estadística 13/05/2015. Víctor Cuchillac (papá) Definiciones de Estadística. Definiciones de Estadística

Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Medidas de posición para variables cuantitativas

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Los estadísticos descriptivos clásicos (Robustez)

Tema 3: Gráficas estadísticas 1.1-1

4. Medidas de dispersión

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Curso de Estadística Básica

CUARTO DE ESO. MATEMÁTICAS A

Estadística Descriptiva I

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA

TEMA 1 Estadística Descriptiva. Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión

INSTITUCIÓN EDUCATIVA NUESTRA SEÑORA DEL PALMAR SEDE LICEO FEMENINO GUÍA DE ESTADÍSTICA GRADO DÉCIMO

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

1 POBLACIÓN Y MUESTRA

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

Estadística Descriptiva

Cuartiles, deciles y percentiles.

Transcripción:

Medidas de Posición n y 90 80 70 60 Boxplot of AGE Boxplot Lección n 11 Secc.. 2.6 Prof. Pedro A. Torres ESMA 3015 AGE 50 40 30 20 febrero de 2007

Objetivos Definir una medida de posición. Conocer y aprender a calcular las medidas de posición más usadas. Analizar un conjunto de datos usando las medidas de posición. Construir un boxplot e interpretarlo.

Medidas de Posición Son valores numéricos que describen la posición que tiene un dato o valor específico con respecto a todos los datos. Los más usados son los cuartiles y los percentiles. Cuartiles Son los valores que dividen los datos en cuatro partes iguales (cuartos). El primer cuartil (Q 1 ) es el valor tal que el 25% de los datos son menores a él. El segundo cuartil (Q 2 ) es el valor tal que el 50% de los datos son menores a él (la mediana). El primer cuartil (Q 3 ) es el valor tal que el 75% de los datos son menores a el. Los datos deben estar ordenados de menor a mayor 25% 25% 25% 25% Q 1 Q 2 Q 3

Percentiles Medidas de Posición Son los valores que dividen los datos en cien partes iguales. El percentil k (se escribe P k ) es el valor tal que el k% de los datos son menores a él. Contrariamente, el (100-k)% de los datos son mayores a este valor. Por ejemplo, si en la variable peso el percentil 13 es igual a 110 libras, esto indica que el 13% de las personas tienen un peso menor a 110 libras. Notas: El cuartil 1, Q 1, es el mismo P 25. El cuartil 2, Q 2, es el mismo P 25. Ambos son iguales a la mediana. El cuartil 3, Q 3, es el mismo P 75. 1% 1% 1% 1% 1% 1% 1% Min. P P 1 2 P 3 P 4 P 5 P 98 98 P 99 99 Máx.

Procedimiento para calcular un percentil k P k Objetivo: hallar el valor del percentil identificando el número de dato que corresponde al percentil que se quiere buscar. Ordene los datos de menor a mayor. Calcule nk/100. - Si el número anterior (nk/100) es un decimal, aproxime al siguiente número. El dato correspondiente a este número es el P k. - Si el número (nk/100) es un entero entonces el P k es igual al promedio del dato correspondiente a este número y el siguiente dato.

Ejemplo Calcule los cuartiles (Q1, Q2 y Q3) y los percentiles 15 y 65 de los siguientes datos de edades: 37, 54, 15, 25, 30, 68, 26, 23, 25, 26, 27, 24 1. Ordene los datos: 15, 23, 24, 25, 25, 26, 26, 27, 30, 37, 54, 68 2. Calcule nk/100: n = 12 Percentil (k) nk/100 EL percentil es igual a: Valor del Percentil 15 1.8 Dato 2 P 15 = 23 25 (Q1) 3 Promedio entre el dato 3 y 4 P 25 =24.5 50 (Q2, mediana) 6 Promedio entre el dato 6 y 7 P 50 =26 65 7.8 Dato 8 P 65 =27 75 (Q3) 9 Promedio entre el dato 9 y 10 P 75 =33.5 Interpretación: por ejemplo, el P 65 =27, indica que el 65% de las personas tienen edades menores a 27 años.

Otras medidas Cuartil medio: Esta es otra medida de tendencia central. Es el promedio entre Q 1 y Q 3 : Q 1 + Q3 Cuartil medio = 2 Ejemplo: siguiendo con los datos del ejemplo anterior: 24.5 + 33.5 Cuartil medio = = 29 2 La interpretación de esta medida es similar a un promedio. Sin embargo, su uso es limitado en la práctica. Rango Inter-cuart cuartílico: Esta es otra medida de dispersión. Es la diferencia entre Q 3 y Q 1 : Ejemplo: Rango IQ = 33.5 24.5 = 9 Rango IQ = Q3 Q1 Valores grandes indican mayor dispersión o variabilidad en los datos.

Resumen con cinco medidas Algunas veces se analiza la distribución de los datos usando cinco medidas importantes: 1. El mínimo 2. Q 1 o el P 25 3. La mediana 4. Q 3 o el P 75 5. El máximo Ejemplo: 15 24.5 26 33.5 68 Mínimo Q1 Mediana Q3 Máximo

Boxplot Es un diagrama con una caja y bigotes que representa las cinco medidas anteriores. Se construye de la siguiente manera: El ancho de la caja esta definido por el rango inter-cuartílico (Q1 y Q3). A mayor amplitud de la caja, mayor variabilidad en los datos. Del centro de la caja salen dos segmentos, uno hasta el mínimo y el otro hasta el máximo. Estos segmentos representan los datos que están por fuera del rango inter-cuartílico. Dentro de la caja se dibuja una línea horizontal la cual indica la mediana de los datos. Algunas veces, los outliers son representados por símbolos especiales (*, +, etc). EDAD 70 60 50 40 30 20 10 Media (opcional) Boxplot of EDAD Outliers Máximo* Q 3 Mediana Q 1 Mínimo *Cuando existen outliers, los valores extremos (mínimo y máximo) se seleccionan sin tener en cuenta los outliers. En Minitab, se hacen usando el menú Graph Boxplot. Esta opción permite personalizar bastante el diagrama.

Interpretaciones del Boxplot Una buena forma de ver como se interpreta el boxplot es comparándolo con un histograma Histogram of CHOLESTEROL Boxplot of CHOLESTEROL 70 900 60 800 50 700 Frequency 40 30 20 CHOLESTEROL 600 500 400 300 10 200 0 150 300 450 CHOLESTEROL 600 750 900 100 0 Histograma sesgado a la derecha. Concentración alrededor de 200. Presencia de outliers. Los asteriscos indican que hay outliers. El bigote largo hacia arriba y la línea que divide la caja más hacia abajo (mediana alrededor de 200) indica sesgo a la derecha.

Interpretaciones del Boxplot Otra comparación para una distribución mas cercana a la simetría. Histogram of FAT Boxplot of FAT 60 250 50 200 40 Frequency 30 20 FA T 150 100 10 50 0 30 60 90 120 FA T 150 180 210 240 0 Histograma más concentrado alrededor de un valor (70-80), pero con cierto sesgo a la derecha. Presencia de outliers. Los asteriscos indican que hay outliers. Los bigotes casi simétricos indican una distribución cercana a la simetría. Hay un ligero sesgo a la derecha.

Interpretaciones del Boxplot El boxplot es una herramienta valiosa para comparar la distribución de dos o más grupos. 25 Histogram of CHOLESTEROL 150 300 450 1 2 600 750 900 900 800 Boxplot of CHOLESTEROL vs SEX 20 700 Percent 15 10 5 CHOLESTEROL 600 500 400 300 200 0 150 300 Panel variable: SEX 450 600 750 900 CHOLESTEROL 100 0 1 SEX 2 Mediante un histograma, muchas veces es difícil decidir que grupo es más disperso o cual es superior. En este caso, el boxplot permite visualizar dos aspectos relevantes: Los datos de colesterol en los hombres (Sex=1) presentan mayor variabilidad que en las mujeres (caja más ancha). Los niveles de colesterol Prof. Pedro tienden A. Torres, a ESMA ser mayores 3015 en los hombres (caja y mediana más altas).

Ejercicio usando Minitab Con la base de datos Retinol_Plasma, abrir Minitab y crear el siguiente boxplot. Use la opción Graph Boxplot Within Groups. 50 45 40 Boxplot of QUETELET vs USOVITAMINAS Para personalizar la información que muestra el boxplot use la opción Data View. Seleccione las siguientes opciones: QUETELET 35 30 25 20 15 1=SI,FRECUENTEMENTE 2=SI,OCASIONALMENTE USOVITAMINAS 3=NO Qué puede concluir acerca del Índice de Masa Corporal (Quetelet( Quetelet) entre los diferentes usos de vitaminas?

Lo que vimos: Las diferentes medidas de posición y cómo calcularlas. Interpretación de las medidas de posición. Uso del boxplot para analizar distribuciones de variables individualmente y comparando grupos. Como generar los boxplots usando Minitab.

Bibliografía Just the Essentials of Elementary Statistics, Robert, Johnson, Novena Edición, International Thomson (ISBN: 0-534-99945-X). Recomendaciones: Leer las sección 2.6 del libro.