Medidas Descriptivas Numéricas

Documentos relacionados
DIAGRAMAS DE CAJA. Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79

Módulo de Estadística

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

UNIDAD 7 Medidas de dispersión

TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

ESTADÍSTICA DESCRIPTIVA

Tema 1: Análisis de datos univariantes

Los estadísticos descriptivos clásicos (Robustez)

ESTADÍSTICA DESCRIPTIVA

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Probabilidad y Estadística, EIC 311

Medidas de Tendencia Central.

Tema 3: Estadística Descriptiva

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

Formas de una Curva de Frecuencias

Estadística Descriptiva

Estadística Descriptiva

Medidas de variabilidad (dispersión)

TEMA 1: ESTADISTICA DESCRIPTIVA

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

ANÁLISIS DE DATOS UNIDIMENSIONALES

M i. Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana.

68 Bioestadística: Métodos y Aplicaciones. curtosis<0 curtosis=0 curtosis>0. Figura 2.10: Apuntamiento de distribuciones de frecuencias

Guía de Matemática Cuarto Medio

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

Tema 5. Variables Aleatorias

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Estadística Descriptiva

Curso de Estadística Aplicada a las Ciencias Sociales

MEDIDAS DE TENDENCIA CENTRAL

Medidas de Posición n y. Boxplot Lección n 11 Secc Prof. Pedro A. Torres ESMA febrero de Prof. Pedro A. Torres, ESMA 3015 UPRM

ÁREAS DE LA ESTADÍSTICA

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

ESTADÍSTICA DESCRIPTIVA

Se quiere medir la dispersión de una muestra a través de su localización. En primer lugar, definimos una medida relacionada con la media.

Procedimiento "Explorar..."

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Estadística Inferencial. Estadística Descriptiva

Medidas de posición para variables cuantitativas

Estadística. Análisis de datos.

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7.

ESTADÍSTICA UNIDIMENSIONAL

El modelo de la curva normal. Concepto y aplicaciones

Seminari 1. Estadística CP

Bioestadística: Estadística Descriptiva

Z i

Curso de nivelación Estadística y Matemática

Fase 2. Estudio de mercado: ESTADÍSTICA

Análisis descriptivo y exploratorio de datos

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

4. Medidas de dispersión

2. DESCRIPCIÓN ESTADÍSTICA DE UNA VARIABLE. EJEMPLOS Y EJERCICIOS *.

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

RELACIÓN DE EJERCICIOS TEMA 2

Medidas de Tendencia Central, Medidas de Dispersión & Otros Estadísticos (Cap. 2) Math. 298 Prof. Gaspar Torres Rivera

ESTADÍSTICA SEMANA 3

Construcción de Gráficas en forma manual y con programados

Y accedemos al cuadro de diálogo Descriptivos

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Estadística descriptiva y métodos diagnósticos

Universidad Nacional Autónoma de Nicaragua UNAN-Managua. Curso de Estadística. UNIDAD I Estadística Descriptiva

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Medidas de posición relativa

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Estadística descriptiva VARIABLES CUANTITATIVAS

Práctica 2 ESTADÍSTICA DESCRIPTIVA

Tema 2 Estadística Descriptiva

Datos cuantitativos. Método tabular

MEDIDAS DE TENDENCIA CENTRAL

1.2 Medidas de variación: Rango, desviación estándar y coeficiente de variación

LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL

Media, mediana, moda y otras medidas de tendencia central

UNIDAD 6 Medidas de tendencia central

Unidad I: Descripción y gráficos estadísticos

2 Pasos en un estudio estadístico.

Media, mediana, moda y otras medidas de tendencia central CAPÍTULO 3 NOTACION DE INDICES. Denotemos por X }

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Estadísticos Descriptivos

Tema 7. Otras medidas descriptivas usuales Ejercicios resueltos 1

Medidas de posición relativa

ESTADÍSTICA SEMANA 2

Temas de Estadística Práctica

Primero definiré lo que es un gráfico o diagrama en estadística

UNIVERSIDAD ABIERTA PARA ADULTOS UAPA CARRERA LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS PROGRAMA DE LA ASIGNATURA ESTADÍSTICA I

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

INSTITUCIÓN EDUCATIVA NUESTRA SEÑORA DEL PALMAR SEDE LICEO FEMENINO GUÍA DE ESTADÍSTICA GRADO DÉCIMO

DISTRIBUCIONES DE PROBABILIDAD

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

1. La Distribución Normal

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Tema 6. Variables aleatorias continuas

Transcripción:

Percentiles, Deciles y Cuartiles Además de las medidas de tendencia central, dispersión y forma, también existen algunas medidas interesantes de posición que se utilizan al resumir y analizar las características o propiedades de grandes colecciones de datos. 1. Percentiles Los percentiles son aquellos valores que dividen a los datos ordenados de forma creciente, en cien partes iguales. Existen noventa y nueve percentiles que se denotan por P 1, P 2,..., P 99. Entre dos percentiles consecutivos se encuentra el 1% de los datos. Así, por ejemplo, entre los percentiles P 10 y P 20 se encuentran 10% de los datos. Para denotar un percentil cualquiera usamos P h, donde h = 1, 2, 3,..., 99.

Definición de Percentil El percentil P h de una colección de datos que previamente han sido ordenados (de forma creciente), es un valor tal que como máximo el h% de los datos son menores que él, y también como máximo un (100-h)% de los datos son mayores que él. Como en el caso de la mediana, si dos valores consecutivos del conjunto de datos cumplen con la definición anterior, se conviene en tomar como percentil al promedio de ellos dos.

Ejemplo: Suponga que los pesos de ocho personas (en Kg) son: 52, 97, 108, 63, 90, 74, 86, 73. Hallar lo percentiles: P 20, P 50 y P 80. En primer lugar se deben ordenar de forma creciente los datos: 52 63 73 74 86 90 97 108 El P 20 es el valor tal que el 20% de los datos, es decir el 20% de 8 = 1,6 datos, como máximo son menores que él, y también como máximo el 80% de 8 = 6,4 datos son mayores que él. Observe que el valor 63 cumple con estas condiciones. Por tanto, P 20 = 63 Kg.

Ahora, en el cálculo de P 50 se observa que existen dos valores cumplen con la definición. De esta manera, P 50 = (74 + 86) / 2 = 80 Kg. 74 y 86, que Para estos datos, P 80 tiene como máximo 6,4 datos por debajo de él y a lo sumo 1,6 datos por encima. El valor 97 satisface esto, así P 80 = 97 Kg. Nótese que ni el valor 90 ni 108 cumple con las condiciones. Por ejemplo, el valor 90 tiene cinco datos por debajo que cumple con lo que se exige pero por encima tiene a dos datos (el 25% de los datos), lo que no satisface los requerimientos para ser percentil 80.

2. Deciles Los Deciles son los valores que dividen a los datos ordenados (de forma creciente) en diez partes iguales. Existen nueve deciles que se denotarán por D 1, D 2,..., D 9. Entre dos deciles consecutivos se encuentra un 10% de los datos.

3. Cuartiles Los cuartiles son los valores que dividen a una colección de datos que previamente han sido ordenados en forma creciente, en cuatro partes iguales. De esta manera, existen tres cuartiles que se denotan Q 1, Q 2 y Q 3. Entre dos cuartiles consecutivos se encuentra un 25% de los datos. Por debajo de Q 1, se encuentra un 25% de los datos y por encima un 75%; Por debajo del cuartil tres, se encuentra un 75% de los datos y por encima de él existe un 25% de los datos.

Relaciones entre los cuartiles deciles y percentiles: Q 1 = P 25 Q 2 = D 5 = P 50 = Md Q 3 = P 75 D 1 = P 10 D 2 = P 20 M D 9 = P 90 Nota: A los cuartiles, deciles y percentiles en general se les denominan cuantiles Ejercicio: Para los datos no agrupados de estatura, calcular e interpretar: los cuartiles, el decil tres y el percentil diez.

Uso de percentiles como medidas de dispersión Los percentiles también son utilizados como indicadores de la dispersión de los datos. Con ellos se construyen algunas medidas de dispersión: Recorrido Intercuartil El recorrido intercuartil, viene dado por: RQ = Q 3 - Q 1 Esta medida refleja la dispersión de la parte central de la distribución ya que toma en cuenta al 50% de los datos del centro de la distribución:

Desviación Cuartil ó Recorrido Semi-Intercuartil La desviación cuartil se obtiene mediante la siguiente expresión: Si se calcula Md ± Q Q = Q Q 3 1 2 se obtiene un intervalo que contiene aproximadamente el 50% de los datos. Nota Fácilmente puede notarse que las dos medidas anteriores no toman en cuenta a todos los datos Esto puede representar una seria desventaja ya que es posible que por debajo de Q 1 o por encima de Q 3, los datos se encuentren muy concentrados o muy dispersos y el efecto sobre RQ y Q será el mismo. Aunque por otro lado, y por la misma razón, el recorrido intercuartil y la desviación cuartil no son afectados por valores atípicos.

Recorrido Percentil Es una medida basada en la misma idea que el RQ, la cual viene dada por: RP= P 90 - P 10 Este indicador refleja el 80% de los datos ubicados en la parte central de la distribución Ejercicio: Para los datos correspondientes a las variables peso e ingreso hallar: a. RQ b. RP c. El intervalo que contiene aproximadamente el 50% de los datos de la parte central de la distribución.

Medidas de Forma Existen indicadores que cuantifican la asimetría y el apuntamiento de una distribución. Estos son de utilidad conclusiones obtenidas gráficamente. cuando no se dispone del gráfico o para confirmar las Tanto las medidas de asimetría como las de apuntamiento son indicadores relativos ya que no vienen expresados en alguna unidad de medida.

Medidas de Asimetría Los resultados que se discutirán se refieren a distribuciones unimodales: a. Coeficiente de Asimetría de Pearson Este indicador se basa en la relación existente entre la media y la mediana: ASP = 3( x Md) S * Obsérvese que si la distribución es: Simétrica => ASP = 0, ya que en este caso x = Md Asimétrica por la derecha => ASP > 0, debido a que x > Md Asimétrica por la izquierda => ASP < 0, porque x < Md El coeficiente de asimetría de Pearson toma valores en el intervalo (-3, 3)

x < Md< Mo =Md=Mo Mo< Md< x Coeficiente de Asimetría de Fisher Se denota por γ 1 y viene dado por: γ = 1 n i= 1 ( x x) i n S 3 * 3 El coeficiente γ 1 está basado en la media aritmética e indica de que lado las diferencias respecto de éstas son mayores. Su interpretación es similar a la del coeficiente de Asimetría de Pearson

Medidas de Apuntamiento o Curtosis Estas medidas indican el grado de apuntamiento o achatamiento del gráfico. La medición del apuntamiento de un gráfico se hace tomando como referencia la curva normal (curva de campana o curva de Gauss). Por tanto, el gráfico al que se le desee medir el apuntamiento, debe ser al menos aproximadamente simétrico. A la curva normal se le llama mesocúrtica, si es más puntiaguda se le llama leptocúrtica y si es más achatada platicúrtica. Los indicadores de curtosis, miden el nivel de concentración de datos en la región central. Leptocúrtica Mesocúrtica Platicúrtica

Coeficiente de Pearson El coeficiente β 2 de Pearson es el más utilizado de las medidas de apuntamiento y viene dado por: β 2 = n i= 1 ( x x) i n S 4 * 4 Si la curva es normal (mesocúrtica), = 3 β 2 Si la curva es leptocúrtica, > 3 β 2 Si la curva es platicúrtica, < 3 β 2

Diagrama de caja El diagrama de tallo y hoja y el histograma proporcionan una impresión visual general del conjunto de datos, mientras que las cantidades numéricas tales como x o S brindan información sobre una sola característica de los datos. El diagrama de caja es una presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, la simetría o asimetría y la identificación de observaciones atípicas. El diagrama de caja representa los tres cuartiles, y los valores mínimo y máximo de los datos sobre un rectángulo (caja), alineado horizontal o verticalmente.

Diagrama de caja Construcción: 1. El rectángulo delimita el rango intercuartílico con la arista izquierda (o inferior) ubicada en el primer cuartil Q 1, y la arista derecha (o superior) en el tercer cuartil Q 3. Q 3 Q 1 2. Se dibuja una línea a través del rectángulo en la posición que corresponde al segundo cuartil (que es igual al percentil 50 o a la mediana), Q 2 = Md. Q 3 Md Q 1

Diagrama de caja 3. De cualquiera de las aristas del rectángulo se extiende una línea, o bigote, que va hacia los valores extremos (valor mínimo y valor máximo). Estas son observaciones que se encuentran entre cero y 1.5 veces el rango intercuartílico a partir de las aristas del rectángulo. Barrera superior para el bigote 1,5*RQarriba de Q 3 Q 3 Valor mínimo A veces, los diagramas de caja reciben el nombre de diagramas de caja y bigotes. Nótese que el rectángulo o caja representa el 50% de los datos que particularmente están ubicados en la zona central de la distribución. La caja representa el cuerpo de la distribución y los bigotes sus colas. Md Q 1

Diagrama de caja 4. Las observaciones que están entre 1.5 y 3 veces el rango intercuartílico a partir de las aristas del rectángulo reciben el nombre de valores atípicos. Las observaciones que están más allá de tres veces el rango intercuartílico partir de las aristas del rectángulo se conocen como valores atípicos extremos. a En ocasiones se emplean diferentes símbolos (como círculos vacíos o llenos), para identificar los dos tipos de valores atípicos.

3*RQ Valores atípicos RQ 1,5*RQ + Zona de valores atípicos extremos >3*RQ arriba de Q 3 Barrera superior para valores atípicos 3*RQ arriba de Q 3 Valor máximo Barrera superior para el bigote 1,5*RQ arriba de Q 3 Q 1 Md Q 3 x 1,5*RQ Valor mínimo 3*RQ Barrera inferior para el bigote (no dibujada) 1,5*RQ debajo de Q 1 Diagrama de caja X Barrera inferior para valores atípicos 3*RQ debajo de Q 1 Zona de valores atípicos extremos >3*RQ debajo de Q 1

Diagrama de caja Los diagramas de caja son muy útiles al hacer comparaciones gráficas entre conjuntos de datos, ya que tienen un gran impacto visual y son fáciles de comprender. Esta figura presenta los diagramas de caja comparativos para la variable peso de los estudiantes de Métodos Estadísticos I clasificados por sexo.

Diagrama de caja El análisis de este diagrama revela que el peso de los varones es, en general, mayor que el de las hembras. También se observa que la variabilidad de los pesos de las hembras es mayor a la de los varones. Sin embargo, la variabilidad en la parte central de la distribución de los pesos tanto de las féminas como de los masculinos es muy similar. Se observa la existencia de un valor atípico en la distribución de las mujeres, que es un peso muy alto (el valor máximo de todos los pesos) en comparación a los pesos del resto de las estudiantes. La distribución del peso de los varones es asimétrico por la izquierda mientras que las chicas presentan una distribución asimétrica por la derecha influenciada por el valor atípico.

Diagrama de caja Comparación entre diagramas de caja e histogramas del mismo conjunto de datos.

Diagrama de caja

Diagrama de caja Ejercicio 1. Construya y analice el diagrama de caja para la variable peso de los datos usados en clase. 2. Construya un diagrama de caja de la variable peso para el sexo femenino y otro para el sexo masculino. Compare estos dos diagramas.