Estadísticas Elemental Cuartiles y los diagramas de caja 3.1-1
Rango intercuartil El rango intercuartil, se denota IQR, es el rango del 50% central de los datos. Esto es la diferencia entre Q 3 y Q 1. IQR = Q 3 Q 1 El rango intercuartil es una medida de dispersión alrededor de la mediana. Generalmente, es una mejor medida de dispersión, ya que es resistente a los valores extremos. 3-2 3.1-2
EJEMPLO Determinar e interpretar el rango intercuartil para los datos sobre velocidad en la zona de construcción 20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40 Determinar Q 1 y Q 3 Q 1 = 28 Q 3 = 38 3-3 3.1-3
Identificar valores extremos usando IQR x i se considera un valor extremo si: x i < Q 1 1.5(IQR) ó x i > Q 3 + 1.5(IQR) donde Q 1 1.5(IQR) es el límite inferior del conjunto y Q 3 + 1.5(IQR) es el límite superior del conjunto 2010 Pearson Prentice Hall. All rights reserved 3-4 3.1-4
EJEMPLO Determinar valores extremos en el conjunto de velocidades en la zona de construcción 10, 20, 24, 27, 28, 29, 30, 30, 32, 35, 35, 36, 38, 40, 40, 55 Paso 1: Determinar Q 1 y Q 3 Paso 2: Determinar IQR Paso 3: Calcular los límites Paso 4: Los datos extremos son: 3-5 3.1-5
Resumen de 5 valores Cinco valores que resumen un conjunto de datos son: Resumen de 5 valores Mínimo Q 1 M Q 3 Máximo 2010 Pearson Prentice Hall. All rights reserved 3-6 3.1-6
EJEMPLO Obtener un resumen de cinco valores Cada seis meses, la Junta de la Reserva Federal de los Estados Unidos realiza un estudio de los planes de tarjetas de crédito en los EE.UU. Los datos siguientes son las tasas de interés cobradas por los 10 emisores de tarjetas de crédito, seleccionados al azar para la encuesta de julio de 2005. Determine el resumen de cinco valores para los datos que se muestran a continuación. 2010 Pearson Prentice Hall. All rights reserved 3-7 3.1-7
EJEMPLO Obtener un resumen de cinco valores (cont.) Institución Taza Pulaski Bank and Trust Company 6.5% Rainier Pacific Savings Bank 12.0% Wells Fargo Bank NA 14.4% Firstbank of Colorado 14.4% Lafayette Ambassador Bank 14.3% Infibank 13.0% United Bank, Inc. 13.3% First National Bank of The Mid-Cities 13.9% Bank of Louisiana 9.9% Bar Harbor Bank and Trust Company 14.5% Ordenar los datos: 6.5%, 9.9%, 12.0%, 13.0%, 13.3%, 13.9%, 14.3%, 14.4%, 14.4%, 14.5% Resumen de 5 valores: Mínimo:. Máximo: Q 1 = Q 2 ó M = Q 3 = Fuente: http://www.federalreserve.gov/pubs/shop/survey.htm 2010 Pearson Prentice Hall. All rights reserved 3-8 3.1-8
Diagrama de caja 1. Determinar los extremos inferior y superior del diagrama. a) Q 1 1.5(IQR) b) Q 3 + 1.5(IQR) donde IQR = Q 3 Q 1 2. Marcar los extremos encontrados en paso 1. 3. Dibujar una caja que va desde Q 1 hasta Q 3. Dibujar una línea vertical dentro de la caja en M. 3. Dibujar una línea desde Q 3 hasta el máximo y desde Q 1 hasta el mínimo. 4. Cualquier valor menor que el extremo inferior o mayor que el extremo superior se marca con * 5. Remover los extremos del IQR 3-9 3.1-9
Paso 1: IQR = 14.4% - 12% = 2.4%. Paso 2: límites inferior y superior: límite inferior = Q 1 1.5(IQR) lïmite superior = Q 3 + 1.5(IQR) = 12 1.5(2.4) = 14.4 + 1.5(2.4) Paso 3 al 5: = 8.4% = 18.0% * [ ] Q 1 = 12.0%. M= 13.6%. Q 3 = 14.4% Mín: 6.5% Máx: 14.5%. 2010 Pearson Prentice Hall. All rights reserved 3-10 3.1-10
EJEMPLO Construir un diagrama de caja para el conjunto de velocidades en la zona de construcción Q 1 = 27.5 M= 31. Q 3 = 37 Mín: 10 Máx: 55 LI: 13.25 LS: 51.25 3-11 3.1-11
Ejemplo A continuación se enumeran medidas de tendencia central, medidas de variación, y el resumen de 5 valores para los pulsos de una muestra aleatoria de 40 hombres y de otra muestra de 40 Media Desviación Estándar Mínimo Q1 Mediana Q3 Máximo Hombres 69.4 11.3 56 60 66 76 96 Mujeres 76.3 12.5 60 68 74 80 124 Construya diagramas de caja para cada conjunto. 3.1-12
Comparar diagramas de caja Mujeres * Hombres Indicar si cada enunciado es cierto o falso. 1. En promedio, el pulso de los hombres es más rápido. 2. En promedio, el pulso de las mujeres es más rápido 3. La data de las mujeres muestra mayor variabilidad. 4. La data de los hombres muestra mayor variabilidad. 5. El pulso mayor lo tiene un hombre. 6. El pulso menor lo tiene una mujer. 3.1-13
Resumen Resumen: Cuál medida debes reportar? Forma de la distribución Medida de tendencia central Medida de dispersión Simétrica Media Desviación estándar Sesgado Mediana Rango intercuartil 2010 Pearson Prentice Hall. All rights reserved 3-14 3.1-14
Describir la forma de la distribución de los datos usando un diagrama de caja El diagrama de caja anterior sobre la taza de interés indica que la distribución es sesgada hacia la izquierda. * 3-15 3.1-15