Gráfico Múltiple de Caa y Bigotes Resumen El procedimiento Gráfico Múltiple de Caa y Bigotes crea un gráfico diseñado para ilustrar Características importantes de una columna de datos numéricos cuando se agrupan de acuerdo a los valores de una segunda variable. El gráfico de caa y bigotes fue descrito primero por John Tukey (1977) en su Análisis de Datos Exploratorio. Los gráficos de caa y bigotes resumen los datos muestra a través de 5 estadísticos: 1. mínimo 2. cuantil inferior 3. mediana 4. cuantil superior 5. máximo También puede indicar la presencia de valores fuera de rango. StatFolio Muestra: boxplot.sgp Datos Muestra: El archivo 93cars.sf3 contiene información de 26 variables para n = 93 marcas y modelos de automóviles, tomadas de Lock (1993). La siguiente tabla muestra una lista parcial de 4 columnas de este archivo: Make (Marca) Model (Modelo) (MPG en carretera) (Doméstico) Acura Integra 31 0 Acura Legend 25 0 Audi 90 26 0 Audi 100 26 0 BMW 535i 30 0 Buick Century 31 1 Buick LeSabre 28 1 Buick Roadmaster 25 1 Buick Riviera 27 1 Cadillac DeVille 25 1 Cadillac Seville 25 1 Chevrolet Cavalier 36 1 La columna Doméstico contiene un 1 si el automovil fue manufacturado en Estados Unidos y un 0 en otro caso. 2005 por StatPoint, Inc. Gráfico Múltiple de Caa y Bigotes - 1
Entrada de Datos Los datos que serán analizados consisten de una columna numérica que contiene n = 2 o más observaciones y una segunda columna (numérica o tipo caracter) que contiene identificadores por los cuales se agrupan los datos. Datos: columna numérica que contiene los datos para ser resumidos. Códigos por Nivel: columna no necesariamente numérica que contiene los identificadores de los grupos. Selección: subconunto a seleccionar. Resumen del Análisis El Resumen del Análisis muestra el número de observaciones en la columna de datos y el número de niveles (grupos) en los cuales los datos han sido divididos. Gráfico Múltiple de Caa y Bigotes Variable dependiente: Factor: Número de observaciones: 93 Número de niveles: 2 2005 por StatPoint, Inc. Gráfico Múltiple de Caa y Bigotes - 2
Gráfico de Caa y bigotes Este panel despliega un gráfico de caa y bigotes para los datos correspondientes a cada código de nivel. Gráfico Caa y Bigotes 0 1 20 25 30 35 40 45 50 Para cada código de nivel se construye un gráfico de la siguiente manera: Se dibua un cuadro que va desde el cuartil inferior de la muestra hasta el cuartil superior. Este es el intervalo cubierto por el 50% de los valores de los datos cuando estos se ordenan de mayor a menor. Se dibua una línea vertical en la mediana (el valor medio). De ser requerido, se coloca un signo más en la ubicación de la media muestral. Se dibuan bigotes que van desde el inicio del cuadro hasta el valor mayor y menor de los datos, a menos que haya valores aleados del cuadro (a los cuales Tukey llama puntos exteriores). Los puntos exteriores, los cuales estan a mas de 1.5 veces el rango intercuartil (ancho de cuadro) por arriba o por abao del mismo, son indicados por símbolos de puntos. Si hay puntos ubicados a mas de 3 veces el rango intercuartil por arriba o por abao del cuadro, son llamados puntos exteriores leanos, y son indicados por símbolos de puntos con un signo más en la parte superior. Si hay puntos exteriores, los bigotes son dibuados hasta los valores mayor y menor de los datos, los cuales no son puntos exteriores. El gráfico anterior para los datos de millas por galón en carretera muestra los datos agrupados por domésticos o no domésticos (fabricados en Estados Unidos). El gráfico superior ofrece información para los automóviles no domésticos, mientras que el gráfico inferior ofrece información para los automóviles domésticos. El ancho mayor del gráfico superior indica que hay mas variabilidad entre los automóviles fabricados fuera de los Estados Unidos. La diferencia entre las líneas medianas muestra también que los automóviles no domésticos tienen mayor cantidad de millas por galón en promedio que los automóviles domésticos. También son observados 4 puntos exteriores. 2005 por StatPoint, Inc. Gráfico Múltiple de Caa y Bigotes - 3
Panel de Opciones STATGRAPHICS Rev. 25/04/2007 Dirección: la orientación del gráfico, correspondiente a la dirección de los bigotes. Muesca sobre la Mediana: De ser seleccionada, se agregará un corte a cada gráfico para permitir una comparación entre las medias muestrales y el nivel de confianza por defecto (seleccionado en el panel General del cuadro de diálogo Preferencias en el menú Editar). Los cortes son construidos de tal forma que si dos de ellos no se traslapan, entonces existe una diferencia estadística significativa entre las medianas de estos dos grupos. Mostrar Aberrantes: De ser seleccionada, indica la localización de puntos fuera de rango. Mostrar Media: De ser seleccionada, muestra la localización de las medias muestrales asi como también las medianas. 2005 por StatPoint, Inc. Gráfico Múltiple de Caa y Bigotes - 4
Eemplo Gráfico de Caa y bigotes cortado STATGRAPHICS Rev. 25/04/2007 El siguiente gráfico muestra la adición de un corte de mediana en un nivel de confianza de 95%. Gráfico Caa y Bigotes 0 1 20 25 30 35 40 45 50 El corte cubre el intervalo z 1.25( IQR ) 1 ± α / 1 + 2 1.35 n 2 ~ 2 x (1) donde x~ es la mediana del grupo de datos, IQR es el rango intercuartil de la muestra, n es el tamaño de la muestra, y z α/2 es el valor crítico superior (α/2)% de la distribución normal estándar. En el gráfico anterior, los 2 cortes se traslapan horizontalmente, lo cual indica que las medianas de los dos grupos de datos no tienen una diferencia significativa en un nivel de confianza del 5%. 2005 por StatPoint, Inc. Gráfico Múltiple de Caa y Bigotes - 5