Gráfica de Matriz Resumen El procedimiento Gráfica de Matriz crea gráficas de matriz para 3 o más variables numéricas. La diagonal de la matriz contiene gráficas de caja y bigotes para cada variable. Las posiciones fuera de la diagonal contienen gráficas de dispersión bivariadas para cada par de variables. El procedimiento es muy útil para obtener información inicial de datos multivariados. En la gráfica, a menudo se pueden detectar relaciones entre las variables, la presencia de valores atípicos, y otras características interesantes de los datos. StatFolio Muestra: matrixplot.sgp Datos Muestra: El archivo 93cars.sf3 contiene información de 26 variables para n = 93 marcas y modelos de automóviles, tomada de Lock (1993). La siguiente tabla muestra una lista parcial de 7 columnas de dicho archivo: Make (Marca) Model (Modelo) MPG Highway (MPG en Carretera) (MPG en Ciudad) (Peso) (Caballos de Fuerza) Acura Integra 31 25 2705 140 5 Acura Legend 25 18 3560 200 5 Audi 90 26 20 3375 172 5 Audi 100 26 19 3405 172 6 BMW 535i 30 22 3640 208 4 Buick Century 31 22 2880 110 6 Buick LeSabre 28 19 3470 170 6 Buick Roadmaster 25 16 4105 180 6 Buick Riviera 27 19 3495 170 5 Cadillac DeVille 25 16 3620 200 6 Cadillac Seville 25 16 3935 295 5 Chevrolet Cavalier 36 25 2490 110 5 Passengers (Pasajeros) 2006 por StatPoint, Inc. Gráfico de Matriz - 1
Entrada de Datos Los datos que serán analizados consisten de 2 o más columnas numéricas que contienen n = 2 o más observaciones. Datos : 2 o más columnas numéricas que contienen los datos para ser graficados. Códigos de puntos: columna opcional no necesariamente numérica utilizada para codificar los puntos. Selección: subconjunto a seleccionar. Resumen del Análisis El Resumen del Análisis muestra los nombres de las columnas de datos y una indicación de como han sido manejados los valores que no están. Gráfica de Matriz Datos / Variables: (maximum) (cu. ft.) (average of min and max prices in $1,000) (miles per gallon in city driving) (miles per gallon in highway driving) (pounds) Todos los datos disponibles están mostrados en la gráfica. 2006 por StatPoint, Inc. Gráfico de Matriz - 2
El cuadro de diálogo Opciones de Análisis controla que todos los casos que contienen valores perdidos en una o más columnas sean excluidos de todas las gráficas ( exclusión por casos ), o que todos los datos sean utilizados donde sea posible. Opciones de Análisis Sólo Casos Completos: excluye de todas las gráficas cualquier renglón en el cual una o más columnas de datos contenga un valor perdido. En este caso, todos los gráficos de caja y bigotes y las gráficas de dispersión de 2 variables estarán basadas en el mismo número de renglones. Todos los Datos: usa todos los datos donde sea posible (por defecto). En este caso, las gráficas de caja y bigotes contendrán todos los datos no omitidos para la columna indicada y las gráficas de dispersión de 2 variables mostrarán todos los renglones en los cuales ninguna de las variables graficadas se omitió. Matriz de Dispersión La Matriz de Dispersión muestra una matriz rectangular de gráficos. 2006 por StatPoint, Inc. Gráfico de Matriz - 3
Cada variable define un renglón y una columna. Por ejemplo, la variable 1 () es mostrada en el primer renglón y la primera columna, la variable 2 () es mostrada en el segundo renglón y la segunda columna, etc. La posición i-ésima en la diagonal muestra un gráfico de caja y bigotes para la variable i. Estos gráficos contienen: Un cuadro central que cubre la mitad de los valores para la variable. Una línea vertical en la mediana muestral. Un signo más en la media muestral. Bigotes que van desde el extremo del cuadro hasta los valores máximo y mínimo, a menos que uno o más valores sean clasificados como puntos exteriores. En estos casos, los bigotes solo se extienden hasta los valores mas alejados que no se consideran como puntos exteriores. Símbolos de puntos para todos los puntos que se encuentran a más de 1.5 veces el rango intercuartil de la muestra o para aquellos que están por arriba o por abajo del cuadro (puntos exteriores ). Símbolos de puntos con signo más sobrepuesto para todos los puntos que se encuentran a más de 3 veces el rango intercuartil de la muestra por arriba o por abajo del cuadro (puntos exteriores alejados ). Algunos aspectos de los gráficos de caja y bigotes pueden ser suprimidos utilizando el Panel de Opciones del cuadro de diálogo. Las gráficas de dispersión fuera de la diagonal muestran pares de variables observados. La gráfica de dispersión en el renglón i, columna j, muestra la variable i en el eje vertical y la variable j en el eje horizontal. En la matriz, cada par de variables es graficado dos veces, una con la primera variable en el eje X y la otra con la variable en el eje Y. Algunas veces es mas útil alisar las gráficas de dispersión presionando el botón Alisar/Girar en la barra de herramientas del análisis. La siguiente gráfica usa por defecto el suavizador robusto: 2006 por StatPoint, Inc. Gráfico de Matriz - 4
Ahora es más fácil reconocer las relaciones que existen entre las variables. STATGRAPHICS Rev. 25/04/2007 El campo Códigos de Puntos en la entrada de datos del cuadro de dialogo también puede ser utilizado para codificar el color de símbolo de los puntos y el tipo basado sobre el valor de una columna adicional. Domestic 0 1 Panel de Opciones Dirección: dirección de la gráfica de caja y bigotes (no utilizado en este procedimiento). Características: las gráficas de caja y bigotes pueden incluir un corte para indicar un intervalo de confianza de 95% para la mediana, símbolos valor atípico para indicar la presencia de puntos exteriores, y/o un signo más para indicar la ubicación de la media muestral. 2006 por StatPoint, Inc. Gráfico de Matriz - 5