Análisis de Subconjuntos

Documentos relacionados
Gráfico Múltiple de Caja y Bigotes

Estadísticas por Filas

Grafico de Cajas y Bigotes

Tabulación. StatFolio de muestra: tabulation.sgp. Datos del Ejemplo: Captura de Datos. STATGRAPHICS Rev. 4/25/2007

Gráfico X-Y-Z. StatFolio de Muestra: xyzplot.sgp

MPG City (MPG en Ciudad)

Correlaciones Canónicas

Comparación de Muestras Pareadas

Tabulación Cruzada. Sample StatFolio: crosstabulation.sgp

Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp

Gráfico de Desgaste de Herramientas

Gráfico de Probabilidad Normal

Diagrama de Barras Múltiple

Horsepower (Caballos de Fuerza)

Selección del Modelo de Regresión

Transformaciones de Potencia

Método del Rango (Estudio del Calibrador Variables)

Gráfico de Control T-Cuadrada Multivariada

Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp

Método del Rango y Promedio (Estudio del Calibrador - Variables)

Gráfico de Medias Móviles (MA)

Histogramas. Ejemplo StatFolio: histogram.sgp

SnapStat: Análisis de Una Muestra

Exactitud y Linearidad del Calibrador

Series de Tiempo Suavización

Gráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp

Componentes Principales

Comparación de Varias Muestras

Gráficos de Superficie y de Contorno

Diseño de Experimentos Diseños de un Solo Factor Categórico

Análisis de Pareto. StatFolio de Ejemplo: paretochart.sgp. Datos de Ejemplo: STATGRAPHICS Rev. 4/25/2007

Análisis de Capacidad Multivariada

Los estadísticos descriptivos clásicos (Robustez)

Método de Análisis del Riesgo (Estudio del Calibrador Atributos)

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Este procedimiento también crea una escala cusum grafica para datos individuales monitoreando la variabilidad del proceso.

Las primeras siete opciones del menú Editar son de acuerdo a las operaciones del portapapeles:

Gráficos EWMA. Ejemplo StatFolio: ewmachart.sgp

Y accedemos al cuadro de diálogo Descriptivos

Análisis de Componentes de la Varianza

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Tema 4. Herramientas de representación gráfica

Método Analítico (Estudio del Calibrador Atributos)

Gráficos de Probabilidad

Se quiere medir la dispersión de una muestra a través de su localización. En primer lugar, definimos una medida relacionada con la media.

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Tema 3: Estadística Descriptiva

Procedimiento "Explorar..."

4. Medidas de dispersión

DESCRIPCIÓN DE DATOS. Medidas Numéricas

Diseño de Experimentos Optimización de Múltiples Respuestas

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

PROBABILIDAD. Unidad I Ordenamiento de la Información

Tutorial para el análisis exploratorio de datos univariados con el programa informático Statistica v.8

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

ESTADÍSTICA DESCRIPTIVA

Módulo de Estadística

Apuntes de Estadística

Curso de Estadística Aplicada a las Ciencias Sociales

Gráficos Ms Excel. Los datos deben encontrarse en una o más áreas rectangulares, no tiene porque se contiguas.

Selección Diseño de Cribado

Venta de Pasteles. Piezas. 3 Leches Chocolate. Del 26 al 30 de Enero MICROSOFT GRAPH Conceptos básicos

Análisis de Conglomerados

Manual de usuario. Sistema de Calificaciones del Nivel Primaria. Maestro.

Entorno de Excel - Contexto de Trabajo y navegación

4. Escribir en la pestaña Hoja 1, Practica 1. Doble Clic a la Pestaña Rotulada: Hoja 1 2. Escribir: Practica

SUBTOTALES EXCEL Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

Los datos para el estudio consisten de m muestras de una población detallando: = número de elementos no aceptables en la muestra j

INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS

Estadística Descriptiva

Determinación del tamaño de muestra (para una sola muestra)

Tema 2 Estadística Descriptiva

Análisis de Tendencia de los Costos de Calidad

Pronósticos Automáticos

Fundamentos de Estadística y Simulación Básica

TUTORIAL SOBRE HOJAS DE CALCULO

Primero definiré lo que es un gráfico o diagrama en estadística

Capítulo 1 Probabilidades y Estadística

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Ajustando Distribución (Datos Censurados)

Histogramas (páginas )

GRÁFICOS GRÁFICOS EN SPSS UTILIDADES Y PROCEDIMIENTO DE CREACIÓN

MANUAL DE USO PROGRAMA SENSIBAR

Estructura del SPSS. Favio Murillo García

ESTADÍSTICA DESCRIPTIVA

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Operaciones básicas con hojas de cálculo

Estadística básica con R Commander. María Eugenia Fernández de Luco

Estadística Descriptiva en SPSS

Líneas Guía WhitePaper Octubre de 2006

Competencias TIC para profesionales Del Siglo 21

UNIVERSIDAD DE INGENIERÍAS Y CIENCIAS DEL NORESTE CURSO INTENSIVO DE EXCEL

Introducción a la Planilla de Cálculo Open Office Calc. Cuaderno de Ejercicios

INTRODUCCIÓN AL MANEJO DE STATGRAPHICS

PRÁCTICAS DE ESTADÍSTICA CON R

Microsoft Excel. Contenidos: Cronograma con gráfico. Objetivo: Crear una Carta Gantt utilizando un gráfico de barras horizontal.

Ejemplo Diseño Completamente aleatorizado (Pág. 470 Montgomery)

Medidas de Tendencia Central.

Procedimientos de Análisis

Transcripción:

Análisis de Subconuntos Resumen El procedimiento de Análisis de Subconuntos calculará estadísticos para datos en una simple columna numérica cuando se agrupan en subconuntos definidos por los identificadores en una segunda columna. El procedimiento también graficará las estadísticas por grupo. StatFolio de Muestra: subset.sgp Muestra de Datos: El archivo 93cars.sf3 contiene información de 26 variables para n = 93 fabricantes y modelos de automóviles, tomados de Lock (1993). La tabla de abao muestra una lista parcial de 4 columnas de ese archivo: Make (Armadora) Model (Modelo) MPG Highway (Avenida MPG) (Tipo) Acura Integra 31 Small Acura Legend 25 Midsize Audi 90 26 Compact Audi 100 26 Midsize BMW 535i 30 Midsize Buick Century 31 Midsize Buick LeSabre 28 Large Buick Roadmaster 25 Large Buick Riviera 27 Midsize Cadillac DeVille 25 Large Cadillac Seville 25 Midsize Chevrolet Cavalier 36 Compact Chevrolet Corsica 34 Compact Chevrolet Camaro 28 Sporty Chevrolet Lumina 29 Midsize Chevrolet Lumina_APV 23 Van Chevrolet Astro 20 Van Chevrolet Caprice 26 Large Chevrolet Corvette 25 Sporty Chrylser Concorde 28 Large 2005 by StatPoint, Inc. Subset Analysis - 1

Captura de Datos Los datos a ser analizados consisten de una única columna numérica que contiene n = 2 o más observaciones y una columna con identificadores que definen cómo deberían de agruparse los datos. Datos: columna numérica que contiene los datos a ser resumidos. Códigos: columna numérica o no numérica que contiene los identificadores de grupo. Las estadísticas de resumen serán calculados para cada valor único en esta columna. Etiquetas: columna opcional con etiquetas para cada grupo. Si son proporcionadas, las etiquetas serán asignadas a los grupos de acuerdo con el orden numérico o alfabético de los identificadores en la columna Códigos. Selección: selección del subconunto. Resumen del Análisis El Resumen del Análisis muestra el número de observaciones en la columna de los datos y el número de niveles o grupos dentro de los cuáles los datos han sido divididos. Análisis de Subgrupo - MPG Highway por Datos/Variable: MPG Highway (miles per gallon in highway driving) Variable de códigos: Número de observaciones: 93 Número de niveles: 6 2005 by StatPoint, Inc. Subset Analysis - 2

Gráfica de Puntos La Gráfica de Puntos grafica los valores de los datos por grupo. 50 45 Diagrama de Dispersión MPG Highway 40 35 30 25 20 Compact Large Midsize Small Sporty Van Si existen puntos sobrepuestos significativos debido a valores de datos iguales, los puntos pueden ser separados al presionar el botón Separar Puntos en la barra de herramientas del análisis: Añadiendo una ligera separación horizontal, los puntos se compensarán aleatoriamente en dirección horizontal evitando que caiga usto uno encima del otro. 2005 by StatPoint, Inc. Subset Analysis - 3

Diagrama de Dispersión 50 45 MPG Highway 40 35 30 25 20 Compact Large Midsize Small Sporty Van Estadísticas de Resumen El cuadro Estadísticas de Resumen muestra varios estadísticos para las observaciones en cada grupo: Estadísticas de Resumen Datos/Variable: MPG Highway Desviación Error Recuento Promedio Estándar Estándar Mínimo Máximo Rango Compact 16 29.875 2.94109 0.735272 26.0 36.0 10.0 Large 11 26.7273 1.27208 0.383546 25.0 28.0 3.0 Midsize 22 26.7273 2.51058 0.535258 22.0 31.0 9.0 Small 21 35.4762 5.60909 1.224 29.0 50.0 21.0 Sporty 14 28.7857 3.64119 0.973148 24.0 36.0 12.0 Van 9 21.8889 1.45297 0.484322 20.0 24.0 4.0 Total 93 29.086 5.33173 0.552874 20.0 50.0 30.0 La mayoría de las estadísticas caen en alguna de las tres categorías: 1. medidas de tendencia central estadísticos que caracterizan el centro de los datos como la media muestral o promedio. 2. medidas de dispersión estadísticos que miden la propagación de los datos tal como la desviación estándar. 3. medidas de forma estadísticos que miden la forma de los datos con relación a una distribución normal, tal como la puntiagudez estandarizada y la curtosis. Las estadísticas incluidas en la tabla automáticamente se determinan en las especificaciones de la ventana Stats del cuadro de diálogo Preferencias. Dentro del procedimiento la selección puede ser modificada usando Opciones de Cuadro. El significado de cada estadístico se describe en la documentación para el procedimiento de Análisis de una Variable. Notar que el promedio más alto por galón corresponde a los carros pequeños, mientras que las camionetas muestran el menor ahorro de combustible. 2005 by StatPoint, Inc. Subset Analysis - 4

Cuadro de Opciones Seleccione las estadísticas deseadas. Gráfica de Caa y Bigotes Este cuadro muestra una gráfica de caa y bigotes para cada grupo de datos. Gráfica de Caa y Bigotes Compact Large Midsize Small Sporty Van 20 25 30 35 40 45 50 MPG Highway La gráfica se construye de la siguiente manera: Se dibua una caa es dibuada que se extiende desde el cuartil inferior del grupo hasta el cuartil superior. Este es el intervalo cubierto por la mitad, el 50% de los valores de los datos cuando se ordenan del más pequeño al más grande. Se dibua una línea vertical en la mediana del grupo (el valor de en medio). 2005 by StatPoint, Inc. Subset Analysis - 5

Si se requiere, un signo de suma se coloca donde está la media del grupo. Los bigotes son dibuados de las orillas de la caa hasta los valores más grandes y más pequeños de los datos, a menos que existan valores atípicamente leos de la caa (los cuales Tukey llama puntos extremos). Los puntos extremos son aquellos puntos con más de 1.5 veces el rango intercuartílico (la amplitud de la caa) por arriba o por debao de la caa y están indicados como símbolos puntuales. Cualquier punto más de 3 veces el rango intercuartílico arriba o debao de la caa se llama punto extremo leano y se indica como símbolo de punto con un signo de suma escrito encima del punto. Si los puntos extremos están presentes, los bigotes se dibuan hasta el valor más pequeño y más grande de los datos los cuales no son los puntos extremos. Para los carros pequeños, hay un punto extremo y un punto extremo leano. El punto extremo leano corresponde a Geo Metro el cual registró 50 millas por galón en el maneo en vías. Opciones de Cuadro Dirección: la orientación de la gráfica, correspondiente a la dirección de los bigotes. Muesca de la Mediana: si se selecciona, un corte en las orillas de la caa en forma de V será añadido a la gráfica mostrando un intervalo de incertidumbre para cada mediana al nivel de confianza predeterminado automáticamente por el sistema (establecido en la tabulación General del cuadro de diálogo Preferencias en el menú Edición). Los cortes se dibuan de tal manera que si dos de ellos no se sobreponen, existe una diferencia estadística significativa entre las medianas de los grupos correspondientes. Símbolos Valores Aberrantes: si se selecciona, indica la localización de puntos extremos. Marca de Media: si se selecciona, muestra la localización de la media muestral así como de la mediana. Eemplo Gráfica de Caa y Bigotes con Cortes La siguiente gráfica muestra la adición de los cortes de la mediana en un nivel de confianza del 95%. 2005 by StatPoint, Inc. Subset Analysis - 6

Gráfica de Caa y Bigotes Compact Large Midsize Small Sporty Van 20 25 30 35 40 45 50 MPG Highway El corte para el -ésimo grupo cubre el intervalo ~ 1.25IQR 1 x + ± z 1 α / 2 (1) 1.35 n 2 Donde IQR es el rango intercuartílico de la muestra para el -ésimo grupo, n es el tamaño del grupo y z α/2 es el valor crítico superior (α/2)% de una distribución normal estándar. En la gráfica de arriba, el corte para las Vans está completamente abao del corte para cualquier otro grupo, lo que implica que las vans son significativamente diferentes en comparación con los otros vehículos. Para algunos grupos, los cortes parecen doblarse hacia atrás de sí mismos. Esto sucede cuando el corte es tan grande que se extiende más allá del final de la caa. Tabla de Medias La Tabla de Medias muestra las medias del grupo calculadas, sus errores estándares e intervalos. Tabla de Medias Con Intervalos de Error Estándar Error Inferior Superior Código Recuento Media Estándar Límite Límite Compact 16 29.875 0.735272 29.1397 30.6103 Large 11 26.7273 0.383546 26.3437 27.1108 Midsize 22 26.7273 0.535258 26.192 27.2625 Small 21 35.4762 1.224 34.2522 36.7002 Sporty 14 28.7857 0.973148 27.8126 29.7589 Van 9 21.8889 0.484322 21.4046 22.3732 Total 93 29.086 0.552874 28.5331 29.6389 Dependiendo de las especificaciones en el Cuadro de Opciones, los intervalos pueden ser ya sea intervalos de error estándar dados por: 2005 by StatPoint, Inc. Subset Analysis - 7

s x ± n (2) O intervalos de confianza dados por: s ± α (3) n x t / 2, n 1 Cuadro de Opciones Intervalos: tipos de intervalos para incluir en la tabla. Nivel de Confianza: niveles de confianza si se muestra Límites de Confianza. 2005 by StatPoint, Inc. Subset Analysis - 8

Gráfica de Medias La Gráfica de Medias muestra las medias del grupo unto con las barras de error estándar o límites de confianza. 50 Gráfica de Medias para MPG Highway Con Barras de Error Estándar 45 40 Media 35 30 25 20 Compact Large Midsize Small Sporty Van Las barras verticales se extienden por arriba y por debao de las medias del grupo. Cuadro de Opciones Gráficar: seleccione Puntos para graficar símbolos de puntos en cada grupo de medias y Líneas para conectar las medias con una línea sólida. Intervalos: tipos de intervalos para incluir en la gráfica. Nivel de Confianza: nivel de confianza si se despliega Límites de Confianza. Mostrar Valores: seleccionar esta opción para graficar los valores de datos individuales a la izquierda de las medias del grupo. 2005 by StatPoint, Inc. Subset Analysis - 9

Gráfica del Rango/Sigma/Mediana Estas gráficas muestran las medianas del grupo, desviaciones estándares y rangos respectivamente. 50 45 Gráfica de Medianas para MPG Highway Mediana 40 35 30 25 20 Compact Large Midsize Small Sporty Van Cuadro de Opciones Graficar: seleccione Puntos para graficar símbolos de puntos en cada estadístico de grupo y Líneas para conectar las estadísticas con una línea sólida. Guardar Resultados Los siguientes resultados pueden ser guardados de regreso a las columnas de la hoa de base de datos: 1. Etiquetas las etiquetas asociadas con cada grupo. 2. Recuento los tamaños del grupo n. 3. Promedios, Desviaciones Estándar, etc. cualquier grupo de estadísticos desplegado en el cuadro Estadísticos de Resumen. 2005 by StatPoint, Inc. Subset Analysis - 10