Análisis de Capacidad Multivariada

Documentos relacionados
Exactitud y Linearidad del Calibrador

Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:

Diagrama de Barras Múltiple

Gráfico de Control de Aceptación

Análisis de Capabilidad (Porcentaje Defectuoso)

Pronósticos Automáticos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Gráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp

Transformaciones de Box-Cox

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

INFERENCIA ESTADISTICA

Teorema Central del Límite (1)

Diseño Gráficos de Control

Probabilidad Condicional

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

SnapStat: Análisis de Una Muestra

Tema 2. Descripción Conjunta de Varias Variables

Repaso de conceptos de álgebra lineal

ESTADÍSTICA SEMANA 3

Tipo de punta (factor) (bloques)

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Práctica 2: Análisis de sensibilidad e Interpretación Gráfica

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

Fase 2. Estudio de mercado: ESTADÍSTICA

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

OTRAS HERRAMIETAS ESTADISTICAS UTILES. Dra. ALBA CECILIA GARZON

Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp

Los datos para este análisis consisten de m muestras de una población: = numero de no conformidades observadas en la muestra j

1. Necesidades del Consumidor una lista de m necesidades del consumidor. Estas necesidades constituyen las m hileras de la matriz.

Tema 2 Datos multivariantes

1. Límites normales de tolerancia: estos límites asumen que los datos son una muestra aleatoria de una distribución normal.

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

Taller No 1. Laboratorio Estadística con Matlab. Estadística Descriptiva - Análisis exploratorio de datos con Matlab

Facultad de Ciencias Sociales - Universidad de la República

Tema 8. Análisis de dos variables Ejercicios resueltos 1

El Análisis de Correspondencias tiene dos objetivos básicos:

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

Tema 1.- Correlación Lineal

Estadística Espacial en Ecología del Paisaje

ANOVA Multifactorial. StatFolio Muestra: anova.sgp

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

Horsepower (Caballos de Fuerza)

Curso de Estadística Básica

ESTADÍSTICA CON EXCEL

Comparación de Líneas de Regresión

CAPÍTULO 4 TÉCNICA PERT

PROBLEMAS TEMA 3: ANÁLISIS DE COMPONENTES PRINCIPALES. LICENCIADO EN ECONOMÍA

Tabulación Cruzada. Sample StatFolio: crosstabulation.sgp

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.

478 Índice alfabético

MEDIDAS DE TENDENCIA CENTRAL

Comparación de Varias Muestras

ESTADÍSTICA DESCRIPTIVA

Estadística Inferencial. Estadística Descriptiva

1.3.- V A L O R A B S O L U T O

DISTRIBUCIONES BIDIMENSIONALES

Diplomatura en Ciencias Empresariales X Y

18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso.

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

MÓDULO 1: GESTIÓN DE CARTERAS

INFORME SOBRE LA TRANSMISIÓN DE PROMOCIONALES EXCEDENTES

Módulo de Estadística

Pruebas de Hipótesis Multiples

1 - TEORIA DE ERRORES : distribución de frecuencias

MEDIDAS ESTADÍSTICAS Medidas de Tendencia Central y de Variabilidad

Conceptos Básicos de Inferencia

Polinomios y Estadística

2. Análisis de varianza

Teoría de la decisión Estadística

USO HERRAMIENTAS EXCEL PARA LA PREDICCION

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Tema 4 Variables Aleatorias

06 Variables aleatorias conjuntas. Contenido. Variables aleatorias conjuntas. Objetivo

Reporte de Pobreza por Ingresos JUNIO 2015

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

CAPÍTULO VI RESULTADOS PESO (50 COMPRIMIDOS) INICIAL PESO (50 COMPRIMIDOS) FINAL PESO (50 COMPRIMIDOS) INICIAL PESO DEL PLATO

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

REGRESIÓN LINEAL CON SPSS

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

VALORACIÓN ECONÓMICA DE LUCRO CESANTE

ESTADÍSTICA. Tema 4 Regresión lineal simple

Diagrama Causa y Efecto

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Microsoft Project 2013

INSTITUTO CHAPULTEPEC MIDDLE SCHOOL

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Guía de Aplicación: Programación de Mediano y Largo Plazo (Programa Semanal) Dirección de Operación CDEC SIC

DEPARTAMENTOS EN LAS COMUNAS DE VIÑA DEL MAR, VALPARAÍSO Y CON CON

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

Transcripción:

Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos dentro de los límites de especificación. Cuando las variables están correlacionadas, es importante considerar el comportamiento conjunto, ya que al observar cada variable separadamente puede dar un panorama erróneo de la capacidad de proceso general. StatFolio Muestra: mvcapability.sgp Datos Muestra: El archivo grit.sf3 contiene mediciones realizadas de n = 56 montones de gravilla, de Holmes y Mergen (1993). Los datos representan los porcentajes de partículas grandes, medianas y pequeñas en la gravilla. La siguiente tabla muestra una lista parcial de los datos en este archivo: Large Médium Small LSL Nominal USL (Grande) (Mediana) (Pequeña) 5.4 93.6 1.0 5 10 3.2 92.6 4.2 5 10 5.2 91.7 3.1 3.5 86.9 9.6 2.9 90.4 6.7 4.6 92.1 3.3 4.4 91.5 4.1 5,0 90.3 4.7 8.4 85.1 6.5 4.2 89.7 6.1 3.8 92.5 3.7 4.3 91.8 3.9 3.7 91.7 4.6 3.8 90.3 5.9 2.6 94.5 2.9 Además de la muestra, el archivo también contiene límites de especificación para los porcentajes relativos de partículas grandes y pequeñas, los cuales son: Grande 10% (1) Pequeña 10% (2) Note que la columna que contiene los límites inferiores está en blanco, ya que no hay cotas inferiores. Se desea estimar el porcentaje de montones que se encuentran dentro de los límites de especificación. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 1

Entrada de Datos Los datos que serán analizados consisten en columnas numéricas las cuales contienen las variables de interés y los limites de especificación. Datos: columnas numéricas que contienen las n muestras, una por renglón. Límites Superiores de Especificación: columna numérica que contiene los límites de especificación superiores. Si una variable no tiene un límite superior, deje la celda correspondiente en blanco. Valores Nominales: columna numérica que contiene los valores nominales u objetivos para cada variable. Si una variable no tiene un valor objetivo, deje la celda correspondiente en blanco. Limites Inferiores de Especificación: columna numérica que contiene los límites de especificación inferior. Si una variable no tiene un límite inferior, deje la celda correspondiente en blanco. Selección: Subconjunto a seleccionar. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 2

Resumen del Análisis El Resumen del Análisis muestra los estadísticos resumidos para cada columna y la probabilidad estimada de estar fuera de los límites de especificación. Análisis de Capacidad Multivariada Datos / Variables: Small Large Número de casos completos: 56 Media Desv. Estd. Variable Muestral Muestral LIE Nominal LSE Small 6.09821 2.51154 5.0 10.0 Large 5.68214 1.94171 5.0 10.0 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 3

Fuera Especs. Fuera Especs. DPM Variable Observados Estimados Estimados Small 5.35714% 6.01462% 60146.2 Large 1.78571% 1.30827% 13082.7 Conjunto 7.14286% 7.18235% 71823.5 STATGRAPHICS Rev. 4/d/yyyy Se incluye en la tabla: Número de Casos Completos: el número de renglones n en el archivo de datos con información en las p variables. Cualquier renglón con datos faltantes para alguna variable es excluido del análisis. Media Muestral y Desviación Estándar: la media muestral y la desviación estándar para cada variable. Observado Fuera de la Especificación: el porcentaje de muestras en las cuales cada variable estuvo fuera de sus límites de especificación individual, con el porcentaje de veces en las cuales las muestras estuvieron conjuntamente fuera de los límites. El porcentaje conjunto incluye casos en los cuales una o más variables estuvieron fuera de sus límites individuales. Estimado Fuera de la Especificación: el porcentaje de muestras similares en la población que se estiman están fuera de los límites de especificación. La estimación está basada en una distribución normal multivariada de los datos y en la estimación del área de esa distribución que no está dentro de los límites de especificación de la distribución conjunta. Estimado DPM: los defectos por millón estimados, definidos como el número de muestras fuera, de cada millón que se estima que caerán fuera de los límites de especificación. Esto se calcula a partir del Estimado Fuera de la Especificación. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 4

En el ejemplo, las muestras de arena violaron uno o más límites de especificación 7.14% de las veces. Basados en la distribución normal multivariada, se estima que el 7.91% de todas las muestras tomadas de la población estarían conjuntamente fuera de la especificación. Debería notarse que la probabilidad conjunta no es la suma de las probabilidades individuales. NOTA: el cálculo del porcentaje estimado conjunto fuera de la especificación requiere integrar una distribución normal multivariada y esto puede consumir mucho tiempo. Por favor tenga paciencia. También, note que para derivar el porcentaje se usan métodos Monte Carlo, así que la respuesta podría variar un poco de la que se mostró anteriormente si el proceso se realiza nuevamente. Gráfica de Capacidad La Gráfica de Capacidad muestra la distribución normal multivariada para cualesquiera 2 de las variables. Greáfica de Capabilidad Multivariada DPM = 71823.5 0 3 6 9 12 15 Small 0 2 4 6 8 1012 Large El área sombreada en azul corresponde a la ubicación donde todas las variables están dentro de los límites de especificación. El área sombreada en rojo corresponde a la ubicación de una o más variables que se encuentran fuera de la especificación. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 5

Panel de Opciones STATGRAPHICS Rev. 4/d/yyyy Seleccione 2 Variables: seleccione dos de las p variables. Se mostrará la distribución marginal de las 2 variables seleccionadas. Invertir Variables: seleccione esta opción para mostrar la segunda variable a lo largo del eje X en el frente de la gráfica. En otro caso, la primera variable será graficada a lo largo del eje X. Índices de Capacidad Esta tabla muestra los índices de capacidad calculados de los datos. Índices de Capacidad 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 6

Índice Estimado MCP 0.49 MCR 205.15 DPM 71823.5 Z 1.46235 SQL 2.96235 STATGRAPHICS Rev. 4/d/yyyy Nivel de Calidad Sigma incluye un drif en la media de 1.5 sigmas. Basados en límites 6.0 sigma. El Los índices calculados son: DPM defectos estimados por millón. Éste es el número estimado de las muestras tomadas de la población que estarían fuera de la especificación en una o más de las variables. MCP un índice de capacidad multivariada. El índice es calculado por Z MCP = (3) k / 2 donde Z es el valor de la variable aleatoria normal estándar correspondiente a los DPM calculados, y k es el múltiplo de sigma especificado en la tabla Capacidad del cuadro de diálogo Preferencias, accesible desde el menú Editar. Normalmente, k = 6. Este índice está diseñado para tener una interpretación similar a Cpk en el caso univariado. Usualmente, esto es deseable para MCP 1.33. MCR el radio de capacidad multivariado. El índice es calculado por k / 2 MCR = 100 % (4) Z Esto es básicamente el inverso de MCP y expresa el porcentaje de la variación permisible que está siendo consumida por la variabilidad en los datos. Z el valor de la variable aleatoria normal estándar correspondiente al valor calculado DPM. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 7

SQL el Nivel de Calidad Sigma estimado. Este es un índice del nivel de calidad para el proceso desarrollado como parte del proceso Six Sigma. Dependiendo de la elección 1.5 Sigma Shift en la tabla Capacidad del cuadro de diálogo Preferencias, el SQL es igual a Z o (Z+1.5). Los datos muestra tienen un índice de capacidad de MCP = 0.49, correspondiente a un nivel de calidad sigma de aproximadamente 3. Mientras que estos niveles obtenidos son comunes, lograr una calidad de clase mundial requeriría mejorar la consistencia de los procesos. Elipse de Capacidad La Elipse de Capacidad muestra un diagrama bidimensional de las estimaciones realizadas de los procesos con respecto a 2 variables elegidas. 14 99.73% Elipse de Capabilidad MCP =0.49 11 Large 8 5 2-1 -3 0 3 6 9 12 15 Small La elipse es dibujada de tal forma que incluye el 99.73% de la probabilidad normal multivariada estimada para las variables elegidas, similar a los límites sigma ± 3 en una gráfica de capacidad univariada. La región rectangular es la ubicación en la cual ambas variables están dentro de sus límites de especificación. Un proceso capaz contendría completamente la elipse dentro de la región rectangular. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 8

Panel de Opciones STATGRAPHICS Rev. 4/d/yyyy Seleccione 2 Variables: seleccione dos de las p variables. Invertir Variables: seleccione esta opción para mostrar la segunda variable a lo largo del eje X. En otro caso, la primera variable será graficada a lo largo del eje X. Matriz de Correlación Esta tabla muestra los coeficientes de correlación estimados para cada par de variables: Matriz de Correlación 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 9

Small Large Small 1.0000 0.3538 Large 0.3538 1.0000 STATGRAPHICS Rev. 4/d/yyyy Los coeficientes de correlación miden la fuerza de la relación lineal entre un par de variables, en una escala de 1 para una correlación negativa perfecta a +1 para una correlación positiva perfecta. Entre más altas sean las correlaciones es más importante analizar las variables conjuntamente en lugar de hacer un análisis de capacidad univariado para cada variable. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 10

Pruebas de Normalidad El proceso de capacidad estimado que se mostró anteriormente depende en gran parte de suponer que los datos siguen una distribución normal multivariada. El panel Pruebas de Normalidad realiza una o más pruebas en cada variable para determinar cuando o no una distribución normal es un modelo razonable para la variable. Para cada prueba, las hipótesis de interés son: Hipótesis Nula: los datos son muestras independientes de una distribución normal Hipótesis Alternativa: los datos no son muestras independientes de una distribución normal Prubas de Normalidad Valores-P Shapiro-Wilk Sesgo Curtosis Small 0.755982 0.382035 0.504427 Large 0.314548 0.470987 0.721277 Las pruebas a realizarse se seleccionan utilizando el Panel de Opciones. Cada prueba es desplegada con sus estadísticos de prueba asociados y su P-Valor. P-Valores pequeños (por debajo de 0.05 si se trabaja con un nivel de significancia del 5% ) permiten un rechazo de la hipótesis nula y entonces un rechazo de la distribución normal. En la tabla anterior, todos los P- Valores están por encima de 0.05, así que estadísticamente no existe una anormalidad significativa en los datos. Panel de Opciones 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 11

Incluir seleccione la prueba que se incluirá en la salida. Las pruebas por defecto son definidas en la tabla Dist. Fit del cuadro de diálogo Preferencias al cual se tiene acceso desde el menú Editar. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 12

Gráfica de Probabilidad La Gráfica de Probabilidad es otro método por el cual se puede juzgar cuándo la distribución seleccionada describe adecuadamente los datos o no. Gráfica de Probabilidad 3.9 2.9 Small Large datos empíricos 1.9 0.9-0.1-1.1-2.1-2.1-1.1-0.1 0.9 1.9 2.9 3.9 distribución normal La gráfica muestra los valores de los datos para cada variable, ordenados de mayor a menor, graficados contra los percentiles equivalentes de la distribución normal seleccionada. Si la distribución normal es un modelo razonable para los datos, los puntos estarán aproximadamente a lo largo de una línea recta. En general, la gráfica anterior confirma que la distribución normal es un modelo razonable. Diagrama T-Cuadrada Como en todos los análisis de capacidad, es importante que el proceso se encuentre en un estado de control estadístico cuando la capacidad es estimada. En el caso de datos multivariados, un Diagrama T-Cuadrada es útil para examinar si los datos fueron mostrados de un proceso de control. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 13

Carta de Control T-Cuadrada 12 10 LSC = 10.81 T-Cuadrada 8 6 4 2 0 0 10 20 30 40 50 60 Observación En un diagrama T-Cuadrada, cada muestra es representada por un solo estadístico definido por T 2 i 1 ( x x) S ( x = i i x) (5) donde x i es el vector de los valores observados correspondientes a la i-ésima muestra, x es el vector de las medias muestrales, y S es la matriz de covarianzas de la muestra. Se incluye un límite superior de control en el diagrama, colocado por defecto para cubrir el 99.73% de una distribución normal multivariada con las medias y las covarianzas estimadas. Cualquier punto fuera del limite de control sería una señal de una situación potencialmente fuera-de-control. Panel de Opciones Alfa: la probabilidad de falsa alarma del diagrama de control. Para un diagrama de control estándar 3-sigma, α = 0.27%. Cifras Decimales para Límites: el número de lugares decimales para mostrar los límites de control. Colorear Zonas: seleccione esta opción para mostrar zonas verdes y rojas. 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 14

Cálculos Vector de la Media de la Muestra Vector p por 1 con elementos: x 1 = n j x ij n i= 1 (6) Matriz de Covarianza de la Muestra Matriz p por p con elementos: s jk n = 1 n 1 i=1 ( x x )( x x ) ij j ik k (7) Límites de Control en el Diagrama T-Cuadrada 2 ( n 1) UCL = Betaα, p / 2,( n p 1) / 2 (8) n 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 15