Estadísticas Industriales

Documentos relacionados
ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Teorema Central del Límite (1)

ESTADÍSTICA DESCRIPTIVA

Estadística Inferencial. Estadística Descriptiva

Fase 2. Estudio de mercado: ESTADÍSTICA

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

MEDIDAS DE TENDENCIA CENTRAL

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Objetivos. Epígrafes 3-1. Francisco José García Álvarez

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

Distribución Chi (o Ji) cuadrada (χ( 2 )

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

2.- Tablas de frecuencias

Tema 1.- Correlación Lineal

Unidad 7: Muestreo de aceptación

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES

Tema 5 Algunas distribuciones importantes

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE

Estadística. Análisis de datos.

CAPÍTULO 4 TÉCNICA PERT

Curva de Lorenz e Indice de Gini Curva de Lorenz

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Curso de Estadística Básica

ANALISIS E INTERPRETACION DE DATOS SOBRE PERMANENCIA Y GASTOS DE LOS ALUMNOS EN LA UNIVERSIDAD NACIONAL DE INGENIERIA

Técnicas Cuantitativas para el Management y los Negocios I

Julio Deride Silva. 27 de agosto de 2010

478 Índice alfabético

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

M ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E

Medidas de centralización

Estadística descriptiva y métodos diagnósticos

PROBLEMAS ESTADÍSTICA I

INFERENCIA ESTADISTICA

Tema 4: Probabilidad y Teoría de Muestras

Unidad IV. Una variable aleatoria X es continua si su función de distribución es una función continua.

UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

Conceptos básicos estadísticos

ESTADÍSTICA CON EXCEL

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

3.1. Administración de la medición y de la información estratégica:

ESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

DISTRIBUCIONES BIDIMENSIONALES

4. NÚMEROS PSEUDOALEATORIOS.

MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIÓN

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Dispone de 1 hora para resolver las siguientes cuestiones planteadas.

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

ESTADÍSTICA SEMANA 3

Percentil q (p q ) Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple

Transformaciones de variables

UNIVERSIDAD DEL NORTE

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

TEMA 3: Inspección Estadística por Variables

Distribuciones de probabilidad

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

T1. Distribuciones de probabilidad discretas

Tema 4: Probabilidad y Teoría de Muestras

Análisis de datos Categóricos

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

ÍNDICE INTRODUCCIÓN... 21

Otra forma de enumerar los resultados es en una tabla de frecuencia:

Bioestadística: Estadística Descriptiva

DISTRIBUCIÓN N BINOMIAL

Módulo de Estadística

Tema 5. Contraste de hipótesis (I)

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Introducción. Flujo Eléctrico.

PROGRAMA ACADEMICO Ingeniería Industrial

LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL

Indicaciones para el lector... xv Prólogo... xvii

Micro y Macroeconomía

Estadística descriptiva: problemas resueltos

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Variables aleatorias

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

M i. Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana.

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011

Definición: Se llama variable aleatoria a toda función X que asigna a c/u de los elementos del espacio muestral S, un número Real X(s).

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Distribuciones de probabilidad discretas

Unidad V. 5.1 Recta tangente y recta normal a una curva en un punto. Curvas ortogonales.

DIAGRAMA DE FLUJO. Pasos: DEFINICIÓN:

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Aritmética de Enteros

Pruebas de Hipótesis Multiples

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Transcripción:

Estadísticas Industriales Presentado en: Stryker, Puerto Rico David R. González-Barreto Estadísticas Industriales Marzo 2010 1

Variabilidad Virtualmente, todos los procesos y sistemas del mundo real exhiben variabilidad. Las estadísticas son fundamentales en el mejoramiento de la calidad debido a que las técnicas estadísticas se utilizan para describir y entender la variabilidad. En efecto estas técnicas se han utilizado para reducir: el re-trabajo, los desperdicios, la necesidad de inspección y los costos de garantía. David R. González-Barreto Estadísticas Industriales Marzo 2010 2

Variabilidad Por qué ocurre la variabilidad? En términos generales, la variabilidad es el resultado de cambios en las condiciones de los procesos y/o sistemas en donde las medidas se efectúan. En manufactura estos cambios se pueden deber a cambios en las propiedades de los materiales, diferencias en la manera en que las personas realizan su trabajo, diferencias en los parámetros del proceso y finalmente también puede deberse al sistema de medida. El campo de las probabilidades y estadísticas consiste de métodos para describir y modelar la variabilidad y para tomar decisiones cuando ésta está presente. David R. González-Barreto Estadísticas Industriales Marzo 2010 3

Clasificación de los datos Los datos tienen dos clasificaciones: datos contínuos o por variable y datos categóricos o por atributo. Datos por variable - decimos que la escala podría ser infinitamente subdivisible y que está determinada por el instrumento de medida. Datos por atributo - decimos que la escala es meramente un conteo, ejemplo de esto sería la clasificación del número de artículos defectuosos encontrados en una muestra. David R. González-Barreto Estadísticas Industriales Marzo 2010 4

Definiciones Estadísticas - Es la ciencia y el arte de recopilar, mostrar e interpretar datos con el propósito de probar teorías y hacer inferencias acerca de todo tipo de fenómenos. Análisis Exploratorio de Datos (Exploratory Data Analysis EDA) Es el arte de mostrar los datos con un formato atractivo, que a su vez proporcione información de interés para el ingeniero o científico. David R. González-Barreto Estadísticas Industriales Marzo 2010 5

Definiciones Entre las herramientas más utilizadas encontramos: Diagrama de Punto (Dot Diagram) Histograma de Frecuencia Diagrama de Pareto Gráficos de Caja (Boxplots) Sencillo Múltiple Diagrama de Dispersión (Scatter Diagram) David R. González-Barreto Estadísticas Industriales Marzo 2010 6

Diagrama de Punto El diagrama de punto es un gráfico muy útil para mostrar conjuntos pequeños de datos, regularmente hasta alrededor de veinte observaciones. El mismo permite observar fácilmente la localización o la tendencia central así como la dispersión o variabilidad en los datos. Estos diagramas, con frecuencia, nos ayudan a comparar dos o más conjuntos de datos. David R. González-Barreto Estadísticas Industriales Marzo 2010 7

Frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Punto - Ejemplo Considere los siguientes datos que se refieren al esfuerzo en tensión de un tipo de cemento cuando se le añade un polímero (P). 16.85 16.40 17.21 16.35 16.52 17.04 16.96 17.15 16.59 16.57 El siguiente sería el diagrama de punto correspondiente a estos valores. 1 Dot Diagram 0 16.3 16.5 16.7 16.9 17.1 17.3 17.5 P David R. González-Barreto Estadísticas Industriales Marzo 2010 8

Diagrama de Punto - Ejemplo Suponga que los siguientes diez valores corresponden al esfuerzo en tensión de muestras de cemento sin el polímero. 17.50 17.63 18.25 18.00 17.86 17.75 18.22 17.90 17.96 18.15.......... ---+---------+---------+---------+---------+---------+---P........ : ---+---------+---------+---------+---------+---------+---SP 16.45 16.80 17.15 17.50 17.85 18.20 David R. González-Barreto Estadísticas Industriales Marzo 2010 9

Diagrama de Punto - Ejemplo En el diagrama de punto anterior puede notarse que el cemento al que se le añade el polímero (P) resulta en un esfuerzo en tensión menor al cemento (SP) común considerado. No obstante, podríamos decir que la variabilidad inherente dentro de cada grupo es fundamentalmente la misma. Cuando el número de datos disponibles es relativamente grande, construir un diagrama de punto no es muy eficiente. Otras técnicas que se discutirán a continuación resultarán ser mucho más efectivas. David R. González-Barreto Estadísticas Industriales Marzo 2010 10

Histograma Una distribución de frecuencia es una forma compacta de resumir los datos. Se obtiene de dividir el rango de los datos en intervalos comúnmente llamados celdas. El número de celdas dependerá del número de observaciones así como de la dispersión encontrada. A la representación gráfica de una distribución de frecuencia es a lo que llamamos histograma. David R. González-Barreto Estadísticas Industriales Marzo 2010 11

Histograma - Ejemplo La siguiente tabla muestra el octanaje de varias marcas de gasolina. 88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 96.5 93.3 94.7 91.1 91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7 84.3 86.7 88.2 90.8 88.3 98.8 94.2 92.7 93.2 91.0 90.1 93.4 88.5 90.1 89.2 88.3 85.3 87.9 88.6 90.9 89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9 89.8 89.6 87.4 88.4 88.9 91.2 89.3 84.4 92.7 91.8 91.6 90.4 91.1 92.6 89.8 90.6 91.1 90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7 92.2 92.2 91.2 91.0 92.2 90.0 90.7 David R. González-Barreto Estadísticas Industriales Marzo 2010 12

frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Histograma - Ejemplo 40 Histogram for Octanaje 30 20 10 0 82 86 90 94 98 102 Octanaje David R. González-Barreto Estadísticas Industriales Marzo 2010 13

frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Histograma - Ejemplo La siguiente gráfica presenta la distribución acumulativa de los datos nuevamente para el ejemplo del octanaje. 100 80 Histogram for Octanaje 60 40 20 0 82 86 90 94 98 102 Octanaje David R. González-Barreto Estadísticas Industriales Marzo 2010 14

Histograma En la práctica se ha encontrado que utilizar entre cinco y veinte celdas produce resultados satisfactorios. A medida que el número de observaciones aumenta, el número de celdas también debe aumentar. Algunos analistas (e.g. Montgomery) sugieren que este número debe ser aproximado a la raíz cuadrada del número de observaciones. David R. González-Barreto Estadísticas Industriales Marzo 2010 15

Diagrama de Pareto Una variación importante al histograma cuando se utilizan datos categóricos lo es el diagrama de Pareto. Este gráfico es altamente utilizado en los esfuerzos de mejoramiento continuo de la calidad en donde las categorías representan, por ejemplo, tipos de defectos, modos de falla y problemas del proceso. Las categorías son ordenadas en forma descendente. El nombre de este diagrama se debe a un economista italiano cuya ley (Ley de Pareto) puede interpretarse dentro del ambiente industrial de la siguiente forma: la mayoría de los defectos se debe a sólo un puñado de las categorías. David R. González-Barreto Estadísticas Industriales Marzo 2010 16

Diagrama de Pareto - Ejemplo La siguiente tabla muestra defectos estructurales en las puertas de un tipo de automóvil. Categoría Frecuencia Abolladuras 4 Fallos en pintura 6 Fallos en lubricación 5 Fallos de contorno 30 Fuera de secuencia 8 Fallos en terminación 3 David R. González-Barreto Estadísticas Industriales Marzo 2010 17

frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Pareto - Ejemplo Pareto Chart for Frecuencia 60 50 40 30 53.57 67.86 78.57 87.50 94.64 100.00 20 10 0 Fallos de contorno Fallos en pintura Fuera de secuencia Fallos en lubricació Abolladuras Fallos en terminació David R. González-Barreto Estadísticas Industriales Marzo 2010 18

Diagrama de Pareto - Ejemplo En el Diagrama de Pareto anterior podemos observar que las primeras tres categorías ordenadas resultan en alrededor del 79% de las fallas totales. Variaciones al Diagrama de Pareto incluyen: Diagramas de Pareto Pesados Diagramas de Pareto Anidados David R. González-Barreto Estadísticas Industriales Marzo 2010 19

Diagrama de Caja (Boxplot) Un gráfico de caja es una representación esquemática de la mediana muestral, de las cuartilas inferior y superior, y de la observación máxima y mínima de un conjunto de datos. Como muestra la figura en la página siguiente, se construye una caja cuyos extremos corresponden a las cuartilas inferior y superior y unas líneas verticales que salen de los extremos de la caja para representar la observación máxima y mínima respectivamente. Finalmente, una línea corta la caja y representa la mediana muestral. David R. González-Barreto Estadísticas Industriales Marzo 2010 20

Diagrama de Caja (Boxplot) Observación Máxima Cuartila 75% Mediana Cuartila 25% Observación Mínima David R. González-Barreto Estadísticas Industriales Marzo 2010 21

Diagrama de Caja (Boxplot) Un gráfico de caja provee una representación gráfica simple de la forma del conjunto de datos. Note que la mitad de las observaciones están contenidas en la caja y la otra mitad fuera de ella. Si un histograma muestra simetría, entonces las líneas del boxplot deben ser de un largo similar y la mediana debe estar localizada en la vecindad del centro de la caja. Si los datos están sesgados, las líneas no serán de igual largo y la mediana no se localizará cerca del centro de la caja. Muchos paquetes estadísticos representan valores espúreos ( outliers ) con asteriscos fuera de las líneas de los valores máximos. David R. González-Barreto Estadísticas Industriales Marzo 2010 22

Diagrama de Caja - Ejemplo Los datos para la radiación emitida por 42 hornos de microondas se presentan en la siguiente tabla. 0.15 0.09 0.18 0.10 0.05 0.12 0.08 0.05 0.08 0.10 0.07 0.02 0.01 0.10 0.10 0.10 0.02 0.10 0.01 0.40 0.10 0.05 0.03 0.05 0.15 0.10 0.15 0.09 0.08 0.18 0.10 0.20 0.11 0.30 0.02 0.20 0.20 0.30 0.30 0.40 0.30 0.05 David R. González-Barreto Estadísticas Industriales Marzo 2010 23

Diagrama de Caja - Ejemplo Box-and-Whisker Plot 0 0.1 0.2 0.3 0.4 Radiacion David R. González-Barreto Estadísticas Industriales Marzo 2010 24

Diagrama de Caja - Ejemplo Como puede observarse, las radiaciones emitidas con valor igual a 0.4 son identificadas por este gráfico como valores espúreos. También se puede notar del gráfico que la distribución de las radiaciones parece sesgarse hacia los valores altos. Los diagramas de caja son muy útiles para hacer comparaciones entre conjuntos o poblaciones de datos. En el siguiente ejemplo se muestra este uso al comparar dos poblaciones de bombillas. David R. González-Barreto Estadísticas Industriales Marzo 2010 25

Diagrama de Caja - Ejemplo Un estudio se realiza para comparar el efecto de dos distintos filamentos (Tipo A, Tipo B) en el número de horas de servicio de unas bombillas. Diez observaciones para cada tipo de filamento aparecen en la siguiente tabla. A B 1293 1643 1061 1138 1380 1466 1065 1143 1614 1627 1092 1094 1497 1383 1017 1270 1340 1711 1021 1028 David R. González-Barreto Estadísticas Industriales Marzo 2010 26

Tipo Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Caja - Ejemplo Box-and-Whisker Plot A B 1000 1200 1400 1600 1800 Horas Este boxplot muestra claramente cómo el filamento Tipo A redunda en largos de vida mucho mayores que el Tipo B, pero a su vez induce una mayor variabilidad. David R. González-Barreto Estadísticas Industriales Marzo 2010 27

Diagrama de Dispersión Los gráficos estudiados hasta el momento nos ayudan a entender la distribución de una variable. Los diagramas de dispersión son útiles para estudiar la relación entre dos variables. Esta gráfica presenta simplemente pares ordenados (x i, y i ), con el propósito de detectar alguna relación entre las variables. David R. González-Barreto Estadísticas Industriales Marzo 2010 28

Diagrama de Dispersión David R. González-Barreto Estadísticas Industriales Marzo 2010 29

Diagrama de Dispersión Relación positiva - los puntos en el diagrama siguen una trayectoria lineal ascendente. Relación negativa - los puntos en el diagrama siguen una trayectoria lineal descendente, o sea, mientras una de las variables disminuye la otra aumenta. Relación no lineal los puntos en el diagrama siguen una trayectoria curvilínea. Relación no sistemática los puntos en el diagrama muestran un patrón aleatorio que no sigue ninguna de las relaciones antes indicadas. Esto puede ser interpretado como la independencia entre ambas variables. David R. González-Barreto Estadísticas Industriales Marzo 2010 30

Diagrama de Dispersión Ejemplo En la tabla que se presenta a continuación y representa la pureza del oxígeno producida por un proceso químico mientras que x es el porcentaje de hidrocarbonos presentes en el condensador de la unidad de destilación. David R. González-Barreto Estadísticas Industriales Marzo 2010 31

Diagrama de Dispersión Ejemplo Observación x y 1 0.99 90.01 2 1.02 89.05 3 1.15 91.43 4 1.29 93.74 5 1.46 96.73 6 1.36 94.45 7 0.87 87.59 8 1.23 91.77 9 1.55 99.42 10 1.40 93.65 11 1.19 93.54 12 1.15 92.52 13 0.98 90.56 14 1.01 89.54 15 1.11 89.85 16 1.20 90.39 17 1.26 93.25 18 1.32 93.41 19 1.43 94.98 20 0.95 87.33 David R. González-Barreto Estadísticas Industriales Marzo 2010 32

Y Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Dispersión Ejemplo 102 99 Plot of Y vs X 96 93 90 87 0.87 1.07 1.27 1.47 1.67 X David R. González-Barreto Estadísticas Industriales Marzo 2010 33

Diagrama de Dispersión Ejemplo La inspección de este diagrama indica que aunque ninguna curva contendría exactamente todos los puntos, una relación lineal positiva parece existir entre estas dos variables. Nota de cautela: El que este diagrama muestre una relación aparente entre las variables no puede tomarse como que existe una causalidad entre éstas. David R. González-Barreto Estadísticas Industriales Marzo 2010 34

Muestra vs. Población Población Muestra x 1 x 2 x 3 x 4 : x. n Parámetros x, S Estadísticas 2, S, r,... David R. González-Barreto Estadísticas Industriales Marzo 2010 35

Medidas de Tendencia Central Promedio muestral n x i x i 1 n El valor del promedio muestral tiene mayor precisión que cada observación individual. Por lo tanto, en la mayoría de los casos éste será representado con un dígito más que los utilizados para las observaciones individuales. David R. González-Barreto Estadísticas Industriales Marzo 2010 36

Medidas de Tendencia Central Mediana La mediana es el punto en el cual la muestra es dividida en dos mitades. Si x (1), x (2),, x (n) representa una muestra ordenada en forma ascendente, entonces la mediana se define como la observación del medio o la observación ([n + 1] / 2) cuando n es impar y el promedio de las dos observaciones del medio si n es par. David R. González-Barreto Estadísticas Industriales Marzo 2010 37

Medidas de Tendencia Central En términos matemáticos, x x n 1 / 2 ~ x n/ 2 n/, n impar x 2 1, n par 2 La ventaja fundamental de la mediana es que ésta no es influenciada por valores extremos. David R. González-Barreto Estadísticas Industriales Marzo 2010 38

Medidas de Tendencia Central Moda La moda es la observación que ocurre con mayor frecuencia en la muestra. Cuando los dos valores más frecuentes ocurren igual número de veces, decimos que los datos siguen una distribución bimodal. David R. González-Barreto Estadísticas Industriales Marzo 2010 39

Cuartilas y Percentilas La mediana de una muestra o una población divide los datos en dos mitades iguales. Los datos también pueden dividirse en más de dos partes. Cuando un conjunto de datos ordenados se divide en cuatro partes iguales, los puntos en los cuales ocurre esa división son llamados cuartilas. David R. González-Barreto Estadísticas Industriales Marzo 2010 40

Cuartilas y Percentilas La primera cuartila o cuartila inferior, q 1, corresponde al valor que tiene aproximadamente una cuarta parte (25%) de las observaciones bajo el mismo y aproximadamente 75% de las observaciones por encima de él. La segunda cuartila q 2, tiene aproximadamente el 50% de las observaciones bajo su valor y corresponde a la mediana. Finalmente, la tercera cuartila o cuartila superior, q 3, tiene aproximadamente tres cuartas partes (75%) de las observaciones bajo su valor. Como en el caso de la mediana, las cuartilas pueden no ser únicas. Cuando esto ocurre, una forma simple de manejarlo es tomar el promedio como la cuartila cuando más de una observación satisface la definición. David R. González-Barreto Estadísticas Industriales Marzo 2010 41

Cuartilas y Percentilas Ejemplo Las siguientes observaciones representan el tiempo en horas hasta falla de un material eléctrico de insulación. 204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528 3710 David R. González-Barreto Estadísticas Industriales Marzo 2010 42

Cuartilas y Percentilas Ejemplo La mediana sería: ~x q 2 912 1176 2 1044 La primera cuartila: q 1 324 444 2 384 La cuartila superior: q 3 1512 2520 2 2016 David R. González-Barreto Estadísticas Industriales Marzo 2010 43

Cuartilas y Percentilas Ejemplo Box-and-Whisker Plot 0 1 2 3 4 Tiempo (X 1000) Note que los valores de la mediana, cuartila inferior y cuartila superior corresponden a los extremos y la línea cortante de la caja en este gráfico. David R. González-Barreto Estadísticas Industriales Marzo 2010 44

Cuartilas y Percentilas Cuando un conjunto ordenado de datos es subdividido en cien partes iguales, los puntos en los cuales ocurre esa división son llamados percentilas (p k ). David R. González-Barreto Estadísticas Industriales Marzo 2010 45

Medidas de Variabilidad Rango Una medida muy simple de la variabilidad es el rango muestral, que se define como la diferencia entre la observación mayor y la menor en la muestra. r = max (x i ) min (x i ) David R. González-Barreto Estadísticas Industriales Marzo 2010 46

Medidas de Variabilidad Rango El rango muestral es fácil de obtener, pero ignora toda la información existente en la muestra no contenida en las dos observaciones consideradas. Cuando el tamaño de muestra es pequeño, digamos n < 10, la información perdida al calcular el rango no es tan significativa. En general, se prefiere una medida de variabilidad que considere todas las observaciones en lugar de una que considere solo unas pocas. David R. González-Barreto Estadísticas Industriales Marzo 2010 47

Medidas de Variabilidad El rango entre cuartilas ( interquartile range IQR) se define como la diferencia entre las cuartilas superior e inferior. El IQR es menos sensitivo a valores extremos en la muestra que el rango muestral ordinario. IQR = q 3 q 1 David R. González-Barreto Estadísticas Industriales Marzo 2010 48

Medidas de Variabilidad Varianza muestral y desviación estándar muestral Las más importantes medidas de variabilidad lo son: la varianza muestral y la desviación estándar muestral. Si x 1, x 2,, x n es una muestra de n observaciones, entonces la varianza muestral estará dada por: s 2 i n 1 ( x i n x) 1 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 49

Medidas de Variabilidad La desviación estándar muestral, s, es la raíz cuadrada positiva de la varianza muestral. Las unidades de la varianza muestral son el cuadrado de las unidades de la variable original. La desviación estándar tiene la propiedad deseable de medir la variabilidad en las unidades originales de la variable de interés x. David R. González-Barreto Estadísticas Industriales Marzo 2010 50

Medidas de Variabilidad Coeficiente de variación En ocasiones es deseable expresar la variación como una fracción del promedio. Una medida no dimensional llamada el coeficiente muestral de variación se usa con este propósito. cv s x Este coeficiente es útil cuando comparamos dos o más conjuntos de datos que difieren considerablemente en la magnitud de las observaciones. David R. González-Barreto Estadísticas Industriales Marzo 2010 51

Distribuciones La distribución de probabilidad o simplemente la distribución de una variable aleatoria X, es una descripción del comportamiento de los posibles valores de X y sus respectivas probabilidades. En muchas ocasiones la distribución de probabilidad de la variable de interés es el resumen más útil para el analista del experimento o proceso bajo estudio. Las distribuciones también son clasificadas de acuerdo a los datos considerados. Es decir, tenemos distribuciones discretas o por atributo y distribuciones continuas o por variable. David R. González-Barreto Estadísticas Industriales Marzo 2010 52

Distribución Binomial Un experimento de n intentos donde los intentos son independientes, cada intento tiene solamente dos posibles resultados llamados: éxito o fracaso y la probabilidad de éxito en cada intento, denominada p, permanece constante El número de éxitos, x, tiene una distribución binomial con parámetros p y n. David R. González-Barreto Estadísticas Industriales Marzo 2010 53

Distribución Binomial La función de probabilidad de x es: n x n x fx x; p, n p 1 p, x 0,1,..., n x Si x es una variable aleatoria binomial con parámetros p y n, entonces: x E( X ) np 2 x V ( X ) np 1 p David R. González-Barreto Estadísticas Industriales Marzo 2010 54

Distribución Geométrica En una serie de pruebas Bernoulli, con probabilidad de éxito constante, p, la variable aleatoria x representa el número de intentos hasta que ocurra el primer éxito. Entonces x sigue una distribución geométrica con parámetro p f x x; p p 1 p x 1, x 1,2,... David R. González-Barreto Estadísticas Industriales Marzo 2010 55

Distribución Geométrica Si x es una variable aleatoria con parámetro p, entonces el promedio y la varianza de x son: x E( X ) 1/ p 2 x V ( X ) 1 p / p 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 56

Distribución Poisson Dado un intervalo de números reales, asuma que el conteo ocurre aleatoriamente a lo largo del intervalo. Si el intervalo se dividiera en subintervalos de tamaño pequeño de modo que: la propabilidad de más de un conteo en un sub-intervalo es cero, la probabilidad de un conteo en un sub-intervalo es igual para todos los sub-intervalos y proporcional al largo del sub-intervalo el conteo en cada sub-intervalo es independiente de otros subintervalos David R. González-Barreto Estadísticas Industriales Marzo 2010 57

Distribución Poisson Si un número promedio de conteos en el intervalo es > 0, la variable aleatoria x que representa el número de conteos en el intervalo sigue una distribución Poisson con parámetro y la función de probabilidad de x es f x e x;, x x! x 0,1,2,... David R. González-Barreto Estadísticas Industriales Marzo 2010 58

Distribución Poisson Si x es una variable aleatoria de distribución Poisson con parámetro, entonces el promedio y la varianza de x son x 2 x E( X V ( X ) ) David R. González-Barreto Estadísticas Industriales Marzo 2010 59

Distribución Normal La distribución más utilizada para el modelaje de experimentos aleatorios es la distribución normal. Esto es así porque muchos fenómenos de la naturaleza y de procesos de manufactura tienen un comportamiento normal. Puede demostrarse además, que cuando un experimento consiste de una serie de intentos independientes (n) y cada uno de ellos resulta en un valor observado de una variable aleatoria proveniente de una distribución particular, entonces, la variable aleatoria que representa el promedio o el total de los n intentos se aproximará a comportarse normalmente. Este concepto se conoce como el Teorema de Límite Central. David R. González-Barreto Estadísticas Industriales Marzo 2010 60

Distribución Normal La distribución normal consta de dos parámetros. El de tendencia central, conocido como y el de dispersión, en este caso representado por la desviación estándar. La función de probabilidad para la distribución normal está dada por: f x x;, 1 2 e x 2 2 2 x con parámetros y 0 David R. González-Barreto Estadísticas Industriales Marzo 2010 61

Distribución Normal Una variable aleatoria con = 0 y 2 = 1 se le conoce como una normal estandarizada y se denota como z. Donde, z = (x - ) / para el caso de las observaciones individuales. Cuando trabajamos con promedios, z x n Interpretamos z como el número de desviaciones estándar a que se encuentra x del promedio. Magnitudes altas de z corresponden a valores de x no típicos. David R. González-Barreto Estadísticas Industriales Marzo 2010 62

Distribución Normal 99.73% 95.5% 68% David R. González-Barreto Estadísticas Industriales Marzo 2010 63

Distribución Normal f x (x) 2 = 1 2 = 1 2 = 9 5 15 x David R. González-Barreto Estadísticas Industriales Marzo 2010 64

Pruebas para Determinar Normalidad En ocasiones se quiere determinar o corroborar si una muestra de interés proviene de una población con cierta distribución probabilística. Para esto existen varias pruebas tanto numéricas como gráficas. Una de las pruebas más más utilizadas para determinar si los datos provienen de una distribución normal es la Kolmogorov-Smirnov. David R. González-Barreto Estadísticas Industriales Marzo 2010 65

Prueba para Determinar Normalidad EJEMPLO Analice la siguiente muestra de 60 pesos de tabletas y determine si sería correcto inferir que la distribución que mejor representa los pesos individuales de las tabletas es la distribución normal. 0.563 0.548 0.55 0.554 0.55 0.556 0.556 0.547 0.55 0.55 0.552 0.552 0.556 0.556 0.544 0.547 0.55 0.55 0.559 0.552 0.549 0.547 0.549 0.554 0.552 0.552 0.551 0.549 0.551 0.544 0.555 0.555 0.55 0.554 0.557 0.546 0.558 0.554 0.554 0.555 0.556 0.551 0.558 0.549 0.55 0.552 0.559 0.556 0.559 0.545 0.548 0.55 0.562 0.55 0.551 0.556 0.551 0.559 0.554 0.556 H o : Los pesos de las tabletas siguen una distribución Normal. H i : Los pesos de las tabletas no siguen una distribución Normal. David R. González-Barreto Estadísticas Industriales Marzo 2010 66

Pruebas para Determinar Normalidad La prueba Kolmogorov-Smirnov utiliza la diferencia vertical máxima (Max. Diff.) entre la distribución empírica y la teórica para determinar la bondad de ajuste de la muestra observada. La prueba Kolmogorov-Smirnov es preferida sobre la de Chi Cuadrada especialmente cuando el tamaño de la muestra es pequeño. Empirical Dist. }Max. Diff. Theoretical Dist. David R. González-Barreto Estadísticas Industriales Marzo 2010 67

Pruebas para Determinar Normalidad En todas las pruebas la forma de decidir si la hipótesis bajo consideración, datos provienen de una distribución normal, es idéntica. El software reportará un valor p, que de ser bajo (i.e. <.05) indicaría que la hipótesis se rechaza o que los datos no provienen de una distribución normal. David R. González-Barreto Estadísticas Industriales Marzo 2010 68

Pruebas para Determinar Normalidad Un método gráfico para determinar si la distribución de los datos bajo consideración es normal, es el trazo de cuantilas normales (normal probability plot). Este trazo debe mostrar un comportamiento lineal para decidir afirmativamente que los datos son normales. David R. González-Barreto Estadísticas Industriales Marzo 2010 69

Pruebas para Determinar Normalidad Otra herramienta gráfica para evaluar la normalidad de unos datos es el trazo de probabilidad normal. En esta herramienta se trazan los datos de interés contra su respectiva frecuencia acumulada observada (pares ordenados) en un papel que tiene su escala vertical diseñada de tal forma que si las observaciones trazadas tienen un comportamiento lineal entonces decidimos que los datos provienen de un fenómeno con distribución normal. David R. González-Barreto Estadísticas Industriales Marzo 2010 70

Pruebas para Determinar Normalidad Prin EDA Estim Dist Mues Hyp Cont Cap R&R Para determinar los pares de coordenadas a trazarse en el papel: Ordene de menor a mayor las observaciones x (j), Calcule la frecuencia acumulada observada para cada x (j), y = [(j 0.5)/tamaño de muestra]. David R. González-Barreto Estadísticas Industriales Marzo 2010 71

Pruebas para Determinar Normalidad - Ejemplo Se analizaron 60 pesos de tabletas. Los resultados fueron los siguientes: David R. González-Barreto Estadísticas Industriales Marzo 2010 72

Planes de Muestreo David R. González-Barreto Estadísticas Industriales Marzo 2010 73

Planes de Muestreo Indice Definiciones Relación Productor Consumidor Curva O.C. Planes de Muestreo Sencillo Riesgo del Consumidor Riesgo del Productor Estándar Militar 105 E Muestreo Secuencial David R. González-Barreto Estadísticas Industriales Marzo 2010 74

Definición Definición de planes de muestreo Herramienta estadística en la que se llevan a cabo los siguientes pasos: Una muestra aleatoria se toma de un lote. Una o más características de calidad de las unidades en la muestra son inspeccionadas. A base del resultado de lo inspeccionado se dicta la sentencia sobre aceptar o rechazar el lote. David R. González-Barreto Estadísticas Industriales Marzo 2010 75

Aspectos Importantes Aspectos importantes sobre los planes de muestreo: No estiman la calidad del lote, sólo lo sentencian. No proveen ninguna forma directa de control de la calidad. Su uso más efectivo es como una herramienta para asegurarse de que lo producido por el proceso cumple con los requerimientos. Tipos de planes de muestreo Variables (cuantitativa) Por atributo (cualitativa) David R. González-Barreto Estadísticas Industriales Marzo 2010 76

Planes de Muestreo Sencillos Planes de muestreo sencillos Seleccione una muestra de n unidades de un lote tamaño N. Si encuentra c o menos unidades defectuosas en la muestra, acepte el lote. Si encuentra más de c unidades defectuosas (d) en la muestra, rechace el lote. David R. González-Barreto Estadísticas Industriales Marzo 2010 77

Ventajas y Desventajas Ventajas de los planes de muestreo Consume menos tiempo y dinero que la inspección del 100% de los lotes. Menos daños al producto debido a la reducción del manejo. Reduce errores de inspección por concepto de fatiga humana (dependiendo del plan de muestreo). Desventajas de los planes de muestreo Riesgo de rechazar lotes buenos y/o aceptar los que se debieron rechazar. Se obtiene información reducida sobre las características de calidad del proceso. No contribuyen a reducir la variabilidad del proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 78

Relación Productor-Consumidor RELACION PRODUCTOR-CONSUMIDOR Cuando usamos planes de muestreo existe un conflicto de interés entre el productor y el consumidor. Por un lado el productor quiere que todos los lotes buenos (que no excedan cierta proporción de piezas defectuosas predeterminada p 0 ) sean aceptados. Por otro lado, el consumidor quiere que todos los lotes malos (que excedan p 0 ) sean rechazados. Este conflicto sólo puede ser resuelto con un plan de muestreo cuya curva característica operacional (OC) sea ideal según discutiremos más adelante. David R. González-Barreto Estadísticas Industriales Marzo 2010 79

Curva Característica Operacional (OC) Curva Característica Operacional (OC) Las curvas OC miden la ejecutoria de los planes de muestreo. En éstas, se traza la probabilidad de aceptar (p a ) un lote contra la proporción de defectuosos (p) del mismo. Es por esto que las curvas OC son utilizadas para determinar el poder de discernir o discriminar lotes con distintos niveles de unidades defectuosas que tienen los planes de muestreo. David R. González-Barreto Estadísticas Industriales Marzo 2010 80

Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Curva OC Plan de Muestreo Sencillo 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.02 0.04 0.06 0.08 0.1 0.12 Fracción de defectuosos David R. González-Barreto Estadísticas Industriales Marzo 2010 81

Curva Característica Operacional (OC) Una curva OC ideal es aquella donde la probabilidad de aceptar lotes buenos (p p 0 ) es 1 y la probabilidad de aceptar lotes malos (p > p 0 ) es 0. En la práctica, obtener una Curva OC ideal para un plan de muestreo no es común. Lo más cercano que un plan de muestreo estará de obtener una curva OC ideal será al aumentar significativamente el tamaño de muestra del mismo. David R. González-Barreto Estadísticas Industriales Marzo 2010 82

Curva Característica Operacional (OC) 1 (P a ) 0 P 0 Proporción de defectuosos (p) David R. González-Barreto Estadísticas Industriales Marzo 2010 83

Curva Característica Operacional (OC) Existen dos tipos de Curvas OC: Tipo A usadas para lotes finitos (pequeños) en cuyo caso (p) está dada por la distribución probabilística Hipergeométrica. Tipo B usadas para lotes infinitos (grandes) en cuyo caso (p) está dado por la distribución probabilística Binomial. Si n N 0.10 ambas curvas son similares. La curva OC tipo B tiende a caer por encima de la tipo A. El poder de discriminación del plan de muestreo aumentará a medida que aumente el tamaño de la muestra (n). David R. González-Barreto Estadísticas Industriales Marzo 2010 84

Curva Característica Operacional (OC) Ejemplo Se desea construir la curva OC para el siguiente plan de muestreo: N = 10,000 n = 89 c= 2 p = 0.01 n Como el lote es grande (infinito) y 0. 10 N los puntos de la Curva OC tipo B. uso la distribución Binomial para calcular P a {d defectuosos} = d! n! n d! p d 1 p n d P a {d < c} = d c 0 d! 89! 89 d! 0.01 d 0.99 89 d P a (d < 2 / p = 0.01) =! 0!89! 89 0 89 1 88 2 87 0.01 0.99 89! 1!88! 0.01 0.99 89! 2!87! 0.01 0.99 0.9397 David R. González-Barreto Estadísticas Industriales Marzo 2010 85

Curva Característica Operacional (OC) Ejemplo Plan de Muestreo: N = 10,000 n = 89 c = 2 Fracción de Defectuosos (p) Probabilidad de Aceptar el Lote (P a ) 0.005 0.9897 0.010 0.9397 0.020 0.7366 0.030 0.4985 0.040 0.3042 0.050 0.1721 0.060 0.0919 0.070 0.0468 0.080 0.0230 0.090 0.0109 David R. González-Barreto Estadísticas Industriales Marzo 2010 86

Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Ejemplo Curva OC Plan de Muestreo Sencillo 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.02 0.04 0.06 0.08 0.1 0.12 Proporción defectuosos en Lote (p) David R. González-Barreto Estadísticas Industriales Marzo 2010 87

Probabilitidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Ejemplo Si variamos el tamaño de muestra (n), la curva OC del plan de muestreo de interés sería como se presenta a continuación: Dos Planes de Muestreo Sencillo 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 n = 50, c =1 n=200, c=4 0 0.02 0.04 0.06 0.08 0.1 0.12 Proporción defectuosos del Lote (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 88

Probabilitidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Ejemplo Para distintos valores de c, la curva OC del plan de muestreo de interés sería como se presenta a continuación: Dos Planes de Muestreo Sencillo 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 n = 89, c =2 n=89, c=0 0 0.02 0.04 0.06 0.08 0.1 0.12 Proporción defectuosos del Lote (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 89

Puntos de Interés En todo plan de muestreo estarán presentes los siguientes puntos de interés tanto para el productor como para el consumidor: Riesgo del productor ( ) = la probabilidad de rechazar un lote que debió haber sido aceptado. AQL (Acceptable Quality Level) = nivel más pobre de calidad, o la máxima fracción defectuosa del proceso del productor que el consumidor consideraría aceptable como el promedio del proceso. Riesgo del consumidor ( ) = probabilidad de aceptar un lote que debió haber sido rechazado. LTPD (Lost Tolerance Percent Defective) = un nivel de calidad del lote tan pobre que el consumidor solo lo podría aceptar por error. David R. González-Barreto Estadísticas Industriales Marzo 2010 90

Puntos de Interés Se debe siempre recordar que es a AQL como es a LTPD. El nivel de protección que un plan de muestreo ofrezca a cada una de las partes en la relación Productor-Consumidor dependerá de los dos puntos antes mencionados (AQL, 1 - ), (LTPD, ). Estos puntos de interés pueden ser vistos en la Curva OC del plan de muestreo diseñado. David R. González-Barreto Estadísticas Industriales Marzo 2010 91

Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Puntos de Interés Curva OC Plan de Muestreo Sencillo (AQL, 1 - ) (LTPD, ) AQL Fracción de defectuosos LTPD David R. González-Barreto Estadísticas Industriales Marzo 2010 92

Diseño e Implantación Diseño e Implantación de Planes de Muestreo El objetivo principal de diseñar un plan de muestreo es el determinar tamaño de muestras (n) y límite de aceptación (c), para dictar sentencia sobre un lote, que cumpla el nivel de riesgo estipulado por el productor, el consumidor o ambos. David R. González-Barreto Estadísticas Industriales Marzo 2010 93

Diseño e Implantación Plan de Muestreo Sencillo Plan de Muestreo Sencillo Suponga que se toma una muestra aleatoria de tamaño n de un lote de tamaño N. Al inspeccionar la muestra, si hay más de c unidades defectuosas rechazo el lote, de lo contrario lo acepto. Existen varias formas de diseñar un plan de forma tal que el interés del consumidor o del productor sea protegida. David R. González-Barreto Estadísticas Industriales Marzo 2010 94

Diseño e Implantación Planes de muestreo basados en el riesgo del productor Cuando el riesgo del productor ( ) y el nivel de calidad aceptable (AQL) asociado con éste son estipulados como la base del plan de muestreo se desea diseñar un plan de muestreo sencillo cuya Curva OC pase por la coordenada (AQL, 1 - ). Para diseñar dicho plan siga los siguientes pasos: Seleccione el límite de aceptación (c). Utilice la distribución probabilística Poisson (presumiendo Curva OC tipo B, p < 0.10) para determinar la cantidad promedio de unidades defectuosas por muestra ( ). Determine el tamaño de la muestra (n). n p n n AQL AQL David R. González-Barreto Estadísticas Industriales Marzo 2010 95

Diseño e Implantación - Ejemplo Diseñe un plan de muestreo sencillo que satisfaga el riesgo del productor de 5% para lotes que tienen una fracción de defectuoso de 1.5%. = 0.05 AQL = 0.015 Para c = 1 obtenemos de la distribución Poisson un = 0.355 n 0.355 AQL 0.355 0.015 23.67 El plan diseñado indica que se debe tomar una muestra aleatoria de 24 unidades y aceptar el lote como bueno si no encuentra más de 1 unidad defectuosa. 24 Para c = 3 n 1.366 0.015 91.07 92 Para c = 6 n Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo estipulado del productor ( = 5%, AQL = 1.5%) David R. González-Barreto Estadísticas Industriales Marzo 2010 96

Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diseño e Implantación - Ejemplo Comparación Planes de Muestreo 1 0.8 0.6 0.4 0.2 0 0 0.05 0.1 0.15 Fracción de defectuosos (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 97

Riesgo del Consumidor Planes de muestreo basados en el riesgo del consumidor Cuando el riesgo del consumidor ( ) y el nivel de calidad aceptable (LTPD) asociada con éste, son estipulados como la base del plan de muestreo, se desea diseñar un plan de muestreo sencillo cuya Curva OC pase por la coordenada (LTPD, ). Para diseñar dicho plan siga los siguientes pasos: Seleccione el límite de aceptación (c). Utilice la distribución probabilística Poisson para determinar la cantidad promedio de unidades defectuosas por muestra ( ). Determine el tamaño de la muestra (n). n p n LTPD n LTPD David R. González-Barreto Estadísticas Industriales Marzo 2010 98

Riesgo del Consumidor - Ejemplo Diseñe un plan de muestreo sencillo que satisfaga el riesgo del consumidor de 10% para lotes que tienen una fracción de defectuoso de 8%. = 0.10 LTPD = 0.08 Para c = 1 obtenemos de la distribución Poisson un = 3.890 n 3.890 LTPD 3.890 0.08 48.62 49 Para c = 3 n 6.681 0.08 83.51 84 Para c = 6 n Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo estipulado del consumidor ( = 10%, LTPD = 8%). David R. González-Barreto Estadísticas Industriales Marzo 2010 99

Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Riesgo del Consumidor - Ejemplo Comparación Planes de Muestreo 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.05 0.1 0.15 Fracción de defectuosos (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 100

Riesgos del Productor y el Consumidor Planes de muestreo basados en los riesgos del productor y el consumidor Diseñar un plan de muestreo que satisfaga exactamente ambas partes, el productor y el consumidor; es prácticamente imposible. Una alternativa es satisfacer exactamente una de las partes (Productor o Consumidor) y tratar de satisfacer lo más cercano posible a lo estipulado por la otra parte (por tanteo). Otra alternativa más fácil pero menos exacta es utilizar una herramienta gráfica llamada Nomograma. Para obtener un plan de muestreo que cumpla con lo estipulado por ambas partes mediante el uso del Nomograma siga los siguientes pasos: Trace una línea que conecte AQL con (1 - ) y otra línea conectando LTPD con. Identifique el plan de muestreo dado por la intersección de las dos líneas dentro del Nomograma. David R. González-Barreto Estadísticas Industriales Marzo 2010 101

Riesgos del Productor y el Consumidor - Ejemplo Diseñe un plan de muestreo sencillo que satisfaga tanto el riesgo del productor de 5% para lotes que tienen una fracción de defectuoso de 2% como el riesgo del consumidor de 10% para lotes que tienen una fracción de defectuoso de 8%. = 0.05, AQL = 0.02, = 0.10, LTPD = 0.08 En base al punto de intersección de las dos líneas (desde 0.95 hasta 0.02 y desde 0.10 hasta 0.08) se obtiene el siguiente plan de muestreo sencillo: n = 98 c = 4 David R. González-Barreto Estadísticas Industriales Marzo 2010 102

Riesgos del Productor y el Consumidor - Ejemplo David R. González-Barreto Estadísticas Industriales Marzo 2010 103

Estándar Militar 105E (ANSI/ASQC Z1.4) Están basados en el AQL, en el tamaño del lote y en el nivel de inspección. El nivel de inspección I requiere aproximadamente la mitad de la inspección que el nivel II y se utiliza cuando se requiere menor discriminación. El nivel de inspección III requiere aproximadamente el doble de la inspección del nivel II y se utiliza cuando se necesita mayor discriminación. Existen cuatro niveles de inspección especial: S-1, S-2, S-3 y S-4. Estos niveles producirán tamaños de muestra muy pequeños y sólo deben ser utilizados cuando se puedan o se necesite aceptar riesgos grandes. David R. González-Barreto Estadísticas Industriales Marzo 2010 104

Estándar Militar 105E Sus curvas O. C. son del tipo B. Debido a que estos planes están orientados al AQL, se enfocan en el riesgo del productor. Por lo tanto, el poder discriminatorio del plan de muestreo (la forma de la curva O. C.) se obtiene mediante la selección del nivel de inspección. David R. González-Barreto Estadísticas Industriales Marzo 2010 105

Estándar Militar 105E - Reglas de intercambio David R. González-Barreto Estadísticas Industriales Marzo 2010 106

Estándar Militar 105E Procedimiento Escoga el AQL Escoga el nivel de inspección Determine el tamaño del lote De acuerdo a la tabla que sigue, encuentre la letra para buscar el tamaño de la muestra Determine el tipo de plan de muestreo apropiado (sencillo, doble, múltiple) Busque en la tabla correcta para encontrar el tipo de plan a utilizarse David R. González-Barreto Estadísticas Industriales Marzo 2010 107

Estándar Militar 105E Tabla de letras David R. González-Barreto Estadísticas Industriales Marzo 2010 108

Estándar Militar 105E Inspección Normal David R. González-Barreto Estadísticas Industriales Marzo 2010 109

Estándar Militar 105E Inspección ajustada David R. González-Barreto Estadísticas Industriales Marzo 2010 110

Estándar Militar 105E Inspección reducida David R. González-Barreto Estadísticas Industriales Marzo 2010 111

Estándar Militar 105E - Ejemplo N = 2000 AQL = 0.65% Nivel de inspección general II Solución De la tabla de las letras: letra K De la tabla de inspección normal: n = 125, c = 2 De la tabla de inspección ajustada: n = 125, c = 1 De la tabla de inspección reducida: n = 50, c = 1, r = 3 David R. González-Barreto Estadísticas Industriales Marzo 2010 112

Muestreo Secuencial El muestreo secuencial está basado en el sequential probability ratio test (SPRT) desarrollado por Wald. Para cada punto en la gráfica del muestreo el eje de x corresponde al número de artículos inspeccionados hasta el momento, mientras que el eje de y representa el número total de defectuosos encontrados hasta ese momento. David R. González-Barreto Estadísticas Industriales Marzo 2010 113

Muestro secuencial Si el punto trazado se mantiene dentro de las líneas de aceptación y rechazo, otro artículo debe ser inspeccionado. Tan pronto como un punto esté sobre o por encima de la línea de rechazo, el lote se rechaza. Por otro lado, si un punto cae sobre o por debajo de la línea de aceptación, el lote se acepta. David R. González-Barreto Estadísticas Industriales Marzo 2010 114

Muestreo secuencial Para diseñar un plan de muestreo secuencial es necesario especificar las siguientes dos coordenadas: (p 1, 1 - ), (p 2, 1 - ). David R. González-Barreto Estadísticas Industriales Marzo 2010 115

Muestreo secuencial Las ecuaciones para las dos líneas basadas en las dos coordenadas están dadas por: X A X donde h 1 R h 2 h 1 1 log sn sn (acceptance line) (rejection line) k h 2 1 log k k s log log p p 1 2 1 1 1 p 1 p p 1 2 / 1 p 2 / k David R. González-Barreto Estadísticas Industriales Marzo 2010 116

Muestreo secuencial David R. González-Barreto Estadísticas Industriales Marzo 2010 117

Muestreo Secuencial - Ejemplo Supongamos que queremos encontrar un plan de muestreo secuencial en el que: p 1 = 0.01, = 0.05, p 2 = 0.06, y = 0.10 Entonces: k log p p 2 1 1 1 (0.06)(0.99) log (0.01)(0.94) 0.80066 p p 1 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 118

Muestreo Secuencial - Ejemplo h h 1 2 1 log 0.95 log 0.10 1.22 1 log 0.90 log 0.05 1.57 / k / 0.80066 / k / 0.80066 David R. González-Barreto Estadísticas Industriales Marzo 2010 119

Muestreo Secuencial - Ejemplo s log 1 p / 1 p / k 1 2 log 0.99/ 0.94 / 0.80066 0.028 Entonces, las líneas de aceptación y rechazo son: X A 1.22 0.028n (aceptación) X R 1.57 0.028n (rechazo) David R. González-Barreto Estadísticas Industriales Marzo 2010 120

Muestreo Secuencial Ejemplo En lugar de trazar un gráfico para determinar la disposición del lote, en el muestreo secuencial utilizamos una tabla en la que los datos se obtienen sustituyendo los valores de n en las ecuaciones para las líneas de aceptación y rechazo y calculando los números de aceptación y rechazo. Por ejemplo, el cálculo para n = 45 es: X A 1.22 0.028n -1.22 0.028(45) 0.04 (aceptación) X R 1.57 1.57 0.028n 0.028(45) 2.83 (rechazo) David R. González-Barreto Estadísticas Industriales Marzo 2010 121

Muestreo Secuencial - Ejemplo Inspeccionados Número de aceptación Número de rechazo Inspeccionados Número de aceptación Número de rechazo 1 a b 24 a 3 2 a 2 25 a 3 3 a 2 26 a 3 4 a 2 27 a 3 5 a 2 28 a 3 6 a 2 29 a 3 7 a 2 30 a 3 8 a 2 31 a 3 9 a 2 32 a 3 10 a 2 33 a 3 11 a 2 34 a 3 12 a 2 35 a 3 13 a 2 36 a 3 14 a 2 37 a 3 15 a 2 38 a 3 16 a 3 39 a 3 17 a 3 40 a 3 18 a 3 41 a 3 19 a 3 42 a 3 20 a 3 43 a 3 21 a 3 44 0 3 22 a 3 45 0 3 23 a 3 46 0 3 "a" - aceptación no es posible "b" - rechazo no es posible David R. González-Barreto Estadísticas Industriales Marzo 2010 122

Hipótesis Estadística Supuestos o conjeturas acerca de una o más poblaciones de interés. Prueba para verificar si el reclamo sobre cierto parámetro de la población de interés es igual al establecido de la hipótesis nula (Ho). El aceptar la hipótesis nula sólo implica que la muestra analizada no da suficiente evidencia para refutarla. Sin embargo, rechazar la hipótesis nula implica que la muestra analizada da evidencia para rechazarla. Este rechazo da paso a la aceptación de la hipótesis alterna (H 1 ). David R. González-Barreto Estadísticas Industriales Marzo 2010 123

Hipótesis Estadística Estadística de prueba- Función de la muestra aleatoria que se utiliza para tomar una decisión en la prueba de hipótesis. Valor crítico - Valor que marca el límite entre aceptación o rechazo de la Ho. Región de aceptación - Rango marcado por el valor o valores críticos que de contener el valor de la Ho daría paso a la aceptación de la misma. Región de rechazo - Rango marcado por el valor o valores críticos que de contener el valor de la Ho daría paso al rechazo de la misma. David R. González-Barreto Estadísticas Industriales Marzo 2010 124

Hipótesis Estadística Rechazo Rechazo /2 /2 Región de Aceptación David R. González-Barreto Estadísticas Industriales Marzo 2010 125

Hipótesis Estadística H o es cierto H o es falso acepto H o rechazo H o decisión correcta error tipo I error tipo II decisión correcta David R. González-Barreto Estadísticas Industriales Marzo 2010 126

Hipótesis Estadística Error tipo I - Rechazar la Ho cuando se debió aceptar. Error tipo II - Aceptar la Ho cuando se debió rechazar. Nivel de significancia - Probabilidad de cometer error tipo I. - Probabilidad de cometer error tipo II. Potencia de la prueba (1 - ) - Probabilidad de rechazar la Ho cuando se debió rechazar. Valor P - Nivel de significancia mínima al cual el valor observado de la estadística de prueba es significativo. David R. González-Barreto Estadísticas Industriales Marzo 2010 127

Hipótesis Estadística Pasos a seguir en las Pruebas de Hipótesis 1. Establezca la Ho 2. Escoja la H 1 apropiada 3. Escoja el nivel de significancia 4. Seleccione la estadística de prueba y establezca la región crítica 5. Compute el valor de la estadística de prueba para la muestra analizada 6. Decida si acepta o rechaza la Ho 7. Tome la acción pertinente dada la decisión David R. González-Barreto Estadísticas Industriales Marzo 2010 128

Hipótesis Estadística 1 POBLACION 2 POBLACIONES >2 POBLACIONES CONTINUOS O POR VARIABLE DISCRETOS CONTINUOS O POR VARIABLE DISCRETOS ANOVA p= proporción defectuosos. 2 D ( 1-2) = diferencia de promedios 2 / 2 = razón de varianzas. (p 1 p 2 ) = diferencia de proporciones. David R. González-Barreto Estadísticas Industriales Marzo 2010 129

Concepto del valor P El valor p se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería rechazada. En el caso de la distribución F que usamos en nuestro ANOVA si: calculada > crítica entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis alterna H1. Este concepto se ilustra en la siguiente Figura. valor p valor p > F Calculada F Crítica Como puede notarse en este caso la hipótesis nula Ho no puede ser rechazada ya que la Fcalculada < Fcrítica, de igual manera el valor p nos daría la misma decisión bajo la condición: David R. González-Barreto Estadísticas Industriales Marzo 2010 130

Concepto del valor P Por lo tanto, el valor p puede ser interpretado como la posibilidad de que la hipótesis nula no sea rechazada. Magnitudes altas del valor p estarán asociadas con no poder rechazar la hipótesis nula mientras que magnitudes bajas del valor p estarán asociadas con el rechazo de la hipótesis nula. Regularmente el valor p es comparado con el nivel establecido para la prueba. Usando el valor p como criterio de aceptación o rechazo de una hipótesis es como comúnmente los programas de análisis estadístico le permiten al usuario tomar una decisión. Así que en general, si el valor p es menor que el establecido rechazamos la hipótesis nula de lo contrario no podemos rechazar. David R. González-Barreto Estadísticas Industriales Marzo 2010 131

Prueba Pareada Estas pruebas ocurren cuando se estudia la respuesta de una unidad experimental a dos distintos tratamientos. Por ejemplo, suponga que se conduce un estudio para determinar el efecto de una droga que ayuda en la reducción de la presión arterial. Para medir su efectividad (o su inefectividad), se le provee la droga a una muestra aleatoria de n pacientes. El conjunto de datos consiste de n pares ordenados (xi, yi), donde la xi correspondería a la presión arterial del paciente i, antes del tratamiento mientras que la yi denotaría la presión arterial luego de la droga para el mismo paciente. David R. González-Barreto Estadísticas Industriales Marzo 2010 132

Prueba Pareada La variable di = xi - yi, representa la diferencia en la presión arterial producida por la droga en determinado paciente. Esto es un ejemplo de lo que se conoce como auto-pareo, en el cual a una unidad experimental singular se le administran los dos tratamientos. En otros casos esos pares son seleccionados. Por ejemplo, en experimentos de sicología gemelos idénticos son utilizados para estas pruebas pareadas. Una vez el par ha sido seleccionado, a una de las dos unidades se le asigna aleatoriamente el tratamiento 1 correspondiendo el tratamiento 2 a la otra unidad. Las ventajas del pareo son intuitivamente claras: reduce la variabilidad en los datos que se debe a otras causas distintas al tratamiento bajo consideración. David R. González-Barreto Estadísticas Industriales Marzo 2010 133

Prueba Pareada - Ejemplo Un estudio se realiza con el objetivo de comparar dos configuraciones de un procesador de computadora. Se midieron los tiempos de ejecución para seis tareas distintas (w1,, w6). Las dos configuraciones evaluadas fueron el procesador con y sin cache. Los resultados obtenidos se presentan en la siguiente tabla. Tarea Cache No cache d i = x i - y i W1 69 75-6 W2 53 83-30 W3 61 89-28 W4 54 77-23 W5 49 83-34 W6 50 83-33 David R. González-Barreto Estadísticas Industriales Marzo 2010 134

Prueba Pareada - Ejemplo T-Test of the Mean Hypothesis Tests for Cache-No_Cache Sample mean = -25.6667 Sample median = -29.0 t-test ------ Null hypothesis: mean = 0.0 Alternative: not equal Computed t statistic = -6.04224 P-Value = 0.00178906 Reject the null hypothesis for alpha = 0.05. Confidence Intervals Confidence Intervals for Cache-No_Cache 95.0% confidence interval for mean: -25.6667 +/- 10.9195 [-36.5862,-14.7471] Como se puede observar de los resultados obtenidos de STATGRAPHICS, tanto el valor p como el intervalo de confianza indican el efecto significativo que tiene el cambio de configuración en el procesador. La configuración que incluye el cache resultó en una ejecución mucho más rápida. David R. González-Barreto Estadísticas Industriales Marzo 2010 135

Inferencias sobre los promedios Regularmente, la calidad de un producto se mide por una variable cuantitativa x definida en cierta población. Se conoce que esta variable estará sujeta a cierto nivel de variación aleatoria, por lo tanto, estudiar el comportamiento de ésta y los parámetros que la describen resulta de vital importancia. El reclamo de que > 0 es un ejemplo de una hipótesis estadística que intenta describir o entender dicho comportamiento. Cuando el reclamo incluye dos comportamientos el objetivo del estudio podría ser el de medir la diferencia entre los dos promedios ( 1-2 > ). De igual forma se podrían hacer reclamos sobre el parámetro de dispersión de la variable de interés. Estos casos se discutirán más adelante. David R. González-Barreto Estadísticas Industriales Marzo 2010 136

Inferencias sobre los promedios Ejemplo Una empresa manufacturera de lentes de contacto compró una máquina para el llenado de frascos de solución alkalina. Esta máquina fue ajustada para llenar frascos cuya etiqueta indicaba un contenido de 12 onzas. Diez muestras se tomaron para validar que el proceso cumplía con este requisito. Estas observaciones se muestran en la siguiente tabla. Onzas 11.52 12.54 12.3 12.01 11.1 10.47 10.8 11.02 11.64 12.41 David R. González-Barreto Estadísticas Industriales Marzo 2010 137

Inferencias sobre los promedios Ejemplo T-Test of the Mean ( Una cola ) Hypothesis Tests for Onzas Sample mean = 11.581 Sample median = 11.58 T-Test of the Mean ( Dos colas ) Hypothesis Tests for Onzas Sample mean = 11.581 Sample median = 11.58 t-test ------ Null hypothesis: mean = 12.0 Alternative: less than Computed t statistic = -1.83245 P-Value = 0.0500525 t-test ------ Null hypothesis: mean = 12.0 Alternative: not equal Computed t statistic = -1.83245 P-Value = 0.100105 Do not reject the null hypothesis for alpha = 0.05. David R. González-Barreto Estadísticas Industriales Marzo 2010 138

Inferencias sobre los promedios Ejemplo Dos catalíticos son analizados para determinar su efecto en el rendimiento de un proceso químico. El catalítico 1 es el que se utiliza en la actualidad. El catalítico 2 tiene menor costo y se adoptaría si el mismo no afecta adversamente el rendimiento del proceso. Un estudio piloto se efectuó resultando en lo siguiente: Observación Catalítico 1 Catalítico 2 1 91.5 89.19 2 94.18 90.95 3 92.18 90.46 4 95.39 93.21 5 91.79 97.19 6 89.07 97.04 7 94.72 91.07 8 89.21 92.75 David R. González-Barreto Estadísticas Industriales Marzo 2010 139

Inferencias sobre los promedios Ejemplo Two Sample T-Test and Confidence Interval Comparison of Means ------------------- 95.0% confidence interval for mean of Cat1: 92.255 +/- 1.99393 95.0% confidence interval for mean of Cat2: 92.7325 +/- 2.49424 95.0% confidence intervals for the difference between the means: assuming equal variances: -0.4775 +/- 2.89639 not assuming equal variances: -0.4775 +/- 2.90962 t tests to compare means Null hypothesis: mean1 = mean2 (1) Alt. hypothesis: mean1 NE mean2 assuming equal variances: t = -0.353591 P-value = 0.728914 not assuming equal variances: t = -0.353591 P-value = 0.729166 (2) Alt. hypothesis: mean1 > mean2 assuming equal variances: t = -0.353591 P-value = 0.635543 not assuming equal variances: t = -0.353591 P-value = 0.635417 (3) Alt. hypothesis: mean1 < mean2 assuming equal variances: t = -0.353591 P-value = 0.364457 not assuming equal variances: t = -0.353591 P-value = 0.364583 David R. González-Barreto Estadísticas Industriales Marzo 2010 140

Catalitico Prin EDA Estim Dist Mues Hyp Cont Cap R&R Inferencias sobre los promedios Ejemplo Box-and-Whisker Plot Cat1 Cat2 89 91 93 95 97 99 Rendimient Como se puede observar, tanto de la gráfica como de ambas pruebas efectuadas, los promedios no difieren significativamente. El catalítico 2 podría adoptarse sin el riesgo de que afecte negativamente el rendimiento de este proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 141

Estimado de intervalos En muchas ocasiones, un estimado de punto no provee la información suficiente con respecto a un parámetro. Por ejemplo, si nos interesa medir el esfuerzo promedio en tensión de un componente crítico, un valor o estimado de punto no será tan relevante como un intervalo en el cual se espera se encuentre el verdadero valor del parámetro. A estos intervalos los conocemos como intervalos de confianza. Un estimado de intervalo de un parámetro desconocido q es un intervalo con formato: l < q < u, donde los puntos extremos l y u dependen del valor numérico del estimado de q para una muestra particular de la distribución muestral de este parámetro. Dado que diferentes muestras producirán diferentes estimados, los puntos extremos del intervalo de cada muestra son variables aleatorias como muestra la siguiente figura. David R. González-Barreto Estadísticas Industriales Marzo 2010 142

Estimado de intervalos David R. González-Barreto Estadísticas Industriales Marzo 2010 143

Estimado de intervalos Suponga que una población tiene un promedio desconocido y una varianza conocida. Una muestra de tamaño n de esta población se denominaría x 1, x 2, x n. Un estimador de punto razonable para el promedio desconocido sería el promedio muestral. La distribución de este promedio será normal si la población es normal y aproximadamente normal si las condiciones del teorema de límite central se cumplen. Por lo tanto, la distribución de la estadística Z x / n es una distribución normal estándar David R. González-Barreto Estadísticas Industriales Marzo 2010 144

Estimado de intervalos / 2 Distribución de Z / 2 P z Z z 1 / 2 / 2 x P z z 1 / 2 / 2 / n P x z / n x z / n 1 / 2 / 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 145

Estimado de intervalos De este desarrollo se puede concluir que el intervalo para el (1- ) % de confianza del promedio m cuando se tiene una muestra aleatoria de tamaño n y varianza conocida está dado por: x z / n x z / n / 2 / 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 146

Analisis de Varianza (ANOVA) Las pruebas de hipótesis estudiadas son métodos que comparan dos tratamientos. Sin embargo, muchos experimentos requieren comparaciones de más de dos tratamientos simultáneamente. Se puede demostrar que si intentamos hacer pruebas para cada pareja de medias o promedios, el error tipo I incrementaría sustancialmente. Por ejemplo, un factor con 5 niveles o tratamientos necesitará 10 pruebas si se toman por parejas. Si establece.05 como su error Tipo I, entonces su nivel de confianza para cada prueba individual es 1 -.05 = 0.95. Si decimos que las pruebas son independientes, la probabilidad de aceptar la hipótesis nula correctamente en las 10 pruebas será de (0.95) 10 = 0.60. David R. González-Barreto Estadísticas Industriales Marzo 2010 147

ANOVA El procedimiento apropiado para probar la igualdad de varias medias o promedios se conoce como análisis de varianza o ANOVA. ANOVA - metodología estadística para probar la igualdad de promedios cuando existen más de dos promedios. Probablemente es la técnica más útil en el campo de la estadística inferencial. David R. González-Barreto Estadísticas Industriales Marzo 2010 148

ANOVA PRESUNCIONES DE ANOVA Errores o residuales siguen una distribución normal con promedio cero y varianza constante. Errores son independientes. El nombre de análisis de varianza (ANOVA) se deriva de la partición de la variabilidad total encontrada en sus componentes. Para entender esa partición primero tenemos que definir unos términos. David R. González-Barreto Estadísticas Industriales Marzo 2010 149

ANOVA 1 2. a y i = suma de las observaciones en el nivel i y 11 y 12... y 1n y 21 y 22... y 2n y a1 y a2... y an y i y y = promedio de las observaciones en el nivel i = suma total de las observaciones = promedio de todas las observaciones y 1. y 2. y a. y.. N = an = número total de observaciones y 1. y 2. y a. y.. SS TOTAL a n i 1 j 1 y ij y.. 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 150

ANOVA SS TOTAL a n i 1 j 1 yi. y.. y ij y i. 2 SS TOTAL n a i 1 y i. y.. 2 a n i 1 j 1 y ij y i. 2 2 a n i 1 j 1 y i. y.. y ij y i. j n 1 y ij y i. y i. ny i. y i. n y n i. 0 a n i 1 j 1 y ij y 2 a 2.. n yi. y.. yij yi. i 1 2 Ecuación fundamental de la descomposición de la suma de cuadrados David R. González-Barreto Estadísticas Industriales Marzo 2010 151

ANOVA En palabras podemos expresar la ecuación previa de la siguiente manera: SS TOTAL SS TRATAMIENTOS SS ERROR Puede demostrarse que con los grados de libertad sucede lo mismo. gl gl gl TOTAL TRATAMIENTOS N-1 = a-1 + N-a ERROR David R. González-Barreto Estadísticas Industriales Marzo 2010 152

ANOVA Ya teniendo los componentes de la suma de cuadrados con sus correspondientes grados de libertad podemos construir la ANOVA. Fuentes Suma de Cuadrados gl Promedio de Cuadrados Fc Tratamientos SS TRAT. a-1 MS TRAT. =SS TRAT. /(a-1) Error SS ERROR N-a MS ERROR =SS ERROR /(N-a) MS TRAT. MS ERROR Total SS TOTAL N-1 David R. González-Barreto Estadísticas Industriales Marzo 2010 153

ANOVA Entonces la hipótesis que tratará de probar Anova será la siguiente: H H :... 0 1 2 1 : i j a...para al menos una i, j Una forma equivalente para establecer la hipótesis sería: H H 0 1 : T :T 1 i T 0 2...T a para al 0 menos una i David R. González-Barreto Estadísticas Industriales Marzo 2010 154

ANOVA Una vez terminada la ANOVA y rechazada la H 0 algunas pruebas nos permiten determinar entre cuales tratamientos o niveles en específico existe la diferencia de promedios. La Diferencia Significativa Mínima (LSD) es una de éstas. La misma consiste de : 1. Calcular LSD = 2. Calcular y i. y j. t / 2, N a MS E 1 n i 1 n j 3. Si y y LSD i. j. Concluir que i y j son diferentes. David R. González-Barreto Estadísticas Industriales Marzo 2010 155

ANOVA - Ejemplo Un manufacturero de papel produce fundas para cargar compras. El está interesado en mejorar el esfuerzo en tensión que resisten las mismas. Se sospecha que el % de madera en la pulpa utilizada para la manufactura puede afectar el esfuerzo en tensión. La siguiente tabla muestra los resultados de su experimento. % de madera en la pulpa 5% 10% 15% 20% 7 12 14 19 8 17 18 25 15 13 19 22 11 18 17 23 9 19 16 18 10 15 18 20 David R. González-Barreto Estadísticas Industriales Marzo 2010 156

Conc Prin EDA Estim Dist Mues Hyp Cont Cap R&R ANOVA - Ejemplo ANOVA Table for Esfuerzo by Conc Analysis of Variance ----------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------- Between groups 382.792 3 127.597 19.61 0.0000 Within groups 130.167 20 6.50833 ----------------------------------------------------------------------------- Total (Corr.) 512.958 23 Box-and-Whisker Plot 5 10 15 20 7 10 13 16 19 22 25 Esfuerzo David R. González-Barreto Estadísticas Industriales Marzo 2010 157

ANOVA Ejemplo Multiple Range Tests for Esfuerzo by Conc -------------------------------------------------------------------------------- Method: 95.0 percent LSD Conc Count Mean Homogeneous Groups -------------------------------------------------------------------------------- 5 6 10.0 X 10 6 15.6667 X 15 6 17.0 X 20 6 21.1667 X -------------------------------------------------------------------------------- Contrast Difference +/- Limits -------------------------------------------------------------------------------- 5-10 *-5.66667 3.07243 5-15 *-7.0 3.07243 5-20 *-11.1667 3.07243 10-15 -1.33333 3.07243 10-20 *-5.5 3.07243 15-20 *-4.16667 3.07243 -------------------------------------------------------------------------------- * denotes a statistically significant difference. David R. González-Barreto Estadísticas Industriales Marzo 2010 158

Gráficos de Control La insatisfacción de los clientes es causada por la variabilidad del producto: las características del producto no ejecutan de acuerdo a las expectativas o ejecutan de manera diferente de unidad a unidad. La variabilidad del producto es el resultado de la variabilidad en el proceso que lo crea. Por tanto, la clave para lograr productos de alta calidad es limitar la variabilidad del proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 159

Gráficos de Control Ningún proceso puede ser perfectamente repetible, alguna variabilidad siempre existirá y ésta a su vez será transmitida al producto. El objetivo es mantener el proceso estable y predecible a través del tiempo, a esto le llamamos un proceso en control. La herramienta que usamos para monitorear la estabilidad del proceso es el gráfico de control. David R. González-Barreto Estadísticas Industriales Marzo 2010 160

Gráficos de Control Para datos continuos, el monitorear la estabilidad del proceso requiere dos gráficos: el primero maneja la localización de la distribución, mientras el segundo trabaja con la variabilidad del proceso. El gráfico más común utilizado para monitorear la localización es el X - barra ( ). Los gráficos para la variabilidad incluyen el S (desviación estándar) y el gráfico R (del rango). x David R. González-Barreto Estadísticas Industriales Marzo 2010 161

Gráficos de Control Los gráficos de control son una herramienta importante en el mejoramiento de procesos. Estos gráficos proveen señales visuales que indican cuándo eventos excepcionales o condiciones fuera de control ocurren en el proceso. Usar nuestros planes de respuesta o realizar análisis para encontrar la raíz de la señal, permite que el proceso, así como el producto que resulta del mismo, puedan ser mejorados de forma sistemática y continua. David R. González-Barreto Estadísticas Industriales Marzo 2010 162

Gráficos de Control Tipos de variabilidad Intrínseca o natural - efecto cumulativo de pequeñas e inevitables causas en el proceso. Externa (causa asignable) - comúnmente provienen de fuentes externas controlables. Generalmente son mayor que la variabilidad intrínseca y, por lo tanto, representan un nivel inaceptable en la ejecutoria del proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 163

Gráficos de Control Un proceso que su única causa de variabilidad es natural, se considera que opera en control estadístico. Un proceso que opera en presencia de causas asignables de variabilidad se dice está fuera de control estadístico. Mediante el uso de gráficos de control podemos identificar y distinguir entre las causas de variabilidad intrínseca y externa del proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 164

Gráficos de Control LCS LC LCI w w w w w característica de calidad LCS LC } w k w } k w LCI # de muestra o sequencia (tiempo) David R. González-Barreto Estadísticas Industriales Marzo 2010 165

Decisión Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control Realidad En control Fuera de control En control Decisión correcta Fuera de control Decisión correcta David R. González-Barreto Estadísticas Industriales Marzo 2010 166

Gráficos de Control Selección de los límites de control Alejando los límites de la línea central se disminuye la probabilidad de error tipo I pero se aumenta la probabilidad de error tipo II. Aunque comúnmente se usan 3 w como límites, la selección de estos puede depender de factores económicos. Si las pérdidas asociadas con dejar el proceso operar en estado fuera de control superan por mucho los costos de investigar y posiblemente corregir las causas asignables, múltiples menores de sigma (2.5 ó 2) serían apropiados. David R. González-Barreto Estadísticas Industriales Marzo 2010 167

Gráficos de Control Tamaño de la muestra y frecuencia del muestreo Lo más deseable para poder detectar desplazamientos en el proceso sería tomar muestras grandes frecuentemente. Pero esto no es lo mejor desde el punto de vista económico. En la industria se tiende a favorecer muestras pequeñas pero frecuentes, especialmente en procesos con un alto volumen de producción. Además de las Curvas Características Operacionales (O. C.) otro criterio para determinar el tamaño de muestra y la frecuencia del muestreo es el largo promedio de corrida (ARL) del gráfico de control. David R. González-Barreto Estadísticas Industriales Marzo 2010 168

Gráficos de Control ARL = número promedio de puntos que serán graficados antes de que un punto indique condición de fuera de control. p = probabilidad de que un punto salga de los límites de control ARL 1 p David R. González-Barreto Estadísticas Industriales Marzo 2010 169

Gráficos de Control Límites de control ARL en Control + 3 sigmas 0.0027 370 + 2 sigmas 0.045 22 + 1 sigma 0.32 3 Cambio en promedio 1- ARL fuera de control 3 sigmas 0.5 0.5 2 2 sigmas 0.84 0.16 6.25 1 sigma 0.975 0.025 40 David R. González-Barreto Estadísticas Industriales Marzo 2010 170

Fundamentos Gráficos de Control /2 LCS LC /2 LCI David R. González-Barreto Estadísticas Industriales Marzo 2010 171

Característica de calidad Prin EDA Estim Dist Mues Hyp Cont Cap R&R Fundamentos Gráficos de Control /2 1 - LCS LC /2 LCI Orden de producción David R. González-Barreto Estadísticas Industriales Marzo 2010 172

Característica de calidad Prin EDA Estim Dist Mues Hyp Cont Cap R&R Fundamentos Gráficos de Control /2 1 - LCS 3 1 2 LC /2 LCI Orden de producción David R. González-Barreto Estadísticas Industriales Marzo 2010 173

Fundamentos Gráficos de Control LCS Cambio en promedio LC LCI David R. González-Barreto Estadísticas Industriales Marzo 2010 174

Fundamentos Gráficos de Control Cambio en dispersión LCS LC LCI David R. González-Barreto Estadísticas Industriales Marzo 2010 175

Gráficos de Control Subgrupos racionales - Este concepto establece que las muestras deben ser seleccionadas de forma tal que si hay causas asignables, la posibilidad de diferencias entre muestras o subgrupos se maximice mientras que la posibilidad de diferencias debido a causas asignables dentro de las muestras se minimice. Nota: Un ejemplo de un subgrupo racional inadecuado sería formar una muestra (subgrupo) que tenga observaciones del final de un turno y el principio de otro. Esto haría difícil detectar una diferencia entre turnos. David R. González-Barreto Estadísticas Industriales Marzo 2010 176

Gráficos de Control - Ejemplo En la manufactura de pistones para motores de carro, una característica de calidad importante es el diámetro del pistón. El proceso podría estar controlado con un diámetro promedio de 74 mm. La desviación estándar de los pistones es 0.1mm (n = 5). 1. Construya una gráfica de control para x con: límites a 3 3 w límites a /2 = 0.001 2. A 3, cuál es la probabilidad de error tipo I? 3. Para los límites 3, cuál es el ARL? 4. Cuánto será el ARL, si n = 5, el proceso se sale de control y además la media se desplaza de 74.000 a 74.134mm? 5. Si n = 10, cuál sería el ARL? David R. González-Barreto Estadísticas Industriales Marzo 2010 177

Gráficos de Control - Ejemplo Solución: w = 74mm, 0.1 w n 5 0. 045 1 (a) LCS = w + k w 74 + 3(0.045) = 74.134 LC = w = 74.00 LCI = w - k w 74-3(0.045) = 73.866 David R. González-Barreto Estadísticas Industriales Marzo 2010 178

Gráficos de Control - Ejemplo 1 (b) LCS = w + /2 w 74 + 3.09(0.045) = 74.139 LC = w = 74.00 LCI = w - /2 w 74 3.09(0.045) = 73.861 David R. González-Barreto Estadísticas Industriales Marzo 2010 179

Gráficos de Control característica de calidad LCS (1b) = 74.139 LCS = 74.134 (1a) LC = 74.0 LCS = 73.866 (1a) LCS LC } w k w } k w LCS (1b) = 73.861 LCI # de muestra o sequencia (tiempo) David R. González-Barreto Estadísticas Industriales Marzo 2010 180

Gráficos de Control - Ejemplo 2. /2 = 3 (3) = 0.99865, 1 - = /2 = 0.00135 = 0.00135 (2) = 0.0027 3. Para obtener el ARL primero construiremos las curvas O.C. para 0.0027 Z / 2 3 ARL 1 p 1 0.0027 370 Es el largo promedio de la corrida del gráfico x cuando el proceso está en control estadístico. O sea que, aunque el proceso esté en control se verá una falsa alarma de fuera de control cada 370 muestras. David R. González-Barreto Estadísticas Industriales Marzo 2010 181

Gráficos de Control - Ejemplo 4. El desplazamiento coincide con el límite de control superior, por lo tanto, la probabilidad de que x esté entre los límites de control es 0.50. De manera que, la probabilidad de que esté fuera es p = 1 0.50 = 0.50: ARL 1 0.5 2 Esto es que el gráfico de control requerirá en promedio dos muestras de tamaño n = 5 para detectar el desplazamiento de : 0 74.00 a 1 74.134 En promedio, con dos muestras se podrá detectar el desplazamiento. 5. Se puede demostrar que la probabilidad de detectar el cambio cuando el tamaño de muestra se incrementa a n = 10, es mayor que en el caso anterior cuando n = 5. Por lo tanto, se espera un ARL < 2. David R. González-Barreto Estadísticas Industriales Marzo 2010 182

Base Estadística de los Gráficos de Control para Variables Prin EDA Estim Dist Mues Hyp Cont Cap R&R El promedio muestral de una característica de calidad normalmente distribuida N (, ) es: x x 1 x 2... n x n x ~ N, x donde x n Existe una probabilidad 1 - de que el promedio muestra x caiga entre: z 2 x Por teorema de límite central asumimos normalidad en la distribución de x. Cuando no sabemos y, los podemos estimar con muestras preliminares. Al menos 20 muestras con n observaciones de la característica de calidad medida. Entonces el estimado de, el promedio del proceso es: x x 1 x 2... m x m David R. González-Barreto Estadísticas Industriales Marzo 2010 183

Base Estadística de los Gráficos de Control para Variables Prin EDA Estim Dist Mues Hyp Cont Cap R&R Un estimador de la desviación estándar ( ) cuando n < 10 es: x... R ˆ R 1 2 donde R m d2 m R R R 1 xmax xmin d 2 = parámetro de la distribución de rango relativo (W = R/ ) Su valor depende de n. Antes de tratar de controlar el promedio hay que controlar la variabilidad ya que, los límites de control gráfico x dependen de la variabilidad del proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 184

Gráficos de Control R Se utiliza para controlar la variabilidad del proceso cuando n < 10. Los límites de control para el gráfico R son: R LCS R 3 ˆ R R 3d 3 RD d 2 4 LC R R LCI R 3 ˆ R R 3d 3 RD d 2 3 D 3 y D 4 son valores tabulados. David R. González-Barreto Estadísticas Industriales Marzo 2010 185

Gráfico de Control X-Barra Se usa para controlar el promedio del proceso. Los límites de control son: 3 LCS x R x A2 R d n 2 LC x 3 LCI x R x A2 R d n 2 A 2 es un valor en la tabla. David R. González-Barreto Estadísticas Industriales Marzo 2010 186

Gráficos de Control S Se utiliza para controlar la variabilidad del proceso cuando n 10. Cuando es desconocida un estimador será: s 2 i n l x n 1 1 x 2 y los límites de control serán: s 2 LCS s 3 1 c4 B4s c 4 LC s LCI s s 2 3 1 c4 B c 4 3 B 4 y B 3 son valores tabulados y s 1 m m l s i David R. González-Barreto Estadísticas Industriales Marzo 2010 187

Gráficos de Control S Entonces los límites de control para el gráfico x son: 3s LCS x x A3 s c n 4 LC x 3s LCI x x A3 s c n 4 David R. González-Barreto Estadísticas Industriales Marzo 2010 188

Gráficos de Control - Ejemplo Se desea establecer control estadístico para el ancho de tabletas. Se toman 25 muestras de 5 observaciones cada una. Muestra X 1 X 2 X 3 X 4 X 5 x R 1 20 22 21 23 22 21.6 3 2 19 18 22 20 20 19.8 4 3 25 18 20 17 22 20.4 8 4 20 21 22 21 21 21 2 5 19 24 23 22 20 21.6 5 6 22 20 18 18 19 19.4 4 7 18 20 19 18 20 19 2 8 20 18 23 20 21 20.4 5 9 21 20 24 23 22 22 4 10 21 19 20 20 20 20 2 11 20 20 23 22 20 21 3 12 22 21 20 22 23 21.6 3 13 19 22 19 18 19 19.4 4 14 20 21 22 21 22 21.2 2 15 20 24 24 23 23 22.8 4 *En la tabla se presentan las primeras quince muestras David R. González-Barreto Estadísticas Industriales Marzo 2010 189

X-bar Range Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control - Ejemplo 23 22 21 20 19 18 X-bar Chart for Ancho 0 5 10 15 20 25 Subgroup UCL = 22.85 Centerline = 20.84 LCL = 18.83 Luego de eliminar la muestra 3 y recalcular los límites del gráfico R, nos percatamos de que las muestras 22 y 23 del gráfico están fuera de los límites de control. Una vez conseguimos las causas asignables de estos, los eliminamos y recalculamos los límites de control del gráfico. Range Chart for Ancho 8 UCL = 7.36 6 Centerline = 3.48 LCL = 0.00 4 2 0 0 5 10 15 20 25 Subgroup David R. González-Barreto Estadísticas Industriales Marzo 2010 190

Range X-bar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control - Ejemplo 23 22 21 20 19 18 8 6 4 2 0 X-bar Chart for Ancho 0 5 10 15 20 25 Subgroup Range Chart for Ancho 0 5 10 15 20 25 Subgroup UCL = 22.76 Centerline = 20.86 LCL = 18.96 UCL = 6.96 Centerline = 3.29 LCL = 0.00 Al graficarse los restantes puntos dentro de los límites recalculados, notará que el punto número 15 está todavía fuera de control en el gráfico del promedio. Por esta razón necesitaríamos recalcular nuestros límites nuevamente. Una vez todos los puntos se encuentren dentro de los límites de control y no muestren ningún patrón sistemático, asumiremos los límites recién calculados como los límites de control del proceso. De este momento en adelante trazaremos los puntos del proceso en tiempo real haciendo uso de los límites estimados. De encontrar alguna señal de que el proceso se encuentra fuera de control hay que investigar la causa. David R. González-Barreto Estadísticas Industriales Marzo 2010 191

Gráficos de Control - Ejemplo Ilustración de los gráficos de control tamaño variable. x y S usando 25 muestras pero de Muestra X 1 X 2 X 3 X 4 X 5 x S 1 74.030 74.002 74.019 73.992 74.008 74.010 0.0148 2 73.995 73.992 74.001 73.996 0.0046 3 73.988 74.024 74.021 74.005 74.002 74.008 0.0106 4 74.002 73.996 73.993 74.015 74.009 74.003 0.0091 5 73.992 74.007 74.015 73.989 74.014 74.003 0.0122 6 74.009 73.994 73.997 73.985 73.996 0.0099 7 73.995 74.006 73.994 74.000 73.999 0.0055 8 73.985 74.003 73.993 74.015 73.988 73.997 0.0123 9 74.008 73.995 74.009 74.005 74.004 0.0064 10 73.998 74.000 73.990 74.007 73.995 73.998 0.0063 11 73.994 73.998 73.994 73.995 73.990 73.994 0.0029 12 74.004 74.000 74.007 74.000 73.996 74.001 0.0042 13 73.983 74.002 73.998 73.994 0.0100 14 74.006 73.967 73.994 74.000 73.984 73.990 0.0153 15 74.012 74.014 73.998 74.008 0.0087 *En la tabla se presentan las primeras quince muestras David R. González-Barreto Estadísticas Industriales Marzo 2010 192

Range X-bar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control - Ejemplo X-bar Chart for Ancho 74.02 74.01 74 UCL = 74.01 Centerline = 74.00 LCL = 73.99 73.99 73.98 0 5 10 15 20 25 Subgroup Range Chart for Ancho 0.05 0.04 0.03 0.02 0.01 UCL = 0.05 Centerline = 0.02 LCL = 0.00 0 0 5 10 15 20 25 Subgroup David R. González-Barreto Estadísticas Industriales Marzo 2010 193

Curva O.C. La probabilidad de error tipo II para el gráfico de control x está dada por: P LCL x UCL \ 1 0 k Dado que 2 x ~ N, y sus límites de control son: n UCL 3 0 n LCL 3 0 n UCL k 0 LCL 0 n n k 3 n 0 k 3 n k 0 0 0 n n 3 k n 3 k n David R. González-Barreto Estadísticas Industriales Marzo 2010 194

Curva O.C. - Ejemplo Si n = 5 y se quiere saber la probabilidad de detectar un desplazamiento de 1 = 0 + 2 en la primera muestra después del desplazamiento. 1.0 0.9 0.8 0.7 Plot la probabilidad de detectar el desplazamiento: 3 5 3 2 5 1.47 7.37 0.0708 La curva característica operacional para varios tamaños de muestras (n) se presenta a continuación. 1 1 0.0708 0.9292 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0.5 1 1.5 2 2.5 3 3.5 k oc_n=1 oc_n=5 oc_n=7 oc_n=8 oc_n=10 oc_n=15 David R. González-Barreto Estadísticas Industriales Marzo 2010 195

Gráficos de Control para Medidas Individuales Existen muchas situaciones donde el tamaño de muestra para monitorear el proceso es 1 (n = 1). Algunos ejemplos de estas situaciones se describen a continuación: La inspección es automatizada permitiendo que cada unidad manufacturada sea analizada. La razón de producción es muy lenta, haciendo prácticamente imposible o indeseable que tamaños de muestras mayores de 1 (n > 1), puedan acumularse para ser analizadas. En algunos procesos, como por ejemplo, la fabricación de papel, se toman medidas en múltiples localizaciones a través del rollo. Por ejemplo, podemos tomar medidas del espesor del rollo, esto produciría una desviación estándar que es muy pequeña si el objetivo es el de controlar el espesor del rollo a lo largo del mismo. David R. González-Barreto Estadísticas Industriales Marzo 2010 196

Gráficos de Control para Medidas Individuales El gráfico de medidas individuales usa el rango movible de dos observaciones consecutivas para estimar la variabilidad del proceso. El rango movible se define como: i xi xi 1 MR. Los parámetros para el gráfico de control de medidas individuales son: LCS x 3 d MR 2 x Línea central = LCS x 3 d MR 2 David R. González-Barreto Estadísticas Industriales Marzo 2010 197

Gráficos de Control para Medidas Individuales - Ejemplo La viscosidad de un primer de pintura es una importante característica de calidad. El producto se produce en lotes y como producir cada lote toma varias horas, el tiempo de producción es muy lento para permitir que se haga más de una muestra. Lote Viscosidad x Rango Movible MR 1 33.75 2 33.05 0.70 3 34.00 0.95 4 33.81 0.19 5 33.46 0.35 6 34.02 0.56 7 33.68 0.34 8 33.27 0.41 9 33.49 0.22 10 33.20 0.29 11 33.62 0.42 12 33.00 0.62 13 33.54 0.54 14 33.12 0.42 15 33.84 0.72 x 33.52 MR 0. 48 David R. González-Barreto Estadísticas Industriales Marzo 2010 198

X MR(2) Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control para Medidas Individuales - Ejemplo X Chart for Viscocidad 35 34.5 34 33.5 33 32.5 32 0 3 6 9 12 15 Observation UCL = 34.80 Centerline = 33.52 LCL = 32.24 1.6 1.2 0.8 MR(2) Chart for Viscocidad UCL = 1.57 Centerline = 0.48 LCL = 0.00 0.4 0 0 3 6 9 12 15 Observation David R. González-Barreto Estadísticas Industriales Marzo 2010 199

Gráficos de Control para Medidas Individuales - Ejemplo En la siguiente tabla se muestran 15 lotes adicionales para el ejemplo de la viscosidad de la pintura. Lote Viscosidad x Rango Movible MR 16 33.50 0.34 17 33.25 0.25 18 33.40 0.15 19 33.27 0.13 20 34.65 1.38 21 34.80 0.15 22 34.55 0.25 23 35.00 0.45 24 34.75 0.25 25 34.50 0.25 26 34.70 0.20 27 34.29 0.41 28 34.61 0.32 29 34.49 0.12 30 35.03 0.54 David R. González-Barreto Estadísticas Industriales Marzo 2010 200

MR(2) X Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control para Medidas Individuales - Ejemplo X Chart for Viscocidad1 36 35 34 UCL = 35.01 Centerline = 33.92 LCL = 32.83 33 32 0 5 10 15 20 25 30 Observation MR(2) Chart for Viscocidad1 1.5 1.2 0.9 0.6 0.3 UCL = 1.34 Centerline = 0.41 LCL = 0.00 0 0 5 10 15 20 25 30 Observation David R. González-Barreto Estadísticas Industriales Marzo 2010 201

Gráficos de Control para Medidas Individuales - Ejemplo Algunos analistas recomiendan no construir el gráfico de los rangos movibles. Ellos señalan que estos no muestran realmente cambios en la variabilidad del proceso. Más bien muestran cambios en el promedio del proceso. Esto se muestra claramente en las figuras anteriores donde cambios en el promedio alrededor del lote #20 se perciben en ambos gráficos, en el de medidas individuales y en el de los rangos movibles. Nota: En estos gráficos, de medidas individuales, hemos hecho la presunción de que las observaciones provienen de una distribución normal. Esta presunción es crítica para este gráfico. Si mediante cualquier prueba encontramos evidencia de que esta presunción no se cumple, tendríamos que determinar los límites de control para las medidas individuales basándonos en las percentilas de la distribución apropiada. En este caso, utilizar las fórmulas discutidas para calcular los límites sería incorrecto. David R. González-Barreto Estadísticas Industriales Marzo 2010 202

Gráfico de Control EWMA El gráfico de control EWMA es una buena alternativa a los gráficos tradicionales Shewhart, cuando nos interesa detectar desplazamientos muy pequeños en el proceso. Este gráfico se utiliza típicamente con observaciones individuales pero como veremos es posible crear subgrupos cuyo tamaño de muestra n > 1. La estadística EWMA se define como: z i x i ( 1 ) zi 1 donde 0 < < 1 es una constante y el valor inicial necesario para la primera muestra se define como el valor deseado z 0 = 0 David R. González-Barreto Estadísticas Industriales Marzo 2010 203

Gráfico de Control EWMA Otra alternativa usada para el valor inicial es z 0 x. La siguiente ecuación muestra que la estadística EWMA a la que llamamos z, es un promedio pesado de los promedios muestrales previos: Por ejemplo, si z z i i x x i i (1 (1 ) x ) x i 1 i 1 (1 (1 ) z ) = 0.2 entonces los pesos asignados a las observaciones 2 i z i 2 2 previas serán 0.16, 0.128, 0.1024,. Mientras que el peso asignado a la observación actual será de 0.2. Debido a que estos pesos declinan de forma geométrica algunas personas conocen este gráfico como el de promedio geométrico movible. David R. González-Barreto Estadísticas Industriales Marzo 2010 204

Gráfico de Control EWMA Si las observaciones individuales x i son independientes con varianza límites del gráfico EWMA estarán dados por: 2 los LCS 0 k (2 ) 1 (1 ) 2i LC 0 LCI 0 k (2 ) 1 (1 ) 2i David R. González-Barreto Estadísticas Industriales Marzo 2010 205

Gráfico de Control EWMA En estas ecuaciones K sirve para determinar el ancho de los límites que se desea, mientras que i representa la muestra bajo consideración. Como estos límites dependen de la muestra bajo consideración los mismos no son constantes como veremos en el ejemplo que se presenta a continuación. Sin embargo a medida que i aumenta los límites tienden a estabilizarse de la siguiente manera: LCS 0 k (2 ) LC 0 LCI 0 k (2 ) No obstante la mayoría de los autores recomiendan utilizar la definición original para mantener los límites exactos en los valores pequeños de i. David R. González-Barreto Estadísticas Industriales Marzo 2010 206

Gráfico de Control EWMA Ejemplo Los siguientes son datos para el peso de partículas tomadas en un laboratorio. Se presume = 0.10 y k = 2.7 Muestra Observación 1 9.45 2 7.99 3 9.29 4 11.66 5 12.16 6 10.18 7 8.04 8 11.46 9 9.2 10 10.34 11 9.03 12 11.47 13 10.51 14 9.4 15 10.08 *En esta tabla se presentan las primeras quince observaciones. David R. González-Barreto Estadísticas Industriales Marzo 2010 207

EWMA Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráfico de Control EWMA Ejemplo EWMA Chart for Peso 11.2 10.8 10.4 10 9.6 9.2 UCL = 11.14 Centerline = 10.02 LCL = 8.89 8.8 0 5 10 15 20 25 30 Observation David R. González-Barreto Estadísticas Industriales Marzo 2010 208

Gráfico de Control EWMA Como dijimos anteriormente, estos gráficos son muy efectivos detectando cambios pequeños en el proceso. El diseño de los mismos envuelve determinar la constante K así como la constante. Estudios han determinado que valores de en el intervalo 0.05 < < 0.25 trabajan muy bien en la práctica. Los valores = 0.05, = 0.10 y = 0.20 son los más frecuentemente utilizados. Una práctica adecuada es seleccionar valores pequeños de para detectar cambios más pequeños. También se ha encontrado que k = 3 trabaja bastante bien en la práctica especialmente para valores grandes de. Sin embargo, cuando < 0.10 los estudios han encontrado que k debe considerarse dentro del siguiente intervalo 2.6 < k < 2.8. David R. González-Barreto Estadísticas Industriales Marzo 2010 209

Gráfico de Control EWMA Un detalle que es importante señalar es que el gráfico tradicional Shewhart reacciona más rápido que el EWMA para desplazamientos grandes. Por lo que algunos autores han sugerido un esquema de control que incluya ambos gráficos simultáneamente. EWMA con n > 1 Por lo general el gráfico EWMA se utiliza con observaciones individuales. Sin embargo, si los subgrupos racionales consisten de más de una observación, n > 1, entonces todo lo que necesitamos hacer es reemplazar x i por y por en las ecuaciones previamente discutidas. x i n David R. González-Barreto Estadísticas Industriales Marzo 2010 210

Gráficos de Control por Atributos Cuando los datos son de tipo discreto, los gráficos de control están asociados con modelos de distribuciones discretas. Los gráficos más conocidos para esta clasificación de datos lo son: el gráfico p, para la fracción de defectuosos, y el gráfico c, para el control de defectos. Los modelos asociados con cada uno de estos son el binomial y el Poisson, respectivamente. David R. González-Barreto Estadísticas Industriales Marzo 2010 211

Gráficos de Control por Atributos Los límites de control estándar para ambos gráficos se muestran a continuación: Para el gráfico p p(1 p), donde p-barra es p 3 la fracción de defectuosos n promedio Para el gráfico c promedio de defectos. c 3 c, donde c-barra es el David R. González-Barreto Estadísticas Industriales Marzo 2010 212

Critical Prin EDA Estim Dist Mues Hyp Cont Cap R&R Plan de Control Product: Line: Product Characteristic Process Steps Voice of the Customer Low er Spec Limit Target [Area name here] Control Plan Reference Documents No. and Revision: Upper Spec Limit units Measurement Data Type Sample Frequency Measurement System Instrument Used Gage Capability Voice of the Process Process Cpk or PPM Prioritization Me (e.g. FMEA, Busine Control Tools Monitoring System Response Plan David R. González-Barreto Estadísticas Industriales Marzo 2010 213

Análisis de Capacidad Capacidad - La habilidad de un proceso para producir productos dentro de las especificaciones establecidas. Un proceso se dice que es capaz cuando la gran mayoría del producto confeccionado por el mismo está dentro de las especificaciones. Indices de la capacidad del proceso - Miden la capacidad de un proceso. David R. González-Barreto Estadísticas Industriales Marzo 2010 214

Variabilidad La voz del proceso se representa por la variabilidad observada en el proceso. El proceso nos dice lo que puede lograr. La voz del cliente está representada por las especificaciones del producto. El cliente nos dice lo que desea obtener. La capacidad del proceso nos indica si la voz del proceso podrá complacer la voz del cliente. David R. González-Barreto Estadísticas Industriales Marzo 2010 215

Variabilidad Proceso Controlado usando la filosofía de estar lo más cercano al valor nominal. Proceso Controlado usando la filosofía de cualquier valor dentro de las especificaciones es aceptable. Esp. Inf. Esp. Sup. David R. González-Barreto Estadísticas Industriales Marzo 2010 216