Estadísticas Industriales
|
|
- Benito Castellanos Contreras
- hace 7 años
- Vistas:
Transcripción
1 Estadísticas Industriales Presentado en: Stryker, Puerto Rico David R. González-Barreto Estadísticas Industriales Marzo
2 Variabilidad Virtualmente, todos los procesos y sistemas del mundo real exhiben variabilidad. Las estadísticas son fundamentales en el mejoramiento de la calidad debido a que las técnicas estadísticas se utilizan para describir y entender la variabilidad. En efecto estas técnicas se han utilizado para reducir: el re-trabajo, los desperdicios, la necesidad de inspección y los costos de garantía. David R. González-Barreto Estadísticas Industriales Marzo
3 Variabilidad Por qué ocurre la variabilidad? En términos generales, la variabilidad es el resultado de cambios en las condiciones de los procesos y/o sistemas en donde las medidas se efectúan. En manufactura estos cambios se pueden deber a cambios en las propiedades de los materiales, diferencias en la manera en que las personas realizan su trabajo, diferencias en los parámetros del proceso y finalmente también puede deberse al sistema de medida. El campo de las probabilidades y estadísticas consiste de métodos para describir y modelar la variabilidad y para tomar decisiones cuando ésta está presente. David R. González-Barreto Estadísticas Industriales Marzo
4 Clasificación de los datos Los datos tienen dos clasificaciones: datos contínuos o por variable y datos categóricos o por atributo. Datos por variable - decimos que la escala podría ser infinitamente subdivisible y que está determinada por el instrumento de medida. Datos por atributo - decimos que la escala es meramente un conteo, ejemplo de esto sería la clasificación del número de artículos defectuosos encontrados en una muestra. David R. González-Barreto Estadísticas Industriales Marzo
5 Definiciones Estadísticas - Es la ciencia y el arte de recopilar, mostrar e interpretar datos con el propósito de probar teorías y hacer inferencias acerca de todo tipo de fenómenos. Análisis Exploratorio de Datos (Exploratory Data Analysis EDA) Es el arte de mostrar los datos con un formato atractivo, que a su vez proporcione información de interés para el ingeniero o científico. David R. González-Barreto Estadísticas Industriales Marzo
6 Definiciones Entre las herramientas más utilizadas encontramos: Diagrama de Punto (Dot Diagram) Histograma de Frecuencia Diagrama de Pareto Gráficos de Caja (Boxplots) Sencillo Múltiple Diagrama de Dispersión (Scatter Diagram) David R. González-Barreto Estadísticas Industriales Marzo
7 Diagrama de Punto El diagrama de punto es un gráfico muy útil para mostrar conjuntos pequeños de datos, regularmente hasta alrededor de veinte observaciones. El mismo permite observar fácilmente la localización o la tendencia central así como la dispersión o variabilidad en los datos. Estos diagramas, con frecuencia, nos ayudan a comparar dos o más conjuntos de datos. David R. González-Barreto Estadísticas Industriales Marzo
8 Frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Punto - Ejemplo Considere los siguientes datos que se refieren al esfuerzo en tensión de un tipo de cemento cuando se le añade un polímero (P) El siguiente sería el diagrama de punto correspondiente a estos valores. 1 Dot Diagram P David R. González-Barreto Estadísticas Industriales Marzo
9 Diagrama de Punto - Ejemplo Suponga que los siguientes diez valores corresponden al esfuerzo en tensión de muestras de cemento sin el polímero P : SP David R. González-Barreto Estadísticas Industriales Marzo
10 Diagrama de Punto - Ejemplo En el diagrama de punto anterior puede notarse que el cemento al que se le añade el polímero (P) resulta en un esfuerzo en tensión menor al cemento (SP) común considerado. No obstante, podríamos decir que la variabilidad inherente dentro de cada grupo es fundamentalmente la misma. Cuando el número de datos disponibles es relativamente grande, construir un diagrama de punto no es muy eficiente. Otras técnicas que se discutirán a continuación resultarán ser mucho más efectivas. David R. González-Barreto Estadísticas Industriales Marzo
11 Histograma Una distribución de frecuencia es una forma compacta de resumir los datos. Se obtiene de dividir el rango de los datos en intervalos comúnmente llamados celdas. El número de celdas dependerá del número de observaciones así como de la dispersión encontrada. A la representación gráfica de una distribución de frecuencia es a lo que llamamos histograma. David R. González-Barreto Estadísticas Industriales Marzo
12 Histograma - Ejemplo La siguiente tabla muestra el octanaje de varias marcas de gasolina David R. González-Barreto Estadísticas Industriales Marzo
13 frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Histograma - Ejemplo 40 Histogram for Octanaje Octanaje David R. González-Barreto Estadísticas Industriales Marzo
14 frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Histograma - Ejemplo La siguiente gráfica presenta la distribución acumulativa de los datos nuevamente para el ejemplo del octanaje Histogram for Octanaje Octanaje David R. González-Barreto Estadísticas Industriales Marzo
15 Histograma En la práctica se ha encontrado que utilizar entre cinco y veinte celdas produce resultados satisfactorios. A medida que el número de observaciones aumenta, el número de celdas también debe aumentar. Algunos analistas (e.g. Montgomery) sugieren que este número debe ser aproximado a la raíz cuadrada del número de observaciones. David R. González-Barreto Estadísticas Industriales Marzo
16 Diagrama de Pareto Una variación importante al histograma cuando se utilizan datos categóricos lo es el diagrama de Pareto. Este gráfico es altamente utilizado en los esfuerzos de mejoramiento continuo de la calidad en donde las categorías representan, por ejemplo, tipos de defectos, modos de falla y problemas del proceso. Las categorías son ordenadas en forma descendente. El nombre de este diagrama se debe a un economista italiano cuya ley (Ley de Pareto) puede interpretarse dentro del ambiente industrial de la siguiente forma: la mayoría de los defectos se debe a sólo un puñado de las categorías. David R. González-Barreto Estadísticas Industriales Marzo
17 Diagrama de Pareto - Ejemplo La siguiente tabla muestra defectos estructurales en las puertas de un tipo de automóvil. Categoría Frecuencia Abolladuras 4 Fallos en pintura 6 Fallos en lubricación 5 Fallos de contorno 30 Fuera de secuencia 8 Fallos en terminación 3 David R. González-Barreto Estadísticas Industriales Marzo
18 frequency Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Pareto - Ejemplo Pareto Chart for Frecuencia Fallos de contorno Fallos en pintura Fuera de secuencia Fallos en lubricació Abolladuras Fallos en terminació David R. González-Barreto Estadísticas Industriales Marzo
19 Diagrama de Pareto - Ejemplo En el Diagrama de Pareto anterior podemos observar que las primeras tres categorías ordenadas resultan en alrededor del 79% de las fallas totales. Variaciones al Diagrama de Pareto incluyen: Diagramas de Pareto Pesados Diagramas de Pareto Anidados David R. González-Barreto Estadísticas Industriales Marzo
20 Diagrama de Caja (Boxplot) Un gráfico de caja es una representación esquemática de la mediana muestral, de las cuartilas inferior y superior, y de la observación máxima y mínima de un conjunto de datos. Como muestra la figura en la página siguiente, se construye una caja cuyos extremos corresponden a las cuartilas inferior y superior y unas líneas verticales que salen de los extremos de la caja para representar la observación máxima y mínima respectivamente. Finalmente, una línea corta la caja y representa la mediana muestral. David R. González-Barreto Estadísticas Industriales Marzo
21 Diagrama de Caja (Boxplot) Observación Máxima Cuartila 75% Mediana Cuartila 25% Observación Mínima David R. González-Barreto Estadísticas Industriales Marzo
22 Diagrama de Caja (Boxplot) Un gráfico de caja provee una representación gráfica simple de la forma del conjunto de datos. Note que la mitad de las observaciones están contenidas en la caja y la otra mitad fuera de ella. Si un histograma muestra simetría, entonces las líneas del boxplot deben ser de un largo similar y la mediana debe estar localizada en la vecindad del centro de la caja. Si los datos están sesgados, las líneas no serán de igual largo y la mediana no se localizará cerca del centro de la caja. Muchos paquetes estadísticos representan valores espúreos ( outliers ) con asteriscos fuera de las líneas de los valores máximos. David R. González-Barreto Estadísticas Industriales Marzo
23 Diagrama de Caja - Ejemplo Los datos para la radiación emitida por 42 hornos de microondas se presentan en la siguiente tabla David R. González-Barreto Estadísticas Industriales Marzo
24 Diagrama de Caja - Ejemplo Box-and-Whisker Plot Radiacion David R. González-Barreto Estadísticas Industriales Marzo
25 Diagrama de Caja - Ejemplo Como puede observarse, las radiaciones emitidas con valor igual a 0.4 son identificadas por este gráfico como valores espúreos. También se puede notar del gráfico que la distribución de las radiaciones parece sesgarse hacia los valores altos. Los diagramas de caja son muy útiles para hacer comparaciones entre conjuntos o poblaciones de datos. En el siguiente ejemplo se muestra este uso al comparar dos poblaciones de bombillas. David R. González-Barreto Estadísticas Industriales Marzo
26 Diagrama de Caja - Ejemplo Un estudio se realiza para comparar el efecto de dos distintos filamentos (Tipo A, Tipo B) en el número de horas de servicio de unas bombillas. Diez observaciones para cada tipo de filamento aparecen en la siguiente tabla. A B David R. González-Barreto Estadísticas Industriales Marzo
27 Tipo Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Caja - Ejemplo Box-and-Whisker Plot A B Horas Este boxplot muestra claramente cómo el filamento Tipo A redunda en largos de vida mucho mayores que el Tipo B, pero a su vez induce una mayor variabilidad. David R. González-Barreto Estadísticas Industriales Marzo
28 Diagrama de Dispersión Los gráficos estudiados hasta el momento nos ayudan a entender la distribución de una variable. Los diagramas de dispersión son útiles para estudiar la relación entre dos variables. Esta gráfica presenta simplemente pares ordenados (x i, y i ), con el propósito de detectar alguna relación entre las variables. David R. González-Barreto Estadísticas Industriales Marzo
29 Diagrama de Dispersión David R. González-Barreto Estadísticas Industriales Marzo
30 Diagrama de Dispersión Relación positiva - los puntos en el diagrama siguen una trayectoria lineal ascendente. Relación negativa - los puntos en el diagrama siguen una trayectoria lineal descendente, o sea, mientras una de las variables disminuye la otra aumenta. Relación no lineal los puntos en el diagrama siguen una trayectoria curvilínea. Relación no sistemática los puntos en el diagrama muestran un patrón aleatorio que no sigue ninguna de las relaciones antes indicadas. Esto puede ser interpretado como la independencia entre ambas variables. David R. González-Barreto Estadísticas Industriales Marzo
31 Diagrama de Dispersión Ejemplo En la tabla que se presenta a continuación y representa la pureza del oxígeno producida por un proceso químico mientras que x es el porcentaje de hidrocarbonos presentes en el condensador de la unidad de destilación. David R. González-Barreto Estadísticas Industriales Marzo
32 Diagrama de Dispersión Ejemplo Observación x y David R. González-Barreto Estadísticas Industriales Marzo
33 Y Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diagrama de Dispersión Ejemplo Plot of Y vs X X David R. González-Barreto Estadísticas Industriales Marzo
34 Diagrama de Dispersión Ejemplo La inspección de este diagrama indica que aunque ninguna curva contendría exactamente todos los puntos, una relación lineal positiva parece existir entre estas dos variables. Nota de cautela: El que este diagrama muestre una relación aparente entre las variables no puede tomarse como que existe una causalidad entre éstas. David R. González-Barreto Estadísticas Industriales Marzo
35 Muestra vs. Población Población Muestra x 1 x 2 x 3 x 4 : x. n Parámetros x, S Estadísticas 2, S, r,... David R. González-Barreto Estadísticas Industriales Marzo
36 Medidas de Tendencia Central Promedio muestral n x i x i 1 n El valor del promedio muestral tiene mayor precisión que cada observación individual. Por lo tanto, en la mayoría de los casos éste será representado con un dígito más que los utilizados para las observaciones individuales. David R. González-Barreto Estadísticas Industriales Marzo
37 Medidas de Tendencia Central Mediana La mediana es el punto en el cual la muestra es dividida en dos mitades. Si x (1), x (2),, x (n) representa una muestra ordenada en forma ascendente, entonces la mediana se define como la observación del medio o la observación ([n + 1] / 2) cuando n es impar y el promedio de las dos observaciones del medio si n es par. David R. González-Barreto Estadísticas Industriales Marzo
38 Medidas de Tendencia Central En términos matemáticos, x x n 1 / 2 ~ x n/ 2 n/, n impar x 2 1, n par 2 La ventaja fundamental de la mediana es que ésta no es influenciada por valores extremos. David R. González-Barreto Estadísticas Industriales Marzo
39 Medidas de Tendencia Central Moda La moda es la observación que ocurre con mayor frecuencia en la muestra. Cuando los dos valores más frecuentes ocurren igual número de veces, decimos que los datos siguen una distribución bimodal. David R. González-Barreto Estadísticas Industriales Marzo
40 Cuartilas y Percentilas La mediana de una muestra o una población divide los datos en dos mitades iguales. Los datos también pueden dividirse en más de dos partes. Cuando un conjunto de datos ordenados se divide en cuatro partes iguales, los puntos en los cuales ocurre esa división son llamados cuartilas. David R. González-Barreto Estadísticas Industriales Marzo
41 Cuartilas y Percentilas La primera cuartila o cuartila inferior, q 1, corresponde al valor que tiene aproximadamente una cuarta parte (25%) de las observaciones bajo el mismo y aproximadamente 75% de las observaciones por encima de él. La segunda cuartila q 2, tiene aproximadamente el 50% de las observaciones bajo su valor y corresponde a la mediana. Finalmente, la tercera cuartila o cuartila superior, q 3, tiene aproximadamente tres cuartas partes (75%) de las observaciones bajo su valor. Como en el caso de la mediana, las cuartilas pueden no ser únicas. Cuando esto ocurre, una forma simple de manejarlo es tomar el promedio como la cuartila cuando más de una observación satisface la definición. David R. González-Barreto Estadísticas Industriales Marzo
42 Cuartilas y Percentilas Ejemplo Las siguientes observaciones representan el tiempo en horas hasta falla de un material eléctrico de insulación David R. González-Barreto Estadísticas Industriales Marzo
43 Cuartilas y Percentilas Ejemplo La mediana sería: ~x q La primera cuartila: q La cuartila superior: q David R. González-Barreto Estadísticas Industriales Marzo
44 Cuartilas y Percentilas Ejemplo Box-and-Whisker Plot Tiempo (X 1000) Note que los valores de la mediana, cuartila inferior y cuartila superior corresponden a los extremos y la línea cortante de la caja en este gráfico. David R. González-Barreto Estadísticas Industriales Marzo
45 Cuartilas y Percentilas Cuando un conjunto ordenado de datos es subdividido en cien partes iguales, los puntos en los cuales ocurre esa división son llamados percentilas (p k ). David R. González-Barreto Estadísticas Industriales Marzo
46 Medidas de Variabilidad Rango Una medida muy simple de la variabilidad es el rango muestral, que se define como la diferencia entre la observación mayor y la menor en la muestra. r = max (x i ) min (x i ) David R. González-Barreto Estadísticas Industriales Marzo
47 Medidas de Variabilidad Rango El rango muestral es fácil de obtener, pero ignora toda la información existente en la muestra no contenida en las dos observaciones consideradas. Cuando el tamaño de muestra es pequeño, digamos n < 10, la información perdida al calcular el rango no es tan significativa. En general, se prefiere una medida de variabilidad que considere todas las observaciones en lugar de una que considere solo unas pocas. David R. González-Barreto Estadísticas Industriales Marzo
48 Medidas de Variabilidad El rango entre cuartilas ( interquartile range IQR) se define como la diferencia entre las cuartilas superior e inferior. El IQR es menos sensitivo a valores extremos en la muestra que el rango muestral ordinario. IQR = q 3 q 1 David R. González-Barreto Estadísticas Industriales Marzo
49 Medidas de Variabilidad Varianza muestral y desviación estándar muestral Las más importantes medidas de variabilidad lo son: la varianza muestral y la desviación estándar muestral. Si x 1, x 2,, x n es una muestra de n observaciones, entonces la varianza muestral estará dada por: s 2 i n 1 ( x i n x) 1 2 David R. González-Barreto Estadísticas Industriales Marzo
50 Medidas de Variabilidad La desviación estándar muestral, s, es la raíz cuadrada positiva de la varianza muestral. Las unidades de la varianza muestral son el cuadrado de las unidades de la variable original. La desviación estándar tiene la propiedad deseable de medir la variabilidad en las unidades originales de la variable de interés x. David R. González-Barreto Estadísticas Industriales Marzo
51 Medidas de Variabilidad Coeficiente de variación En ocasiones es deseable expresar la variación como una fracción del promedio. Una medida no dimensional llamada el coeficiente muestral de variación se usa con este propósito. cv s x Este coeficiente es útil cuando comparamos dos o más conjuntos de datos que difieren considerablemente en la magnitud de las observaciones. David R. González-Barreto Estadísticas Industriales Marzo
52 Distribuciones La distribución de probabilidad o simplemente la distribución de una variable aleatoria X, es una descripción del comportamiento de los posibles valores de X y sus respectivas probabilidades. En muchas ocasiones la distribución de probabilidad de la variable de interés es el resumen más útil para el analista del experimento o proceso bajo estudio. Las distribuciones también son clasificadas de acuerdo a los datos considerados. Es decir, tenemos distribuciones discretas o por atributo y distribuciones continuas o por variable. David R. González-Barreto Estadísticas Industriales Marzo
53 Distribución Binomial Un experimento de n intentos donde los intentos son independientes, cada intento tiene solamente dos posibles resultados llamados: éxito o fracaso y la probabilidad de éxito en cada intento, denominada p, permanece constante El número de éxitos, x, tiene una distribución binomial con parámetros p y n. David R. González-Barreto Estadísticas Industriales Marzo
54 Distribución Binomial La función de probabilidad de x es: n x n x fx x; p, n p 1 p, x 0,1,..., n x Si x es una variable aleatoria binomial con parámetros p y n, entonces: x E( X ) np 2 x V ( X ) np 1 p David R. González-Barreto Estadísticas Industriales Marzo
55 Distribución Geométrica En una serie de pruebas Bernoulli, con probabilidad de éxito constante, p, la variable aleatoria x representa el número de intentos hasta que ocurra el primer éxito. Entonces x sigue una distribución geométrica con parámetro p f x x; p p 1 p x 1, x 1,2,... David R. González-Barreto Estadísticas Industriales Marzo
56 Distribución Geométrica Si x es una variable aleatoria con parámetro p, entonces el promedio y la varianza de x son: x E( X ) 1/ p 2 x V ( X ) 1 p / p 2 David R. González-Barreto Estadísticas Industriales Marzo
57 Distribución Poisson Dado un intervalo de números reales, asuma que el conteo ocurre aleatoriamente a lo largo del intervalo. Si el intervalo se dividiera en subintervalos de tamaño pequeño de modo que: la propabilidad de más de un conteo en un sub-intervalo es cero, la probabilidad de un conteo en un sub-intervalo es igual para todos los sub-intervalos y proporcional al largo del sub-intervalo el conteo en cada sub-intervalo es independiente de otros subintervalos David R. González-Barreto Estadísticas Industriales Marzo
58 Distribución Poisson Si un número promedio de conteos en el intervalo es > 0, la variable aleatoria x que representa el número de conteos en el intervalo sigue una distribución Poisson con parámetro y la función de probabilidad de x es f x e x;, x x! x 0,1,2,... David R. González-Barreto Estadísticas Industriales Marzo
59 Distribución Poisson Si x es una variable aleatoria de distribución Poisson con parámetro, entonces el promedio y la varianza de x son x 2 x E( X V ( X ) ) David R. González-Barreto Estadísticas Industriales Marzo
60 Distribución Normal La distribución más utilizada para el modelaje de experimentos aleatorios es la distribución normal. Esto es así porque muchos fenómenos de la naturaleza y de procesos de manufactura tienen un comportamiento normal. Puede demostrarse además, que cuando un experimento consiste de una serie de intentos independientes (n) y cada uno de ellos resulta en un valor observado de una variable aleatoria proveniente de una distribución particular, entonces, la variable aleatoria que representa el promedio o el total de los n intentos se aproximará a comportarse normalmente. Este concepto se conoce como el Teorema de Límite Central. David R. González-Barreto Estadísticas Industriales Marzo
61 Distribución Normal La distribución normal consta de dos parámetros. El de tendencia central, conocido como y el de dispersión, en este caso representado por la desviación estándar. La función de probabilidad para la distribución normal está dada por: f x x;, 1 2 e x x con parámetros y 0 David R. González-Barreto Estadísticas Industriales Marzo
62 Distribución Normal Una variable aleatoria con = 0 y 2 = 1 se le conoce como una normal estandarizada y se denota como z. Donde, z = (x - ) / para el caso de las observaciones individuales. Cuando trabajamos con promedios, z x n Interpretamos z como el número de desviaciones estándar a que se encuentra x del promedio. Magnitudes altas de z corresponden a valores de x no típicos. David R. González-Barreto Estadísticas Industriales Marzo
63 Distribución Normal 99.73% 95.5% 68% David R. González-Barreto Estadísticas Industriales Marzo
64 Distribución Normal f x (x) 2 = 1 2 = 1 2 = x David R. González-Barreto Estadísticas Industriales Marzo
65 Pruebas para Determinar Normalidad En ocasiones se quiere determinar o corroborar si una muestra de interés proviene de una población con cierta distribución probabilística. Para esto existen varias pruebas tanto numéricas como gráficas. Una de las pruebas más más utilizadas para determinar si los datos provienen de una distribución normal es la Kolmogorov-Smirnov. David R. González-Barreto Estadísticas Industriales Marzo
66 Prueba para Determinar Normalidad EJEMPLO Analice la siguiente muestra de 60 pesos de tabletas y determine si sería correcto inferir que la distribución que mejor representa los pesos individuales de las tabletas es la distribución normal H o : Los pesos de las tabletas siguen una distribución Normal. H i : Los pesos de las tabletas no siguen una distribución Normal. David R. González-Barreto Estadísticas Industriales Marzo
67 Pruebas para Determinar Normalidad La prueba Kolmogorov-Smirnov utiliza la diferencia vertical máxima (Max. Diff.) entre la distribución empírica y la teórica para determinar la bondad de ajuste de la muestra observada. La prueba Kolmogorov-Smirnov es preferida sobre la de Chi Cuadrada especialmente cuando el tamaño de la muestra es pequeño. Empirical Dist. }Max. Diff. Theoretical Dist. David R. González-Barreto Estadísticas Industriales Marzo
68 Pruebas para Determinar Normalidad En todas las pruebas la forma de decidir si la hipótesis bajo consideración, datos provienen de una distribución normal, es idéntica. El software reportará un valor p, que de ser bajo (i.e. <.05) indicaría que la hipótesis se rechaza o que los datos no provienen de una distribución normal. David R. González-Barreto Estadísticas Industriales Marzo
69 Pruebas para Determinar Normalidad Un método gráfico para determinar si la distribución de los datos bajo consideración es normal, es el trazo de cuantilas normales (normal probability plot). Este trazo debe mostrar un comportamiento lineal para decidir afirmativamente que los datos son normales. David R. González-Barreto Estadísticas Industriales Marzo
70 Pruebas para Determinar Normalidad Otra herramienta gráfica para evaluar la normalidad de unos datos es el trazo de probabilidad normal. En esta herramienta se trazan los datos de interés contra su respectiva frecuencia acumulada observada (pares ordenados) en un papel que tiene su escala vertical diseñada de tal forma que si las observaciones trazadas tienen un comportamiento lineal entonces decidimos que los datos provienen de un fenómeno con distribución normal. David R. González-Barreto Estadísticas Industriales Marzo
71 Pruebas para Determinar Normalidad Prin EDA Estim Dist Mues Hyp Cont Cap R&R Para determinar los pares de coordenadas a trazarse en el papel: Ordene de menor a mayor las observaciones x (j), Calcule la frecuencia acumulada observada para cada x (j), y = [(j 0.5)/tamaño de muestra]. David R. González-Barreto Estadísticas Industriales Marzo
72 Pruebas para Determinar Normalidad - Ejemplo Se analizaron 60 pesos de tabletas. Los resultados fueron los siguientes: David R. González-Barreto Estadísticas Industriales Marzo
73 Planes de Muestreo David R. González-Barreto Estadísticas Industriales Marzo
74 Planes de Muestreo Indice Definiciones Relación Productor Consumidor Curva O.C. Planes de Muestreo Sencillo Riesgo del Consumidor Riesgo del Productor Estándar Militar 105 E Muestreo Secuencial David R. González-Barreto Estadísticas Industriales Marzo
75 Definición Definición de planes de muestreo Herramienta estadística en la que se llevan a cabo los siguientes pasos: Una muestra aleatoria se toma de un lote. Una o más características de calidad de las unidades en la muestra son inspeccionadas. A base del resultado de lo inspeccionado se dicta la sentencia sobre aceptar o rechazar el lote. David R. González-Barreto Estadísticas Industriales Marzo
76 Aspectos Importantes Aspectos importantes sobre los planes de muestreo: No estiman la calidad del lote, sólo lo sentencian. No proveen ninguna forma directa de control de la calidad. Su uso más efectivo es como una herramienta para asegurarse de que lo producido por el proceso cumple con los requerimientos. Tipos de planes de muestreo Variables (cuantitativa) Por atributo (cualitativa) David R. González-Barreto Estadísticas Industriales Marzo
77 Planes de Muestreo Sencillos Planes de muestreo sencillos Seleccione una muestra de n unidades de un lote tamaño N. Si encuentra c o menos unidades defectuosas en la muestra, acepte el lote. Si encuentra más de c unidades defectuosas (d) en la muestra, rechace el lote. David R. González-Barreto Estadísticas Industriales Marzo
78 Ventajas y Desventajas Ventajas de los planes de muestreo Consume menos tiempo y dinero que la inspección del 100% de los lotes. Menos daños al producto debido a la reducción del manejo. Reduce errores de inspección por concepto de fatiga humana (dependiendo del plan de muestreo). Desventajas de los planes de muestreo Riesgo de rechazar lotes buenos y/o aceptar los que se debieron rechazar. Se obtiene información reducida sobre las características de calidad del proceso. No contribuyen a reducir la variabilidad del proceso. David R. González-Barreto Estadísticas Industriales Marzo
79 Relación Productor-Consumidor RELACION PRODUCTOR-CONSUMIDOR Cuando usamos planes de muestreo existe un conflicto de interés entre el productor y el consumidor. Por un lado el productor quiere que todos los lotes buenos (que no excedan cierta proporción de piezas defectuosas predeterminada p 0 ) sean aceptados. Por otro lado, el consumidor quiere que todos los lotes malos (que excedan p 0 ) sean rechazados. Este conflicto sólo puede ser resuelto con un plan de muestreo cuya curva característica operacional (OC) sea ideal según discutiremos más adelante. David R. González-Barreto Estadísticas Industriales Marzo
80 Curva Característica Operacional (OC) Curva Característica Operacional (OC) Las curvas OC miden la ejecutoria de los planes de muestreo. En éstas, se traza la probabilidad de aceptar (p a ) un lote contra la proporción de defectuosos (p) del mismo. Es por esto que las curvas OC son utilizadas para determinar el poder de discernir o discriminar lotes con distintos niveles de unidades defectuosas que tienen los planes de muestreo. David R. González-Barreto Estadísticas Industriales Marzo
81 Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Curva OC Plan de Muestreo Sencillo Fracción de defectuosos David R. González-Barreto Estadísticas Industriales Marzo
82 Curva Característica Operacional (OC) Una curva OC ideal es aquella donde la probabilidad de aceptar lotes buenos (p p 0 ) es 1 y la probabilidad de aceptar lotes malos (p > p 0 ) es 0. En la práctica, obtener una Curva OC ideal para un plan de muestreo no es común. Lo más cercano que un plan de muestreo estará de obtener una curva OC ideal será al aumentar significativamente el tamaño de muestra del mismo. David R. González-Barreto Estadísticas Industriales Marzo
83 Curva Característica Operacional (OC) 1 (P a ) 0 P 0 Proporción de defectuosos (p) David R. González-Barreto Estadísticas Industriales Marzo
84 Curva Característica Operacional (OC) Existen dos tipos de Curvas OC: Tipo A usadas para lotes finitos (pequeños) en cuyo caso (p) está dada por la distribución probabilística Hipergeométrica. Tipo B usadas para lotes infinitos (grandes) en cuyo caso (p) está dado por la distribución probabilística Binomial. Si n N 0.10 ambas curvas son similares. La curva OC tipo B tiende a caer por encima de la tipo A. El poder de discriminación del plan de muestreo aumentará a medida que aumente el tamaño de la muestra (n). David R. González-Barreto Estadísticas Industriales Marzo
85 Curva Característica Operacional (OC) Ejemplo Se desea construir la curva OC para el siguiente plan de muestreo: N = 10,000 n = 89 c= 2 p = 0.01 n Como el lote es grande (infinito) y N los puntos de la Curva OC tipo B. uso la distribución Binomial para calcular P a {d defectuosos} = d! n! n d! p d 1 p n d P a {d < c} = d c 0 d! 89! 89 d! 0.01 d d P a (d < 2 / p = 0.01) =! 0!89! ! 1!88! ! 2!87! David R. González-Barreto Estadísticas Industriales Marzo
86 Curva Característica Operacional (OC) Ejemplo Plan de Muestreo: N = 10,000 n = 89 c = 2 Fracción de Defectuosos (p) Probabilidad de Aceptar el Lote (P a ) David R. González-Barreto Estadísticas Industriales Marzo
87 Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Ejemplo Curva OC Plan de Muestreo Sencillo Proporción defectuosos en Lote (p) David R. González-Barreto Estadísticas Industriales Marzo
88 Probabilitidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Ejemplo Si variamos el tamaño de muestra (n), la curva OC del plan de muestreo de interés sería como se presenta a continuación: Dos Planes de Muestreo Sencillo n = 50, c =1 n=200, c= Proporción defectuosos del Lote (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo
89 Probabilitidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Curva Característica Operacional (OC) Ejemplo Para distintos valores de c, la curva OC del plan de muestreo de interés sería como se presenta a continuación: Dos Planes de Muestreo Sencillo n = 89, c =2 n=89, c= Proporción defectuosos del Lote (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo
90 Puntos de Interés En todo plan de muestreo estarán presentes los siguientes puntos de interés tanto para el productor como para el consumidor: Riesgo del productor ( ) = la probabilidad de rechazar un lote que debió haber sido aceptado. AQL (Acceptable Quality Level) = nivel más pobre de calidad, o la máxima fracción defectuosa del proceso del productor que el consumidor consideraría aceptable como el promedio del proceso. Riesgo del consumidor ( ) = probabilidad de aceptar un lote que debió haber sido rechazado. LTPD (Lost Tolerance Percent Defective) = un nivel de calidad del lote tan pobre que el consumidor solo lo podría aceptar por error. David R. González-Barreto Estadísticas Industriales Marzo
91 Puntos de Interés Se debe siempre recordar que es a AQL como es a LTPD. El nivel de protección que un plan de muestreo ofrezca a cada una de las partes en la relación Productor-Consumidor dependerá de los dos puntos antes mencionados (AQL, 1 - ), (LTPD, ). Estos puntos de interés pueden ser vistos en la Curva OC del plan de muestreo diseñado. David R. González-Barreto Estadísticas Industriales Marzo
92 Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Puntos de Interés Curva OC Plan de Muestreo Sencillo (AQL, 1 - ) (LTPD, ) AQL Fracción de defectuosos LTPD David R. González-Barreto Estadísticas Industriales Marzo
93 Diseño e Implantación Diseño e Implantación de Planes de Muestreo El objetivo principal de diseñar un plan de muestreo es el determinar tamaño de muestras (n) y límite de aceptación (c), para dictar sentencia sobre un lote, que cumpla el nivel de riesgo estipulado por el productor, el consumidor o ambos. David R. González-Barreto Estadísticas Industriales Marzo
94 Diseño e Implantación Plan de Muestreo Sencillo Plan de Muestreo Sencillo Suponga que se toma una muestra aleatoria de tamaño n de un lote de tamaño N. Al inspeccionar la muestra, si hay más de c unidades defectuosas rechazo el lote, de lo contrario lo acepto. Existen varias formas de diseñar un plan de forma tal que el interés del consumidor o del productor sea protegida. David R. González-Barreto Estadísticas Industriales Marzo
95 Diseño e Implantación Planes de muestreo basados en el riesgo del productor Cuando el riesgo del productor ( ) y el nivel de calidad aceptable (AQL) asociado con éste son estipulados como la base del plan de muestreo se desea diseñar un plan de muestreo sencillo cuya Curva OC pase por la coordenada (AQL, 1 - ). Para diseñar dicho plan siga los siguientes pasos: Seleccione el límite de aceptación (c). Utilice la distribución probabilística Poisson (presumiendo Curva OC tipo B, p < 0.10) para determinar la cantidad promedio de unidades defectuosas por muestra ( ). Determine el tamaño de la muestra (n). n p n n AQL AQL David R. González-Barreto Estadísticas Industriales Marzo
96 Diseño e Implantación - Ejemplo Diseñe un plan de muestreo sencillo que satisfaga el riesgo del productor de 5% para lotes que tienen una fracción de defectuoso de 1.5%. = 0.05 AQL = Para c = 1 obtenemos de la distribución Poisson un = n AQL El plan diseñado indica que se debe tomar una muestra aleatoria de 24 unidades y aceptar el lote como bueno si no encuentra más de 1 unidad defectuosa. 24 Para c = 3 n Para c = 6 n Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo estipulado del productor ( = 5%, AQL = 1.5%) David R. González-Barreto Estadísticas Industriales Marzo
97 Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Diseño e Implantación - Ejemplo Comparación Planes de Muestreo Fracción de defectuosos (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo
98 Riesgo del Consumidor Planes de muestreo basados en el riesgo del consumidor Cuando el riesgo del consumidor ( ) y el nivel de calidad aceptable (LTPD) asociada con éste, son estipulados como la base del plan de muestreo, se desea diseñar un plan de muestreo sencillo cuya Curva OC pase por la coordenada (LTPD, ). Para diseñar dicho plan siga los siguientes pasos: Seleccione el límite de aceptación (c). Utilice la distribución probabilística Poisson para determinar la cantidad promedio de unidades defectuosas por muestra ( ). Determine el tamaño de la muestra (n). n p n LTPD n LTPD David R. González-Barreto Estadísticas Industriales Marzo
99 Riesgo del Consumidor - Ejemplo Diseñe un plan de muestreo sencillo que satisfaga el riesgo del consumidor de 10% para lotes que tienen una fracción de defectuoso de 8%. = 0.10 LTPD = 0.08 Para c = 1 obtenemos de la distribución Poisson un = n LTPD Para c = 3 n Para c = 6 n Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo estipulado del consumidor ( = 10%, LTPD = 8%). David R. González-Barreto Estadísticas Industriales Marzo
100 Probabilidad de Aceptar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Riesgo del Consumidor - Ejemplo Comparación Planes de Muestreo Fracción de defectuosos (p) Plan 1 Plan 2 David R. González-Barreto Estadísticas Industriales Marzo
101 Riesgos del Productor y el Consumidor Planes de muestreo basados en los riesgos del productor y el consumidor Diseñar un plan de muestreo que satisfaga exactamente ambas partes, el productor y el consumidor; es prácticamente imposible. Una alternativa es satisfacer exactamente una de las partes (Productor o Consumidor) y tratar de satisfacer lo más cercano posible a lo estipulado por la otra parte (por tanteo). Otra alternativa más fácil pero menos exacta es utilizar una herramienta gráfica llamada Nomograma. Para obtener un plan de muestreo que cumpla con lo estipulado por ambas partes mediante el uso del Nomograma siga los siguientes pasos: Trace una línea que conecte AQL con (1 - ) y otra línea conectando LTPD con. Identifique el plan de muestreo dado por la intersección de las dos líneas dentro del Nomograma. David R. González-Barreto Estadísticas Industriales Marzo
102 Riesgos del Productor y el Consumidor - Ejemplo Diseñe un plan de muestreo sencillo que satisfaga tanto el riesgo del productor de 5% para lotes que tienen una fracción de defectuoso de 2% como el riesgo del consumidor de 10% para lotes que tienen una fracción de defectuoso de 8%. = 0.05, AQL = 0.02, = 0.10, LTPD = 0.08 En base al punto de intersección de las dos líneas (desde 0.95 hasta 0.02 y desde 0.10 hasta 0.08) se obtiene el siguiente plan de muestreo sencillo: n = 98 c = 4 David R. González-Barreto Estadísticas Industriales Marzo
103 Riesgos del Productor y el Consumidor - Ejemplo David R. González-Barreto Estadísticas Industriales Marzo
104 Estándar Militar 105E (ANSI/ASQC Z1.4) Están basados en el AQL, en el tamaño del lote y en el nivel de inspección. El nivel de inspección I requiere aproximadamente la mitad de la inspección que el nivel II y se utiliza cuando se requiere menor discriminación. El nivel de inspección III requiere aproximadamente el doble de la inspección del nivel II y se utiliza cuando se necesita mayor discriminación. Existen cuatro niveles de inspección especial: S-1, S-2, S-3 y S-4. Estos niveles producirán tamaños de muestra muy pequeños y sólo deben ser utilizados cuando se puedan o se necesite aceptar riesgos grandes. David R. González-Barreto Estadísticas Industriales Marzo
105 Estándar Militar 105E Sus curvas O. C. son del tipo B. Debido a que estos planes están orientados al AQL, se enfocan en el riesgo del productor. Por lo tanto, el poder discriminatorio del plan de muestreo (la forma de la curva O. C.) se obtiene mediante la selección del nivel de inspección. David R. González-Barreto Estadísticas Industriales Marzo
106 Estándar Militar 105E - Reglas de intercambio David R. González-Barreto Estadísticas Industriales Marzo
107 Estándar Militar 105E Procedimiento Escoga el AQL Escoga el nivel de inspección Determine el tamaño del lote De acuerdo a la tabla que sigue, encuentre la letra para buscar el tamaño de la muestra Determine el tipo de plan de muestreo apropiado (sencillo, doble, múltiple) Busque en la tabla correcta para encontrar el tipo de plan a utilizarse David R. González-Barreto Estadísticas Industriales Marzo
108 Estándar Militar 105E Tabla de letras David R. González-Barreto Estadísticas Industriales Marzo
109 Estándar Militar 105E Inspección Normal David R. González-Barreto Estadísticas Industriales Marzo
110 Estándar Militar 105E Inspección ajustada David R. González-Barreto Estadísticas Industriales Marzo
111 Estándar Militar 105E Inspección reducida David R. González-Barreto Estadísticas Industriales Marzo
112 Estándar Militar 105E - Ejemplo N = 2000 AQL = 0.65% Nivel de inspección general II Solución De la tabla de las letras: letra K De la tabla de inspección normal: n = 125, c = 2 De la tabla de inspección ajustada: n = 125, c = 1 De la tabla de inspección reducida: n = 50, c = 1, r = 3 David R. González-Barreto Estadísticas Industriales Marzo
113 Muestreo Secuencial El muestreo secuencial está basado en el sequential probability ratio test (SPRT) desarrollado por Wald. Para cada punto en la gráfica del muestreo el eje de x corresponde al número de artículos inspeccionados hasta el momento, mientras que el eje de y representa el número total de defectuosos encontrados hasta ese momento. David R. González-Barreto Estadísticas Industriales Marzo
114 Muestro secuencial Si el punto trazado se mantiene dentro de las líneas de aceptación y rechazo, otro artículo debe ser inspeccionado. Tan pronto como un punto esté sobre o por encima de la línea de rechazo, el lote se rechaza. Por otro lado, si un punto cae sobre o por debajo de la línea de aceptación, el lote se acepta. David R. González-Barreto Estadísticas Industriales Marzo
115 Muestreo secuencial Para diseñar un plan de muestreo secuencial es necesario especificar las siguientes dos coordenadas: (p 1, 1 - ), (p 2, 1 - ). David R. González-Barreto Estadísticas Industriales Marzo
116 Muestreo secuencial Las ecuaciones para las dos líneas basadas en las dos coordenadas están dadas por: X A X donde h 1 R h 2 h 1 1 log sn sn (acceptance line) (rejection line) k h 2 1 log k k s log log p p p 1 p p 1 2 / 1 p 2 / k David R. González-Barreto Estadísticas Industriales Marzo
117 Muestreo secuencial David R. González-Barreto Estadísticas Industriales Marzo
118 Muestreo Secuencial - Ejemplo Supongamos que queremos encontrar un plan de muestreo secuencial en el que: p 1 = 0.01, = 0.05, p 2 = 0.06, y = 0.10 Entonces: k log p p (0.06)(0.99) log (0.01)(0.94) p p 1 2 David R. González-Barreto Estadísticas Industriales Marzo
119 Muestreo Secuencial - Ejemplo h h log 0.95 log log 0.90 log / k / / k / David R. González-Barreto Estadísticas Industriales Marzo
120 Muestreo Secuencial - Ejemplo s log 1 p / 1 p / k 1 2 log 0.99/ 0.94 / Entonces, las líneas de aceptación y rechazo son: X A n (aceptación) X R n (rechazo) David R. González-Barreto Estadísticas Industriales Marzo
121 Muestreo Secuencial Ejemplo En lugar de trazar un gráfico para determinar la disposición del lote, en el muestreo secuencial utilizamos una tabla en la que los datos se obtienen sustituyendo los valores de n en las ecuaciones para las líneas de aceptación y rechazo y calculando los números de aceptación y rechazo. Por ejemplo, el cálculo para n = 45 es: X A n (45) 0.04 (aceptación) X R n 0.028(45) 2.83 (rechazo) David R. González-Barreto Estadísticas Industriales Marzo
122 Muestreo Secuencial - Ejemplo Inspeccionados Número de aceptación Número de rechazo Inspeccionados Número de aceptación Número de rechazo 1 a b 24 a 3 2 a 2 25 a 3 3 a 2 26 a 3 4 a 2 27 a 3 5 a 2 28 a 3 6 a 2 29 a 3 7 a 2 30 a 3 8 a 2 31 a 3 9 a 2 32 a 3 10 a 2 33 a 3 11 a 2 34 a 3 12 a 2 35 a 3 13 a 2 36 a 3 14 a 2 37 a 3 15 a 2 38 a 3 16 a 3 39 a 3 17 a 3 40 a 3 18 a 3 41 a 3 19 a 3 42 a 3 20 a 3 43 a 3 21 a a a "a" - aceptación no es posible "b" - rechazo no es posible David R. González-Barreto Estadísticas Industriales Marzo
123 Hipótesis Estadística Supuestos o conjeturas acerca de una o más poblaciones de interés. Prueba para verificar si el reclamo sobre cierto parámetro de la población de interés es igual al establecido de la hipótesis nula (Ho). El aceptar la hipótesis nula sólo implica que la muestra analizada no da suficiente evidencia para refutarla. Sin embargo, rechazar la hipótesis nula implica que la muestra analizada da evidencia para rechazarla. Este rechazo da paso a la aceptación de la hipótesis alterna (H 1 ). David R. González-Barreto Estadísticas Industriales Marzo
124 Hipótesis Estadística Estadística de prueba- Función de la muestra aleatoria que se utiliza para tomar una decisión en la prueba de hipótesis. Valor crítico - Valor que marca el límite entre aceptación o rechazo de la Ho. Región de aceptación - Rango marcado por el valor o valores críticos que de contener el valor de la Ho daría paso a la aceptación de la misma. Región de rechazo - Rango marcado por el valor o valores críticos que de contener el valor de la Ho daría paso al rechazo de la misma. David R. González-Barreto Estadísticas Industriales Marzo
125 Hipótesis Estadística Rechazo Rechazo /2 /2 Región de Aceptación David R. González-Barreto Estadísticas Industriales Marzo
126 Hipótesis Estadística H o es cierto H o es falso acepto H o rechazo H o decisión correcta error tipo I error tipo II decisión correcta David R. González-Barreto Estadísticas Industriales Marzo
127 Hipótesis Estadística Error tipo I - Rechazar la Ho cuando se debió aceptar. Error tipo II - Aceptar la Ho cuando se debió rechazar. Nivel de significancia - Probabilidad de cometer error tipo I. - Probabilidad de cometer error tipo II. Potencia de la prueba (1 - ) - Probabilidad de rechazar la Ho cuando se debió rechazar. Valor P - Nivel de significancia mínima al cual el valor observado de la estadística de prueba es significativo. David R. González-Barreto Estadísticas Industriales Marzo
128 Hipótesis Estadística Pasos a seguir en las Pruebas de Hipótesis 1. Establezca la Ho 2. Escoja la H 1 apropiada 3. Escoja el nivel de significancia 4. Seleccione la estadística de prueba y establezca la región crítica 5. Compute el valor de la estadística de prueba para la muestra analizada 6. Decida si acepta o rechaza la Ho 7. Tome la acción pertinente dada la decisión David R. González-Barreto Estadísticas Industriales Marzo
129 Hipótesis Estadística 1 POBLACION 2 POBLACIONES >2 POBLACIONES CONTINUOS O POR VARIABLE DISCRETOS CONTINUOS O POR VARIABLE DISCRETOS ANOVA p= proporción defectuosos. 2 D ( 1-2) = diferencia de promedios 2 / 2 = razón de varianzas. (p 1 p 2 ) = diferencia de proporciones. David R. González-Barreto Estadísticas Industriales Marzo
130 Concepto del valor P El valor p se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería rechazada. En el caso de la distribución F que usamos en nuestro ANOVA si: calculada > crítica entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis alterna H1. Este concepto se ilustra en la siguiente Figura. valor p valor p > F Calculada F Crítica Como puede notarse en este caso la hipótesis nula Ho no puede ser rechazada ya que la Fcalculada < Fcrítica, de igual manera el valor p nos daría la misma decisión bajo la condición: David R. González-Barreto Estadísticas Industriales Marzo
131 Concepto del valor P Por lo tanto, el valor p puede ser interpretado como la posibilidad de que la hipótesis nula no sea rechazada. Magnitudes altas del valor p estarán asociadas con no poder rechazar la hipótesis nula mientras que magnitudes bajas del valor p estarán asociadas con el rechazo de la hipótesis nula. Regularmente el valor p es comparado con el nivel establecido para la prueba. Usando el valor p como criterio de aceptación o rechazo de una hipótesis es como comúnmente los programas de análisis estadístico le permiten al usuario tomar una decisión. Así que en general, si el valor p es menor que el establecido rechazamos la hipótesis nula de lo contrario no podemos rechazar. David R. González-Barreto Estadísticas Industriales Marzo
132 Prueba Pareada Estas pruebas ocurren cuando se estudia la respuesta de una unidad experimental a dos distintos tratamientos. Por ejemplo, suponga que se conduce un estudio para determinar el efecto de una droga que ayuda en la reducción de la presión arterial. Para medir su efectividad (o su inefectividad), se le provee la droga a una muestra aleatoria de n pacientes. El conjunto de datos consiste de n pares ordenados (xi, yi), donde la xi correspondería a la presión arterial del paciente i, antes del tratamiento mientras que la yi denotaría la presión arterial luego de la droga para el mismo paciente. David R. González-Barreto Estadísticas Industriales Marzo
133 Prueba Pareada La variable di = xi - yi, representa la diferencia en la presión arterial producida por la droga en determinado paciente. Esto es un ejemplo de lo que se conoce como auto-pareo, en el cual a una unidad experimental singular se le administran los dos tratamientos. En otros casos esos pares son seleccionados. Por ejemplo, en experimentos de sicología gemelos idénticos son utilizados para estas pruebas pareadas. Una vez el par ha sido seleccionado, a una de las dos unidades se le asigna aleatoriamente el tratamiento 1 correspondiendo el tratamiento 2 a la otra unidad. Las ventajas del pareo son intuitivamente claras: reduce la variabilidad en los datos que se debe a otras causas distintas al tratamiento bajo consideración. David R. González-Barreto Estadísticas Industriales Marzo
134 Prueba Pareada - Ejemplo Un estudio se realiza con el objetivo de comparar dos configuraciones de un procesador de computadora. Se midieron los tiempos de ejecución para seis tareas distintas (w1,, w6). Las dos configuraciones evaluadas fueron el procesador con y sin cache. Los resultados obtenidos se presentan en la siguiente tabla. Tarea Cache No cache d i = x i - y i W W W W W W David R. González-Barreto Estadísticas Industriales Marzo
135 Prueba Pareada - Ejemplo T-Test of the Mean Hypothesis Tests for Cache-No_Cache Sample mean = Sample median = t-test Null hypothesis: mean = 0.0 Alternative: not equal Computed t statistic = P-Value = Reject the null hypothesis for alpha = Confidence Intervals Confidence Intervals for Cache-No_Cache 95.0% confidence interval for mean: / [ , ] Como se puede observar de los resultados obtenidos de STATGRAPHICS, tanto el valor p como el intervalo de confianza indican el efecto significativo que tiene el cambio de configuración en el procesador. La configuración que incluye el cache resultó en una ejecución mucho más rápida. David R. González-Barreto Estadísticas Industriales Marzo
136 Inferencias sobre los promedios Regularmente, la calidad de un producto se mide por una variable cuantitativa x definida en cierta población. Se conoce que esta variable estará sujeta a cierto nivel de variación aleatoria, por lo tanto, estudiar el comportamiento de ésta y los parámetros que la describen resulta de vital importancia. El reclamo de que > 0 es un ejemplo de una hipótesis estadística que intenta describir o entender dicho comportamiento. Cuando el reclamo incluye dos comportamientos el objetivo del estudio podría ser el de medir la diferencia entre los dos promedios ( 1-2 > ). De igual forma se podrían hacer reclamos sobre el parámetro de dispersión de la variable de interés. Estos casos se discutirán más adelante. David R. González-Barreto Estadísticas Industriales Marzo
137 Inferencias sobre los promedios Ejemplo Una empresa manufacturera de lentes de contacto compró una máquina para el llenado de frascos de solución alkalina. Esta máquina fue ajustada para llenar frascos cuya etiqueta indicaba un contenido de 12 onzas. Diez muestras se tomaron para validar que el proceso cumplía con este requisito. Estas observaciones se muestran en la siguiente tabla. Onzas David R. González-Barreto Estadísticas Industriales Marzo
138 Inferencias sobre los promedios Ejemplo T-Test of the Mean ( Una cola ) Hypothesis Tests for Onzas Sample mean = Sample median = T-Test of the Mean ( Dos colas ) Hypothesis Tests for Onzas Sample mean = Sample median = t-test Null hypothesis: mean = 12.0 Alternative: less than Computed t statistic = P-Value = t-test Null hypothesis: mean = 12.0 Alternative: not equal Computed t statistic = P-Value = Do not reject the null hypothesis for alpha = David R. González-Barreto Estadísticas Industriales Marzo
139 Inferencias sobre los promedios Ejemplo Dos catalíticos son analizados para determinar su efecto en el rendimiento de un proceso químico. El catalítico 1 es el que se utiliza en la actualidad. El catalítico 2 tiene menor costo y se adoptaría si el mismo no afecta adversamente el rendimiento del proceso. Un estudio piloto se efectuó resultando en lo siguiente: Observación Catalítico 1 Catalítico David R. González-Barreto Estadísticas Industriales Marzo
140 Inferencias sobre los promedios Ejemplo Two Sample T-Test and Confidence Interval Comparison of Means % confidence interval for mean of Cat1: / % confidence interval for mean of Cat2: / % confidence intervals for the difference between the means: assuming equal variances: / not assuming equal variances: / t tests to compare means Null hypothesis: mean1 = mean2 (1) Alt. hypothesis: mean1 NE mean2 assuming equal variances: t = P-value = not assuming equal variances: t = P-value = (2) Alt. hypothesis: mean1 > mean2 assuming equal variances: t = P-value = not assuming equal variances: t = P-value = (3) Alt. hypothesis: mean1 < mean2 assuming equal variances: t = P-value = not assuming equal variances: t = P-value = David R. González-Barreto Estadísticas Industriales Marzo
141 Catalitico Prin EDA Estim Dist Mues Hyp Cont Cap R&R Inferencias sobre los promedios Ejemplo Box-and-Whisker Plot Cat1 Cat Rendimient Como se puede observar, tanto de la gráfica como de ambas pruebas efectuadas, los promedios no difieren significativamente. El catalítico 2 podría adoptarse sin el riesgo de que afecte negativamente el rendimiento de este proceso. David R. González-Barreto Estadísticas Industriales Marzo
142 Estimado de intervalos En muchas ocasiones, un estimado de punto no provee la información suficiente con respecto a un parámetro. Por ejemplo, si nos interesa medir el esfuerzo promedio en tensión de un componente crítico, un valor o estimado de punto no será tan relevante como un intervalo en el cual se espera se encuentre el verdadero valor del parámetro. A estos intervalos los conocemos como intervalos de confianza. Un estimado de intervalo de un parámetro desconocido q es un intervalo con formato: l < q < u, donde los puntos extremos l y u dependen del valor numérico del estimado de q para una muestra particular de la distribución muestral de este parámetro. Dado que diferentes muestras producirán diferentes estimados, los puntos extremos del intervalo de cada muestra son variables aleatorias como muestra la siguiente figura. David R. González-Barreto Estadísticas Industriales Marzo
143 Estimado de intervalos David R. González-Barreto Estadísticas Industriales Marzo
144 Estimado de intervalos Suponga que una población tiene un promedio desconocido y una varianza conocida. Una muestra de tamaño n de esta población se denominaría x 1, x 2, x n. Un estimador de punto razonable para el promedio desconocido sería el promedio muestral. La distribución de este promedio será normal si la población es normal y aproximadamente normal si las condiciones del teorema de límite central se cumplen. Por lo tanto, la distribución de la estadística Z x / n es una distribución normal estándar David R. González-Barreto Estadísticas Industriales Marzo
145 Estimado de intervalos / 2 Distribución de Z / 2 P z Z z 1 / 2 / 2 x P z z 1 / 2 / 2 / n P x z / n x z / n 1 / 2 / 2 David R. González-Barreto Estadísticas Industriales Marzo
146 Estimado de intervalos De este desarrollo se puede concluir que el intervalo para el (1- ) % de confianza del promedio m cuando se tiene una muestra aleatoria de tamaño n y varianza conocida está dado por: x z / n x z / n / 2 / 2 David R. González-Barreto Estadísticas Industriales Marzo
147 Analisis de Varianza (ANOVA) Las pruebas de hipótesis estudiadas son métodos que comparan dos tratamientos. Sin embargo, muchos experimentos requieren comparaciones de más de dos tratamientos simultáneamente. Se puede demostrar que si intentamos hacer pruebas para cada pareja de medias o promedios, el error tipo I incrementaría sustancialmente. Por ejemplo, un factor con 5 niveles o tratamientos necesitará 10 pruebas si se toman por parejas. Si establece.05 como su error Tipo I, entonces su nivel de confianza para cada prueba individual es = Si decimos que las pruebas son independientes, la probabilidad de aceptar la hipótesis nula correctamente en las 10 pruebas será de (0.95) 10 = David R. González-Barreto Estadísticas Industriales Marzo
148 ANOVA El procedimiento apropiado para probar la igualdad de varias medias o promedios se conoce como análisis de varianza o ANOVA. ANOVA - metodología estadística para probar la igualdad de promedios cuando existen más de dos promedios. Probablemente es la técnica más útil en el campo de la estadística inferencial. David R. González-Barreto Estadísticas Industriales Marzo
149 ANOVA PRESUNCIONES DE ANOVA Errores o residuales siguen una distribución normal con promedio cero y varianza constante. Errores son independientes. El nombre de análisis de varianza (ANOVA) se deriva de la partición de la variabilidad total encontrada en sus componentes. Para entender esa partición primero tenemos que definir unos términos. David R. González-Barreto Estadísticas Industriales Marzo
150 ANOVA 1 2. a y i = suma de las observaciones en el nivel i y 11 y y 1n y 21 y y 2n y a1 y a2... y an y i y y = promedio de las observaciones en el nivel i = suma total de las observaciones = promedio de todas las observaciones y 1. y 2. y a. y.. N = an = número total de observaciones y 1. y 2. y a. y.. SS TOTAL a n i 1 j 1 y ij y.. 2 David R. González-Barreto Estadísticas Industriales Marzo
151 ANOVA SS TOTAL a n i 1 j 1 yi. y.. y ij y i. 2 SS TOTAL n a i 1 y i. y.. 2 a n i 1 j 1 y ij y i. 2 2 a n i 1 j 1 y i. y.. y ij y i. j n 1 y ij y i. y i. ny i. y i. n y n i. 0 a n i 1 j 1 y ij y 2 a 2.. n yi. y.. yij yi. i 1 2 Ecuación fundamental de la descomposición de la suma de cuadrados David R. González-Barreto Estadísticas Industriales Marzo
152 ANOVA En palabras podemos expresar la ecuación previa de la siguiente manera: SS TOTAL SS TRATAMIENTOS SS ERROR Puede demostrarse que con los grados de libertad sucede lo mismo. gl gl gl TOTAL TRATAMIENTOS N-1 = a-1 + N-a ERROR David R. González-Barreto Estadísticas Industriales Marzo
153 ANOVA Ya teniendo los componentes de la suma de cuadrados con sus correspondientes grados de libertad podemos construir la ANOVA. Fuentes Suma de Cuadrados gl Promedio de Cuadrados Fc Tratamientos SS TRAT. a-1 MS TRAT. =SS TRAT. /(a-1) Error SS ERROR N-a MS ERROR =SS ERROR /(N-a) MS TRAT. MS ERROR Total SS TOTAL N-1 David R. González-Barreto Estadísticas Industriales Marzo
154 ANOVA Entonces la hipótesis que tratará de probar Anova será la siguiente: H H : : i j a...para al menos una i, j Una forma equivalente para establecer la hipótesis sería: H H 0 1 : T :T 1 i T T a para al 0 menos una i David R. González-Barreto Estadísticas Industriales Marzo
155 ANOVA Una vez terminada la ANOVA y rechazada la H 0 algunas pruebas nos permiten determinar entre cuales tratamientos o niveles en específico existe la diferencia de promedios. La Diferencia Significativa Mínima (LSD) es una de éstas. La misma consiste de : 1. Calcular LSD = 2. Calcular y i. y j. t / 2, N a MS E 1 n i 1 n j 3. Si y y LSD i. j. Concluir que i y j son diferentes. David R. González-Barreto Estadísticas Industriales Marzo
156 ANOVA - Ejemplo Un manufacturero de papel produce fundas para cargar compras. El está interesado en mejorar el esfuerzo en tensión que resisten las mismas. Se sospecha que el % de madera en la pulpa utilizada para la manufactura puede afectar el esfuerzo en tensión. La siguiente tabla muestra los resultados de su experimento. % de madera en la pulpa 5% 10% 15% 20% David R. González-Barreto Estadísticas Industriales Marzo
157 Conc Prin EDA Estim Dist Mues Hyp Cont Cap R&R ANOVA - Ejemplo ANOVA Table for Esfuerzo by Conc Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Between groups Within groups Total (Corr.) Box-and-Whisker Plot Esfuerzo David R. González-Barreto Estadísticas Industriales Marzo
158 ANOVA Ejemplo Multiple Range Tests for Esfuerzo by Conc Method: 95.0 percent LSD Conc Count Mean Homogeneous Groups X X X X Contrast Difference +/- Limits * * * * * * denotes a statistically significant difference. David R. González-Barreto Estadísticas Industriales Marzo
159 Gráficos de Control La insatisfacción de los clientes es causada por la variabilidad del producto: las características del producto no ejecutan de acuerdo a las expectativas o ejecutan de manera diferente de unidad a unidad. La variabilidad del producto es el resultado de la variabilidad en el proceso que lo crea. Por tanto, la clave para lograr productos de alta calidad es limitar la variabilidad del proceso. David R. González-Barreto Estadísticas Industriales Marzo
160 Gráficos de Control Ningún proceso puede ser perfectamente repetible, alguna variabilidad siempre existirá y ésta a su vez será transmitida al producto. El objetivo es mantener el proceso estable y predecible a través del tiempo, a esto le llamamos un proceso en control. La herramienta que usamos para monitorear la estabilidad del proceso es el gráfico de control. David R. González-Barreto Estadísticas Industriales Marzo
161 Gráficos de Control Para datos continuos, el monitorear la estabilidad del proceso requiere dos gráficos: el primero maneja la localización de la distribución, mientras el segundo trabaja con la variabilidad del proceso. El gráfico más común utilizado para monitorear la localización es el X - barra ( ). Los gráficos para la variabilidad incluyen el S (desviación estándar) y el gráfico R (del rango). x David R. González-Barreto Estadísticas Industriales Marzo
162 Gráficos de Control Los gráficos de control son una herramienta importante en el mejoramiento de procesos. Estos gráficos proveen señales visuales que indican cuándo eventos excepcionales o condiciones fuera de control ocurren en el proceso. Usar nuestros planes de respuesta o realizar análisis para encontrar la raíz de la señal, permite que el proceso, así como el producto que resulta del mismo, puedan ser mejorados de forma sistemática y continua. David R. González-Barreto Estadísticas Industriales Marzo
163 Gráficos de Control Tipos de variabilidad Intrínseca o natural - efecto cumulativo de pequeñas e inevitables causas en el proceso. Externa (causa asignable) - comúnmente provienen de fuentes externas controlables. Generalmente son mayor que la variabilidad intrínseca y, por lo tanto, representan un nivel inaceptable en la ejecutoria del proceso. David R. González-Barreto Estadísticas Industriales Marzo
164 Gráficos de Control Un proceso que su única causa de variabilidad es natural, se considera que opera en control estadístico. Un proceso que opera en presencia de causas asignables de variabilidad se dice está fuera de control estadístico. Mediante el uso de gráficos de control podemos identificar y distinguir entre las causas de variabilidad intrínseca y externa del proceso. David R. González-Barreto Estadísticas Industriales Marzo
165 Gráficos de Control LCS LC LCI w w w w w característica de calidad LCS LC } w k w } k w LCI # de muestra o sequencia (tiempo) David R. González-Barreto Estadísticas Industriales Marzo
166 Decisión Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control Realidad En control Fuera de control En control Decisión correcta Fuera de control Decisión correcta David R. González-Barreto Estadísticas Industriales Marzo
167 Gráficos de Control Selección de los límites de control Alejando los límites de la línea central se disminuye la probabilidad de error tipo I pero se aumenta la probabilidad de error tipo II. Aunque comúnmente se usan 3 w como límites, la selección de estos puede depender de factores económicos. Si las pérdidas asociadas con dejar el proceso operar en estado fuera de control superan por mucho los costos de investigar y posiblemente corregir las causas asignables, múltiples menores de sigma (2.5 ó 2) serían apropiados. David R. González-Barreto Estadísticas Industriales Marzo
168 Gráficos de Control Tamaño de la muestra y frecuencia del muestreo Lo más deseable para poder detectar desplazamientos en el proceso sería tomar muestras grandes frecuentemente. Pero esto no es lo mejor desde el punto de vista económico. En la industria se tiende a favorecer muestras pequeñas pero frecuentes, especialmente en procesos con un alto volumen de producción. Además de las Curvas Características Operacionales (O. C.) otro criterio para determinar el tamaño de muestra y la frecuencia del muestreo es el largo promedio de corrida (ARL) del gráfico de control. David R. González-Barreto Estadísticas Industriales Marzo
169 Gráficos de Control ARL = número promedio de puntos que serán graficados antes de que un punto indique condición de fuera de control. p = probabilidad de que un punto salga de los límites de control ARL 1 p David R. González-Barreto Estadísticas Industriales Marzo
170 Gráficos de Control Límites de control ARL en Control + 3 sigmas sigmas sigma Cambio en promedio 1- ARL fuera de control 3 sigmas sigmas sigma David R. González-Barreto Estadísticas Industriales Marzo
171 Fundamentos Gráficos de Control /2 LCS LC /2 LCI David R. González-Barreto Estadísticas Industriales Marzo
172 Característica de calidad Prin EDA Estim Dist Mues Hyp Cont Cap R&R Fundamentos Gráficos de Control /2 1 - LCS LC /2 LCI Orden de producción David R. González-Barreto Estadísticas Industriales Marzo
173 Característica de calidad Prin EDA Estim Dist Mues Hyp Cont Cap R&R Fundamentos Gráficos de Control /2 1 - LCS LC /2 LCI Orden de producción David R. González-Barreto Estadísticas Industriales Marzo
174 Fundamentos Gráficos de Control LCS Cambio en promedio LC LCI David R. González-Barreto Estadísticas Industriales Marzo
175 Fundamentos Gráficos de Control Cambio en dispersión LCS LC LCI David R. González-Barreto Estadísticas Industriales Marzo
176 Gráficos de Control Subgrupos racionales - Este concepto establece que las muestras deben ser seleccionadas de forma tal que si hay causas asignables, la posibilidad de diferencias entre muestras o subgrupos se maximice mientras que la posibilidad de diferencias debido a causas asignables dentro de las muestras se minimice. Nota: Un ejemplo de un subgrupo racional inadecuado sería formar una muestra (subgrupo) que tenga observaciones del final de un turno y el principio de otro. Esto haría difícil detectar una diferencia entre turnos. David R. González-Barreto Estadísticas Industriales Marzo
177 Gráficos de Control - Ejemplo En la manufactura de pistones para motores de carro, una característica de calidad importante es el diámetro del pistón. El proceso podría estar controlado con un diámetro promedio de 74 mm. La desviación estándar de los pistones es 0.1mm (n = 5). 1. Construya una gráfica de control para x con: límites a 3 3 w límites a /2 = A 3, cuál es la probabilidad de error tipo I? 3. Para los límites 3, cuál es el ARL? 4. Cuánto será el ARL, si n = 5, el proceso se sale de control y además la media se desplaza de a mm? 5. Si n = 10, cuál sería el ARL? David R. González-Barreto Estadísticas Industriales Marzo
178 Gráficos de Control - Ejemplo Solución: w = 74mm, 0.1 w n (a) LCS = w + k w (0.045) = LC = w = LCI = w - k w 74-3(0.045) = David R. González-Barreto Estadísticas Industriales Marzo
179 Gráficos de Control - Ejemplo 1 (b) LCS = w + /2 w (0.045) = LC = w = LCI = w - /2 w (0.045) = David R. González-Barreto Estadísticas Industriales Marzo
180 Gráficos de Control característica de calidad LCS (1b) = LCS = (1a) LC = 74.0 LCS = (1a) LCS LC } w k w } k w LCS (1b) = LCI # de muestra o sequencia (tiempo) David R. González-Barreto Estadísticas Industriales Marzo
181 Gráficos de Control - Ejemplo 2. /2 = 3 (3) = , 1 - = /2 = = (2) = Para obtener el ARL primero construiremos las curvas O.C. para Z / 2 3 ARL 1 p Es el largo promedio de la corrida del gráfico x cuando el proceso está en control estadístico. O sea que, aunque el proceso esté en control se verá una falsa alarma de fuera de control cada 370 muestras. David R. González-Barreto Estadísticas Industriales Marzo
182 Gráficos de Control - Ejemplo 4. El desplazamiento coincide con el límite de control superior, por lo tanto, la probabilidad de que x esté entre los límites de control es De manera que, la probabilidad de que esté fuera es p = = 0.50: ARL Esto es que el gráfico de control requerirá en promedio dos muestras de tamaño n = 5 para detectar el desplazamiento de : a En promedio, con dos muestras se podrá detectar el desplazamiento. 5. Se puede demostrar que la probabilidad de detectar el cambio cuando el tamaño de muestra se incrementa a n = 10, es mayor que en el caso anterior cuando n = 5. Por lo tanto, se espera un ARL < 2. David R. González-Barreto Estadísticas Industriales Marzo
183 Base Estadística de los Gráficos de Control para Variables Prin EDA Estim Dist Mues Hyp Cont Cap R&R El promedio muestral de una característica de calidad normalmente distribuida N (, ) es: x x 1 x 2... n x n x ~ N, x donde x n Existe una probabilidad 1 - de que el promedio muestra x caiga entre: z 2 x Por teorema de límite central asumimos normalidad en la distribución de x. Cuando no sabemos y, los podemos estimar con muestras preliminares. Al menos 20 muestras con n observaciones de la característica de calidad medida. Entonces el estimado de, el promedio del proceso es: x x 1 x 2... m x m David R. González-Barreto Estadísticas Industriales Marzo
184 Base Estadística de los Gráficos de Control para Variables Prin EDA Estim Dist Mues Hyp Cont Cap R&R Un estimador de la desviación estándar ( ) cuando n < 10 es: x... R ˆ R 1 2 donde R m d2 m R R R 1 xmax xmin d 2 = parámetro de la distribución de rango relativo (W = R/ ) Su valor depende de n. Antes de tratar de controlar el promedio hay que controlar la variabilidad ya que, los límites de control gráfico x dependen de la variabilidad del proceso. David R. González-Barreto Estadísticas Industriales Marzo
185 Gráficos de Control R Se utiliza para controlar la variabilidad del proceso cuando n < 10. Los límites de control para el gráfico R son: R LCS R 3 ˆ R R 3d 3 RD d 2 4 LC R R LCI R 3 ˆ R R 3d 3 RD d 2 3 D 3 y D 4 son valores tabulados. David R. González-Barreto Estadísticas Industriales Marzo
186 Gráfico de Control X-Barra Se usa para controlar el promedio del proceso. Los límites de control son: 3 LCS x R x A2 R d n 2 LC x 3 LCI x R x A2 R d n 2 A 2 es un valor en la tabla. David R. González-Barreto Estadísticas Industriales Marzo
187 Gráficos de Control S Se utiliza para controlar la variabilidad del proceso cuando n 10. Cuando es desconocida un estimador será: s 2 i n l x n 1 1 x 2 y los límites de control serán: s 2 LCS s 3 1 c4 B4s c 4 LC s LCI s s c4 B c 4 3 B 4 y B 3 son valores tabulados y s 1 m m l s i David R. González-Barreto Estadísticas Industriales Marzo
188 Gráficos de Control S Entonces los límites de control para el gráfico x son: 3s LCS x x A3 s c n 4 LC x 3s LCI x x A3 s c n 4 David R. González-Barreto Estadísticas Industriales Marzo
189 Gráficos de Control - Ejemplo Se desea establecer control estadístico para el ancho de tabletas. Se toman 25 muestras de 5 observaciones cada una. Muestra X 1 X 2 X 3 X 4 X 5 x R *En la tabla se presentan las primeras quince muestras David R. González-Barreto Estadísticas Industriales Marzo
190 X-bar Range Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control - Ejemplo X-bar Chart for Ancho Subgroup UCL = Centerline = LCL = Luego de eliminar la muestra 3 y recalcular los límites del gráfico R, nos percatamos de que las muestras 22 y 23 del gráfico están fuera de los límites de control. Una vez conseguimos las causas asignables de estos, los eliminamos y recalculamos los límites de control del gráfico. Range Chart for Ancho 8 UCL = Centerline = 3.48 LCL = Subgroup David R. González-Barreto Estadísticas Industriales Marzo
191 Range X-bar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control - Ejemplo X-bar Chart for Ancho Subgroup Range Chart for Ancho Subgroup UCL = Centerline = LCL = UCL = 6.96 Centerline = 3.29 LCL = 0.00 Al graficarse los restantes puntos dentro de los límites recalculados, notará que el punto número 15 está todavía fuera de control en el gráfico del promedio. Por esta razón necesitaríamos recalcular nuestros límites nuevamente. Una vez todos los puntos se encuentren dentro de los límites de control y no muestren ningún patrón sistemático, asumiremos los límites recién calculados como los límites de control del proceso. De este momento en adelante trazaremos los puntos del proceso en tiempo real haciendo uso de los límites estimados. De encontrar alguna señal de que el proceso se encuentra fuera de control hay que investigar la causa. David R. González-Barreto Estadísticas Industriales Marzo
192 Gráficos de Control - Ejemplo Ilustración de los gráficos de control tamaño variable. x y S usando 25 muestras pero de Muestra X 1 X 2 X 3 X 4 X 5 x S *En la tabla se presentan las primeras quince muestras David R. González-Barreto Estadísticas Industriales Marzo
193 Range X-bar Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control - Ejemplo X-bar Chart for Ancho UCL = Centerline = LCL = Subgroup Range Chart for Ancho UCL = 0.05 Centerline = 0.02 LCL = Subgroup David R. González-Barreto Estadísticas Industriales Marzo
194 Curva O.C. La probabilidad de error tipo II para el gráfico de control x está dada por: P LCL x UCL \ 1 0 k Dado que 2 x ~ N, y sus límites de control son: n UCL 3 0 n LCL 3 0 n UCL k 0 LCL 0 n n k 3 n 0 k 3 n k n n 3 k n 3 k n David R. González-Barreto Estadísticas Industriales Marzo
195 Curva O.C. - Ejemplo Si n = 5 y se quiere saber la probabilidad de detectar un desplazamiento de 1 = en la primera muestra después del desplazamiento Plot la probabilidad de detectar el desplazamiento: La curva característica operacional para varios tamaños de muestras (n) se presenta a continuación k oc_n=1 oc_n=5 oc_n=7 oc_n=8 oc_n=10 oc_n=15 David R. González-Barreto Estadísticas Industriales Marzo
196 Gráficos de Control para Medidas Individuales Existen muchas situaciones donde el tamaño de muestra para monitorear el proceso es 1 (n = 1). Algunos ejemplos de estas situaciones se describen a continuación: La inspección es automatizada permitiendo que cada unidad manufacturada sea analizada. La razón de producción es muy lenta, haciendo prácticamente imposible o indeseable que tamaños de muestras mayores de 1 (n > 1), puedan acumularse para ser analizadas. En algunos procesos, como por ejemplo, la fabricación de papel, se toman medidas en múltiples localizaciones a través del rollo. Por ejemplo, podemos tomar medidas del espesor del rollo, esto produciría una desviación estándar que es muy pequeña si el objetivo es el de controlar el espesor del rollo a lo largo del mismo. David R. González-Barreto Estadísticas Industriales Marzo
197 Gráficos de Control para Medidas Individuales El gráfico de medidas individuales usa el rango movible de dos observaciones consecutivas para estimar la variabilidad del proceso. El rango movible se define como: i xi xi 1 MR. Los parámetros para el gráfico de control de medidas individuales son: LCS x 3 d MR 2 x Línea central = LCS x 3 d MR 2 David R. González-Barreto Estadísticas Industriales Marzo
198 Gráficos de Control para Medidas Individuales - Ejemplo La viscosidad de un primer de pintura es una importante característica de calidad. El producto se produce en lotes y como producir cada lote toma varias horas, el tiempo de producción es muy lento para permitir que se haga más de una muestra. Lote Viscosidad x Rango Movible MR x MR David R. González-Barreto Estadísticas Industriales Marzo
199 X MR(2) Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control para Medidas Individuales - Ejemplo X Chart for Viscocidad Observation UCL = Centerline = LCL = MR(2) Chart for Viscocidad UCL = 1.57 Centerline = 0.48 LCL = Observation David R. González-Barreto Estadísticas Industriales Marzo
200 Gráficos de Control para Medidas Individuales - Ejemplo En la siguiente tabla se muestran 15 lotes adicionales para el ejemplo de la viscosidad de la pintura. Lote Viscosidad x Rango Movible MR David R. González-Barreto Estadísticas Industriales Marzo
201 MR(2) X Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráficos de Control para Medidas Individuales - Ejemplo X Chart for Viscocidad UCL = Centerline = LCL = Observation MR(2) Chart for Viscocidad UCL = 1.34 Centerline = 0.41 LCL = Observation David R. González-Barreto Estadísticas Industriales Marzo
202 Gráficos de Control para Medidas Individuales - Ejemplo Algunos analistas recomiendan no construir el gráfico de los rangos movibles. Ellos señalan que estos no muestran realmente cambios en la variabilidad del proceso. Más bien muestran cambios en el promedio del proceso. Esto se muestra claramente en las figuras anteriores donde cambios en el promedio alrededor del lote #20 se perciben en ambos gráficos, en el de medidas individuales y en el de los rangos movibles. Nota: En estos gráficos, de medidas individuales, hemos hecho la presunción de que las observaciones provienen de una distribución normal. Esta presunción es crítica para este gráfico. Si mediante cualquier prueba encontramos evidencia de que esta presunción no se cumple, tendríamos que determinar los límites de control para las medidas individuales basándonos en las percentilas de la distribución apropiada. En este caso, utilizar las fórmulas discutidas para calcular los límites sería incorrecto. David R. González-Barreto Estadísticas Industriales Marzo
203 Gráfico de Control EWMA El gráfico de control EWMA es una buena alternativa a los gráficos tradicionales Shewhart, cuando nos interesa detectar desplazamientos muy pequeños en el proceso. Este gráfico se utiliza típicamente con observaciones individuales pero como veremos es posible crear subgrupos cuyo tamaño de muestra n > 1. La estadística EWMA se define como: z i x i ( 1 ) zi 1 donde 0 < < 1 es una constante y el valor inicial necesario para la primera muestra se define como el valor deseado z 0 = 0 David R. González-Barreto Estadísticas Industriales Marzo
204 Gráfico de Control EWMA Otra alternativa usada para el valor inicial es z 0 x. La siguiente ecuación muestra que la estadística EWMA a la que llamamos z, es un promedio pesado de los promedios muestrales previos: Por ejemplo, si z z i i x x i i (1 (1 ) x ) x i 1 i 1 (1 (1 ) z ) = 0.2 entonces los pesos asignados a las observaciones 2 i z i 2 2 previas serán 0.16, 0.128, ,. Mientras que el peso asignado a la observación actual será de 0.2. Debido a que estos pesos declinan de forma geométrica algunas personas conocen este gráfico como el de promedio geométrico movible. David R. González-Barreto Estadísticas Industriales Marzo
205 Gráfico de Control EWMA Si las observaciones individuales x i son independientes con varianza límites del gráfico EWMA estarán dados por: 2 los LCS 0 k (2 ) 1 (1 ) 2i LC 0 LCI 0 k (2 ) 1 (1 ) 2i David R. González-Barreto Estadísticas Industriales Marzo
206 Gráfico de Control EWMA En estas ecuaciones K sirve para determinar el ancho de los límites que se desea, mientras que i representa la muestra bajo consideración. Como estos límites dependen de la muestra bajo consideración los mismos no son constantes como veremos en el ejemplo que se presenta a continuación. Sin embargo a medida que i aumenta los límites tienden a estabilizarse de la siguiente manera: LCS 0 k (2 ) LC 0 LCI 0 k (2 ) No obstante la mayoría de los autores recomiendan utilizar la definición original para mantener los límites exactos en los valores pequeños de i. David R. González-Barreto Estadísticas Industriales Marzo
207 Gráfico de Control EWMA Ejemplo Los siguientes son datos para el peso de partículas tomadas en un laboratorio. Se presume = 0.10 y k = 2.7 Muestra Observación *En esta tabla se presentan las primeras quince observaciones. David R. González-Barreto Estadísticas Industriales Marzo
208 EWMA Prin EDA Estim Dist Mues Hyp Cont Cap R&R Gráfico de Control EWMA Ejemplo EWMA Chart for Peso UCL = Centerline = LCL = Observation David R. González-Barreto Estadísticas Industriales Marzo
209 Gráfico de Control EWMA Como dijimos anteriormente, estos gráficos son muy efectivos detectando cambios pequeños en el proceso. El diseño de los mismos envuelve determinar la constante K así como la constante. Estudios han determinado que valores de en el intervalo 0.05 < < 0.25 trabajan muy bien en la práctica. Los valores = 0.05, = 0.10 y = 0.20 son los más frecuentemente utilizados. Una práctica adecuada es seleccionar valores pequeños de para detectar cambios más pequeños. También se ha encontrado que k = 3 trabaja bastante bien en la práctica especialmente para valores grandes de. Sin embargo, cuando < 0.10 los estudios han encontrado que k debe considerarse dentro del siguiente intervalo 2.6 < k < 2.8. David R. González-Barreto Estadísticas Industriales Marzo
210 Gráfico de Control EWMA Un detalle que es importante señalar es que el gráfico tradicional Shewhart reacciona más rápido que el EWMA para desplazamientos grandes. Por lo que algunos autores han sugerido un esquema de control que incluya ambos gráficos simultáneamente. EWMA con n > 1 Por lo general el gráfico EWMA se utiliza con observaciones individuales. Sin embargo, si los subgrupos racionales consisten de más de una observación, n > 1, entonces todo lo que necesitamos hacer es reemplazar x i por y por en las ecuaciones previamente discutidas. x i n David R. González-Barreto Estadísticas Industriales Marzo
211 Gráficos de Control por Atributos Cuando los datos son de tipo discreto, los gráficos de control están asociados con modelos de distribuciones discretas. Los gráficos más conocidos para esta clasificación de datos lo son: el gráfico p, para la fracción de defectuosos, y el gráfico c, para el control de defectos. Los modelos asociados con cada uno de estos son el binomial y el Poisson, respectivamente. David R. González-Barreto Estadísticas Industriales Marzo
212 Gráficos de Control por Atributos Los límites de control estándar para ambos gráficos se muestran a continuación: Para el gráfico p p(1 p), donde p-barra es p 3 la fracción de defectuosos n promedio Para el gráfico c promedio de defectos. c 3 c, donde c-barra es el David R. González-Barreto Estadísticas Industriales Marzo
213 Critical Prin EDA Estim Dist Mues Hyp Cont Cap R&R Plan de Control Product: Line: Product Characteristic Process Steps Voice of the Customer Low er Spec Limit Target [Area name here] Control Plan Reference Documents No. and Revision: Upper Spec Limit units Measurement Data Type Sample Frequency Measurement System Instrument Used Gage Capability Voice of the Process Process Cpk or PPM Prioritization Me (e.g. FMEA, Busine Control Tools Monitoring System Response Plan David R. González-Barreto Estadísticas Industriales Marzo
214 Análisis de Capacidad Capacidad - La habilidad de un proceso para producir productos dentro de las especificaciones establecidas. Un proceso se dice que es capaz cuando la gran mayoría del producto confeccionado por el mismo está dentro de las especificaciones. Indices de la capacidad del proceso - Miden la capacidad de un proceso. David R. González-Barreto Estadísticas Industriales Marzo
215 Variabilidad La voz del proceso se representa por la variabilidad observada en el proceso. El proceso nos dice lo que puede lograr. La voz del cliente está representada por las especificaciones del producto. El cliente nos dice lo que desea obtener. La capacidad del proceso nos indica si la voz del proceso podrá complacer la voz del cliente. David R. González-Barreto Estadísticas Industriales Marzo
216 Variabilidad Proceso Controlado usando la filosofía de estar lo más cercano al valor nominal. Proceso Controlado usando la filosofía de cualquier valor dentro de las especificaciones es aceptable. Esp. Inf. Esp. Sup. David R. González-Barreto Estadísticas Industriales Marzo
ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el
Más detallesEstadística Inferencial. Estadística Descriptiva
INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y
Más detallesFase 2. Estudio de mercado: ESTADÍSTICA
1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.
Más detallesU.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo
U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesMEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro
Más detallesTabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )
Test de Hipótesis II Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ conocida: Suponga que X, X,, X n, es una m.a.(n) desde N( µ, σ ) Estadística de Prueba X - μ Z 0 = σ / n ~ N(0,)
Más detallesTipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE
Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Objetivos 2 Identificar los tipos de gráficas. Definir los conceptos tablas y cuadros Reconocer las partes de una gráfica. Construir
Más detallesObjetivos. Epígrafes 3-1. Francisco José García Álvarez
Objetivos Entender el concepto de variabilidad natural de un procesos Comprender la necesidad de los gráficos de control Aprender a diferenciar los tipos de gráficos de control y conocer sus limitaciones.
Más detallesUNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)
UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) 1. ESTADÍSTICA: CLASES Y CONCEPTOS BÁSICOS En sus orígenes históricos, la Estadística estuvo ligada a cuestiones de Estado (recuentos, censos,
Más detallesDistribución Chi (o Ji) cuadrada (χ( 2 )
Distribución Chi (o Ji) cuadrada (χ( 2 ) PEARSON, KARL. On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably
Más detallesEjemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.
ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos
Más detalles2.- Tablas de frecuencias
º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ -----------------------------------------------------------------------------------------------------------------------------------------------------------------
Más detallesTema 1.- Correlación Lineal
Tema 1.- Correlación Lineal 3.1.1. Definición El término correlación literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una
Más detallesUnidad 7: Muestreo de aceptación
Unidad 7: Muestreo de aceptación Cap 12. Gutiérrez Liliana Recchioni Unidad 7: 7.1. Tipos de planes de muestreo. 7.2. Variabilidad y curvas características (CO). 7.3. Diseño de un plan de muestreo simple
Más detallesPregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24
Comenzado el lunes, 25 de marzo de 2013, 17:24 Estado Finalizado Finalizado en sábado, 30 de marzo de 2013, 17:10 Tiempo empleado 4 días 23 horas Puntos 50,00/50,00 Calificación 10,00 de un máximo de 10,00
Más detallesANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL
ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL DEPARTAMENTO DE GEOGRAFÍA FACULTAD DE HUMANIDADES UNNE Prof. Silvia Stela Ferreyra Revista Geográfica Digital. IGUNNE. Facultad de Humanidades.
Más detallesSESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES
SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES RELACIONES BINARIAS PAR ORDENADO Es un arreglo de dos elementos que tienen un orden determinado donde a es llamada al primera componente y b es llamada la
Más detallesTema 5 Algunas distribuciones importantes
Algunas distribuciones importantes 1 Modelo Bernoulli Distribución Bernoulli Se llama experimento de Bernoulli a un experimento con las siguientes características: 1. Se realiza un experimento con dos
Más detallesINFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón
Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado
Más detallesUNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE
UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE Glosario Media: es la puntuación promedio de un grupo de datos. Mediana: la mediana viene a ser la
Más detallesEstadística. Análisis de datos.
Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un
Más detallesCAPÍTULO 4 TÉCNICA PERT
54 CAPÍTULO 4 TÉCNICA PERT Como ya se mencionó en capítulos anteriores, la técnica CPM considera las duraciones de las actividades como determinísticas, esto es, hay el supuesto de que se realizarán con
Más detallesCurva de Lorenz e Indice de Gini Curva de Lorenz
Curva de Lorenz e Indice de Gini Curva de Lorenz La curva de Lorenz es útil para demostrar la diferencia entre dos distribuciones: por ejemplo quantiles de población contra quantiles de ingresos. También
Más detallesUNIVERSIDAD AUTONOMA DE SANTO DOMINGO
UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Industrial (EST-121) NUMERO DE CREDITOS
Más detallesCurso de Estadística Básica
Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión
Más detallesANALISIS E INTERPRETACION DE DATOS SOBRE PERMANENCIA Y GASTOS DE LOS ALUMNOS EN LA UNIVERSIDAD NACIONAL DE INGENIERIA
ANALISIS E INTERPRETACION DE DATOS SOBRE PERMANENCIA Y GASTOS DE LOS ALUMNOS EN LA UNIVERSIDAD NACIONAL DE INGENIERIA Jack Marlon Martínez Abregu e-mail: marlon_jack@hotmail.com IvánJosé Pazos Alvarado
Más detallesTécnicas Cuantitativas para el Management y los Negocios I
Técnicas Cuantitativas para el Management y los Negocios I Licenciado en Administración Módulo II: ESTADÍSTICA INFERENCIAL Contenidos Módulo II Unidad 4. Probabilidad Conceptos básicos de probabilidad:
Más detallesJulio Deride Silva. 27 de agosto de 2010
Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 27 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesM ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E
M ÉTODO DE MUESTREO DE GEOSINTÉTICOS PARA ENSAYOS I.N.V. E 908 07 1. OBJETO 1.1 Esta práctica cubre dos procedimientos para el muestreo de geosintéticos para ser ensayados. Se requiere que las instrucciones
Más detallesMedidas de centralización
1 1. Medidas de centralización Medidas de centralización Hemos visto cómo el estudio del conjunto de los datos mediante la estadística permite realizar representaciones gráficas, que informan sobre ese
Más detallesEstadística descriptiva y métodos diagnósticos
2.2.1. Estadística descriptiva y métodos diagnósticos Dra. Ana Dorado Díaz Consejería de Sanidad Diplomado en Salud Pública Diplomado en Salud Pública - 2 Objetivos específicos 1. El alumno aprenderá a
Más detallesPROBLEMAS ESTADÍSTICA I
PROBLEMAS ESTADÍSTICA I INGENIERÍA TÉCNICA EN INFORMÁTICA CURSO 2002/2003 Estadstica Descriptiva Unidimensional 1. Un edificio tiene 45 apartamentos con el siguiente número de inquilinos: 2 1 3 5 2 2 2
Más detallesINFERENCIA ESTADISTICA
1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,
Más detallesTema 4: Probabilidad y Teoría de Muestras
Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009
Más detallesUnidad IV. Una variable aleatoria X es continua si su función de distribución es una función continua.
Unidad IV Distribuciones de Probabilidad Continuas 4.1. Definición de variable aleatoria continúa. Una variable aleatoria X es continua si su función de distribución es una función continua. En la práctica,
Más detallesUNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES
UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES En la Sección anterior se abordó contenidos relacionados con las funciones y gráficas, continuamos aprendiendo más sobre funciones; en la presente unidad abordaremos
Más detallesNOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012
NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012 Matilde Ungerovich- mungerovich@fisica.edu.uy DEFINICIÓN PREVIA: Distribución: función que nos dice cuál es la probabilidad de que cada suceso
Más detallesCómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas
Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas Sesión de Residentes 13 de febrero, 2012 ÍNDICE Diferencia entre población y muestra. Diferencia
Más detallesConceptos básicos estadísticos
Conceptos básicos estadísticos Población Población, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. El concepto
Más detallesESTADÍSTICA CON EXCEL
ESTADÍSTICA CON EXCEL 1. INTRODUCCIÓN La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en
Más detallesUNIVERSIDAD AUTONOMA DE SANTO DOMINGO
UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Descriptiva Para Psicólogos (EST-225)
Más detalles3.1. Administración de la medición y de la información estratégica:
Unidad III Aspectos Generales Sobre la Gestión de la Calidad 3.1. Administración de la medición y de la información estratégica: Los siguientes criterios corresponden a la administración de la medición
Más detallesESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN
CICLO, ÁREA O MÓDULO: TERCER CUATRIMESTRE OBJETIVO GENERAL DE LA ASIGNATURA: Al termino del curso el alumno efectuara el análisis ordenado y sistemático de la Información, a través del uso de las técnicas
Más detallesTema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
Más detallesDISTRIBUCIONES BIDIMENSIONALES
La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento
Más detalles4. NÚMEROS PSEUDOALEATORIOS.
4. NÚMEROS PSEUDOALEATORIOS. En los experimentos de simulación es necesario generar valores para las variables aleatorias representadas estas por medio de distribuciones de probabilidad. Para poder generar
Más detallesMEDIDAS DE TENDENCIA CENTRAL O DE PRECISIÓN
MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIÓN Cuando se analiza un conjunto de datos, normalmente muestran una tendencia a agruparse o aglomerarse alrededor de un punto central. Para describir ese conjunto
Más detallesIng. Eduardo Cruz Romero w w w. tics-tlapa. c o m
Ing. Eduardo Cruz Romero eduar14_cr@hotmail.com w w w. tics-tlapa. c o m La estadística es tan vieja como la historia registrada. En la antigüedad los egipcios hacían censos de las personas y de los bienes
Más detallesDispone de 1 hora para resolver las siguientes cuestiones planteadas.
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL FACULTAD DE ECONOMÍA Y NEGOCIOS EXAMEN TEÓRICO DE ESTADÍSTICA COMPUTARIZADA NOMBRE: PARALELO: Dispone de 1 hora para resolver las siguientes cuestiones planteadas.
Más detallesA continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.
M150: Creciendo A) Presentación del problema LOS JOVENES CRECEN MAS ALTO A continuación se presenta la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes. B) Preguntas del problema
Más detallesESTADÍSTICA SEMANA 3
ESTADÍSTICA SEMANA 3 ÍNDICE MEDIDAS DESCRIPTIVAS... 3 APRENDIZAJES ESPERADOS... 3 DEFINICIÓN MEDIDA DESCRIPTIVA... 3 MEDIDAS DE POSICIÓN... 3 MEDIDAS DE TENDENCIA CENTRAL... 4 MEDIA ARITMÉTICA O PROMEDIO...
Más detallesPercentil q (p q ) Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple
Percentil q (p q ) Una medida de posición muy útil para describir una población, es la denominada 'percentil'. En forma intuitiva podemos decir que es un valor tal que supera un determinado porcentaje
Más detallesTransformaciones de variables
Transformaciones de variables Introducción La tipificación de variables resulta muy útil para eliminar su dependencia respecto a las unidades de medida empleadas. En realidad, una tipificación equivale
Más detallesUNIVERSIDAD DEL NORTE
UNIVERSIDAD DEL NORTE 1. IDENTIFICACIÓN DIVISIÓN ACADÉMICA DIVISIÓN DE CIENCIAS BÁSICAS DEPARTAMENTO MATEMÁTICAS Y ESATADÍSTICA. PROGRAMA ACADÉMICO ESTADÍSTICA I-AD CÓDIGO DE LA ASIGNATURA EST 1022 PRE-REQUISITO
Más detallesESTADÍSTICA DESCRIPTIVA PARA EL TURISMO
ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO RELACIÓN DE PROBLEMAS PROPUESTOS DE UNA VARIABLE Curso académico 2004-2005 DPTO. ECONOMÍA APLICADA I 1. Obtener las frecuencias acumuladas, las frecuencias relativas
Más detallesTEMA 3: Inspección Estadística por Variables
TEMA 3: Inspección Estadística por Variables 1 Planes de muestreo por variables 2 Inspección en cadena 3 Inspección por muestreo continuo 4 Planes de muestreo por lotes salteados 5 Consideración de errores
Más detallesDistribuciones de probabilidad
Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir
Más detallesPruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016
Pruebas de Hipótesis-ANOVA Curso de Seminario de Tesis Profesor Q Jose Avila Parco Año 2016 Análisis de la Varianza de un factor (ANOVA) El análisis de la varianza (ANOVA) es una técnica estadística paramétrica
Más detallesOtra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza
CARACTERÍSTICAS DE LA POBLACIÓN. Una pregunta práctica en gran parte de la investigación de mercado tiene que ver con el tamaño de la muestra. La encuesta, en principio, no puede ser aplicada sin conocer
Más detallesT1. Distribuciones de probabilidad discretas
Estadística T1. Distribuciones de probabilidad discretas Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir de
Más detallesTema 4: Probabilidad y Teoría de Muestras
Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detalles2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual
Prueba Escrita de matemática / Nivel: Sétimo año 1. Estadística - Unidad estadística - Características - Datos u observaciones - Población - Muestra - Variabilidad de los datos - Variables cuantitativas
Más detallesMÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA
1 UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS OCCIDENTALES EZEQUIEL ZAMORA VICE-RECTORADO DE PLANIFICACIÓN Y DESARROLLO SOCIAL PROGRAMA CIENCIAS SOCIALES Y JURIDICAS SUBPROGRAMA ADMINISTRACIÓN SUBPROYECTO:
Más detallesÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Más detallesOtra forma de enumerar los resultados es en una tabla de frecuencia:
Materia: Matemática de Séptimo Tema: Intervalo de Clases e Histogramas Qué pasa si quisieras matar algo tiempo mientras esperas tu vuelo de conexión en el aeropuerto? Empiezas a contar el número de personas
Más detallesBioestadística: Estadística Descriptiva
Bioestadística: M. González Departamento de Matemáticas. Universidad de Extremadura Bioestadística 1 2 Bioestadística 1 2 Coneptos Básicos ESTADÍSTICA Ciencia que estudia el conjunto de métodos y procedimientos
Más detallesDISTRIBUCIÓN N BINOMIAL
DISTRIBUCIÓN N BINOMIAL COMBINACIONES En muchos problemas de probabilidad es necesario conocer el número de maneras en que r objetos pueden seleccionarse de un conjunto de n objetos. A esto se le denomina
Más detallesMódulo de Estadística
Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen
Más detallesTema 5. Contraste de hipótesis (I)
Tema 5. Contraste de hipótesis (I) CA UNED de Huelva, "Profesor Dr. José Carlos Vílchez Martín" Introducción Bienvenida Objetivos pedagógicos: Conocer el concepto de hipótesis estadística Conocer y estimar
Más detallesMatemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis
Matemáticas 2.º Bachillerato Intervalos de confianza. Contraste de hipótesis Depto. Matemáticas IES Elaios Tema: Estadística Inferencial 1. MUESTREO ALEATORIO Presentación elaborada por el profesor José
Más detallesIntroducción. Flujo Eléctrico.
Introducción La descripción cualitativa del campo eléctrico mediante las líneas de fuerza, está relacionada con una ecuación matemática llamada Ley de Gauss, que relaciona el campo eléctrico sobre una
Más detallesPROGRAMA ACADEMICO Ingeniería Industrial
1. IDENTIFICACIÓN DIVISION ACADEMICA Ingenierías DEPARTAMENTO Ingeniería Industrial PROGRAMA ACADEMICO Ingeniería Industrial NOMBRE DEL CURSO Análisis de datos en Ingeniería COMPONENTE CURRICULAR Profesional
Más detallesLOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL
PreUnAB LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, MEDIDAS DE TENDENCIA CENTRAL Clase # 26 Noviembre 2014 ESTADÍGRAFOS Concepto de estadígrafo Un estadígrafo, o estadístico, es un indicador que se calcula
Más detallesIndicaciones para el lector... xv Prólogo... xvii
ÍNDICE Indicaciones para el lector... xv Prólogo... xvii 1. INTRODUCCIÓN Qué es la estadística?... 3 Por qué estudiar estadística?... 5 Empleo de modelos en estadística... 6 Perspectiva hacia el futuro...
Más detallesMicro y Macroeconomía
Micro y Macroeconomía 1 Sesión No. 6 Nombre: Teoría del consumidor Contextualización: La microeconomía como herramienta de análisis nos permite el poder comprender el comportamiento de las personas en
Más detallesEstadística descriptiva: problemas resueltos
Estadística descriptiva: problemas resueltos BENITO J. GONZÁLEZ RODRÍGUEZ (bjglez@ull.es) DOMINGO HERNÁNDEZ ABREU (dhabreu@ull.es) MATEO M. JIMÉNEZ PAIZ (mjimenez@ull.es) M. ISABEL MARRERO RODRÍGUEZ (imarrero@ull.es)
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Más detallesVariables aleatorias
Variables aleatorias DEFINICIÓN En temas anteriores, se han estudiado las variables estadísticas, que representaban el conjunto de resultados observados al realizar un experimento aleatorio, presentando
Más detallesEJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:
Ejercicio 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas: a) Marca de los coches. b) Peso de los coches. c) Número de coches vendidos
Más detallesM i. Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana.
Medidas de tendencia central y variabilidada para datos agrupados Media (media aritmética) ( X ) Con anterioridad hablamos sobre la manera de determinar la media de la muestra. Si hay muchos valores u
Más detallesContraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste
1 Contraste de hipótesis Tema 3 1. Pasos del contraste de hipótesis 1.1 Hipótesis estadísticas: nula y alternativa 1.2 Supuestos 1.3 Estadístico de contraste 1.4 Regla de decisión: zona de aceptación y
Más detallesNOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011
NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011 CÓMO CARACTERIZAR UNA SERIE DE DATOS? POSICIÓN- dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos CENTRALIZACIÓN-
Más detallesDefinición: Se llama variable aleatoria a toda función X que asigna a c/u de los elementos del espacio muestral S, un número Real X(s).
VARIABLE ALEATORIA Definición: Se llama variable aleatoria a toda función X que asigna a c/u de los elementos del espacio muestral S, un número Real X(s). X : S S s s X () s X(s) Rx Rx es el recorrido
Más detallesMétodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va
Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA
Más detallesDistribuciones de probabilidad discretas
Lind, Douglas; William G. Marchal y Samuel A. Wathen (2012). Estadística aplicada a los negocios y la economía, 15 ed., McGraw Hill, China. Distribuciones de probabilidad discretas Capítulo 6 FVela/ McGraw-Hill/Irwin
Más detallesUnidad V. 5.1 Recta tangente y recta normal a una curva en un punto. Curvas ortogonales.
Unidad V Aplicaciones de la derivada 5.1 Recta tangente y recta normal a una curva en un punto. Curvas ortogonales. Una tangente a una curva es una recta que toca la curva en un solo punto y tiene la misma
Más detallesDIAGRAMA DE FLUJO. Pasos: DEFINICIÓN:
Página 1 de 12 DIAGRAMA DE FLUJO DEFINICIÓN: Un proceso es una serie de acciones que se efectúan para producir un resultado específico. Un flujograma del proceso es una ilustración gráfica de éste, que
Más detallesA. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords
A. PRUEBAS DE BONDAD DE AJUSTE: Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords B.TABLAS DE CONTINGENCIA Marta Alperin Prosora Adjunta de Estadística alperin@fcnym.unlp.edu.ar http://www.fcnym.unlp.edu.ar/catedras/estadistica
Más detallesAlgunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda
Más detallesAritmética de Enteros
Aritmética de Enteros La aritmética de los computadores difiere de la aritmética usada por nosotros. La diferencia más importante es que los computadores realizan operaciones con números cuya precisión
Más detallesPruebas de Hipótesis Multiples
Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ
Más detallesUna población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.
Introducción a la Melilla Definición de La trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico
Más detalles