2. DESCRIPCION DE UN CONJUNTO DE DATOS

Documentos relacionados
Estadística Inferencial. Estadística Descriptiva

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Fundamentos de Estadística y Simulación Básica

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Estadística. Análisis de datos.

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Estadística Descriptiva

2.- Tablas de frecuencias

ESTADÍSTICA CON EXCEL

Construcción de Gráficas en forma manual y con programados

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

INSTITUCION EDUCATIVA LA PRESENTACION NOMBRE ALUMNA:

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Medidas descriptivas I. Medidas de tendencia central A. La moda

Medidas de Tendencia Central.

Z i

Y accedemos al cuadro de diálogo Descriptivos

MEDIDAS DE TENDENCIA CENTRAL

Módulo de Estadística

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

Apuntes y ejercicios de Estadística para 2º E.S.O

DIAGRAMA DE FLUJO. Pasos: DEFINICIÓN:

2º ESO UNIDAD 14 ESTADÍSTICA Y PROBABILIDAD

Curso de Estadística Básica

Medidas de tendencia central y dispersión

Probabilidad y Estadística, EIC 311

1.- Diagrama de barras

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE

Gráficos estadísticos. Estadígrafo

Estadística Descriptiva Métodos descriptivos visuales y medidas resumen

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA DE SISTEMAS

Teoría de la decisión

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

UNIDAD 7 Medidas de dispersión

UNIDAD 6 Medidas de tendencia central

5.2 Representaciones gráficas

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Hoja 6: Estadística descriptiva

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Fase 2. Estudio de mercado: ESTADÍSTICA

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

Curso de Estadística Aplicada a las Ciencias Sociales

CORPORACION UNIFICADA NACIONAL DE EDUCACION SUPERIOR CUN DEPARTAMENTO DE CIENCIAS BASICAS: MATEMATICAS

Tema 2 Estadística Descriptiva

Proyecto PropULSA: Estadística y Probabilidad Breviario Académico

Medidas de Tendencia Central

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

Julio Deride Silva. 27 de agosto de 2010

CURSO VIRTUAL. Acceso a fuentes de información y manejo de redes sociales. Módulo 2

TEMA 1 Estadística Descriptiva. Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

RELACIÓN DE EJERCICIOS TEMA 2

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

La desviación típica y otras medidas de dispersión

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

CUADRO SINÓPTICO PLANIFICACIÓN ANUAL Matemática 1 Básico

Agrupa los resultados por lotes: Rechazados, revisables y aceptados y:

Estadistica Aplicada a la Educación CODIGO: HOC220

1. La Distribución Normal

CM0244. Suficientable

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

EL PAPEL DE LA ESTADISTICA EN O Y M. Objetivo: Identificar índices estadísticos, y métodos más convenientes, para aplicarlos en el estudio de O y M.

MEDIDAS DE VARIABILIDAD

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

El ejemplo: Una encuesta de opinión

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

MEDIDAS DE TENDENCIA CENTRAL

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

Curso de Estadística Unidad de Medidas Descriptivas. Lección 7: Medidas de Posición para Datos Crudos

Estadística Descriptiva. SESIÓN 7 Medidas de centralización

PROBLEMAS ESTADÍSTICA I

Tema 6. Variables aleatorias continuas

Gráficos Estadísticos

(Se corresponde con el tema 14 del libro de Oxford de 4ºESO Opc. B)

Tema 7: Estadística y probabilidad

OBJETIVOS. Tablas de frecuencia y distribución de frecuencias. Descripción de datos: Tablas y distribuciones de frecuencia y su representación

SOLUCIONARIO Medidas de tendencia central y posición

Objetivos. Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos. Epígrafes

Medidas de Tendencia Central. Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010

Medidas de variabilidad (dispersión)

GUIA N 1: Estadistica descriptiva.

Medidas de centralización

La prueba extraordinaria de septiembre está descrita en los criterios y procedimientos de evaluación.

173 ESO. Actividad en el día. Seguridad en el bricolaje:

Estadísticas Elemental Cuartiles y los diagramas de caja 3.1-1

Distribuciones de Probabilidad

UNLaM. Estadística. Secretaría de Extensión Universitaria. Trabajo Practico N 4. Medidas de Posición. Agente de Propaganda Médica

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

MATEMÁTICA DE CUARTO 207

Medidas de Posición n y. Boxplot Lección n 11 Secc Prof. Pedro A. Torres ESMA febrero de Prof. Pedro A. Torres, ESMA 3015 UPRM

Transcripción:

2. DESCRIPCION DE UN CONJUNTO DE DATOS 2.1 Descripción numérica de un conjunto de datos. Como se mencionó en el capitulo 1, uno de los aspectos básicos de la estadística es la recolección de datos. Los datos son mediciones de alguna variable de interés, obtenidas de una población particular mediante la selección de una muestra. Los datos obtenidos de la muestra son de utilidad para obtener estimaciones de los valores de la población. Una población se define como el conjunto de todos los elementos que se somete a un estudio. Un individuo o unidad estadística es cada uno de los elementos que componen la población. Una muestra es un conjunto de elementos extraídos aleatoriamente, cuyo tamaño es menor que la población y que es estadísticamente representativa. El muestreo es la técnica o método con que se extraen los elementos de la población a estudiar. Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire una vez obtenemos un posible valor, cara o cruz. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Las medidas descriptivas numéricas asociadas a una población de mediciones se llaman parámetros de la población; las medidas obtenidas de una muestra de una población se le llaman estadísticos. (Ver fig. 2.1). Fig. 2.1.- Población y Espacio muestral 3

Para analizar el comportamiento o distribución de un conjunto de datos comúnmente se inicia calculando los estadísticos básicos; como son: La Media, la Mediana y la Moda, como medidas de tendencia central, y la Varianza, la Desviación estándar y la Amplitud, como medidas de variabilidad, entre otras. 2.1.1 Medidas de tendencia central. Las medidas de tendencia central mas usadas son: La Media Aritmética o Promedio: Se obtiene a partir de la suma de todos sus datos dividida entre el número total de datos, es decir: (2.1) (2.2) La Mediana: Es un conjunto de números ordenados en orden de magnitud ascendente, es decir, de menor a mayor; el dato que ocupa la posición central corresponde a la mediana. 4

Ejemplo 2.1. Sea el siguiente conjunto de datos, para el caso 1 y caso 2, tenemos que La Moda: En un conjunto de números es el dato que ocurre con mayor frecuencia, es decir, es el dato mas frecuente. La moda puede no existir en la distribución e incluso puede tener hasta dos o más. En el caso de una moda la distribución es unimodal, en el caso de dos modas es bimodal, en el caso de tres modas es trimodal, y así sucesivamente. En la figura 2.2 se observan las gráficas que muestran los distintos sesgos que se pueden presentar en una distribución de datos, como lo son sesgo a la izquierda o sesgo a la derecha o sin sesgo. Fig. 2.2 Tipos de sesgos 5

2.1.2 Medidas de Dispersión. La dispersión o variabilidad de los datos intenta dar una idea de que tan esparcidos se encuentran los datos de una distribución. Las medidas de dispersión más comunes son: Rango o Amplitud: El Rango R se define, como la diferencia existente entre el dato mayor y el dato menor de un conjunto de datos, esto es Ejemplo 2.2. Obtener el rango o amplitud de los siguientes datos, 2 4 3 5 4 3 5 7 6 2 4 5 7 4 amplitud es El dato mayor es 7 y el dato menor es 2, por consiguiente el rango o La Desviación Estándar: La desviación estándar representa las desviaciones de cada uno de los números obtenidos con respecto a su media aritmética, dividido entre el total de datos menos 1, se representa de la siguiente manera. 6

(2.4) (2.5) La Varianza: La varianza de una variable aleatoria es una medida de dispersión definida como la suma de cuadrados de las desviaciones de los datos con respecto a su media, esto es (2.6) (2.7) Coeficiente de Variación: El Coeficiente de variación (CV), es una medida que se emplea fundamentalmente para: 1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida, por ejemplo, kilos y cms. 2. Comparar la variabilidad entre dos grupos de datos obtenidos entre dos o más personas distintas. 3. Comparar dos grupos de datos que tienen la misma media aritmética. 7

El coeficiente de variación se denota y se define como la expresión 2.8, matemáticamente (2.8) Desviación Media: La desviación media se define como la suma de los valores absolutos de las desviaciones de los datos con respecto a la media dividida entre el total de datos, matemáticamente se expresa como, (2.9) Ejemplo 2.3. Obtener para los datos del ejemplo 2.2, 2 4 3 5 4 3 5 7 6 2 4 5 7 4 El valor de la media es, El valor de la varianza es, El valor de la desviación estándar es, El valor del coeficiente de variación es, 8

El valor de la desviación media es, 2.1.3 Regla Empírica. En muchos de los casos, los datos que surgen en la práctica se ha observado que; para distribuciones normales, se cumple lo siguiente: 1. -S y +S (una desviación estándar) están aproximadamente el 68% del total de los datos. 2. ± 2S (dos desviaciones estándar) están aproximadamente el 95% del total de los datos. 3. ± 3S (3 desviaciones estándar) están aproximadamente el 99.7% del total de los datos. En la práctica es común usar 3 desviaciones estándar. La figura 2.3 Muestra geométricamente los porcentajes de la Regla Empírica Figura 2.3 Representación gráfica de la Regla Empírica 9

Ejemplo 2.4. Aplicar la regla empírica para los datos del ejemplo2.2 2 4 3 5 4 3 5 7 6 2 4 5 7 4 En el ejemplo 2.3 encontramos que Media Una desviación Dos desviaciones Tres desviaciones estándar (S) estándar estándar 4.4 1.59 3.18 4.77 En la tabla 2.1 se pueden ver los intervalos según la regla empírica. Para una desviación estándar tenemos que, el 68% de los datos están entre 2.81 a 5.99. Para dos desviaciones estándar se tiene que el 95% de los datos están entre 1.22 a 7.58 y si son tres desviaciones estándar el 99.7% de los datos están entre 0 y 9.17. Intervalo % Regla Empírica 2.81 5.99 68% 1.22 7.58 95% 0 9.17 99.7% Tabla 2.1 Intervalos de datos según la regla empírica. 10

2.2 Descripción gráfica de un conjunto de datos. 2.2.1 Histograma y tabla de frecuencias. Distribuciones o tabla de frecuencia: La construcción de una tabla de frecuencias requiere solo del conteo del número de elementos o individuos que están dentro de cierta clase o intervalo determinado. El Histograma El histograma es una gráfica de las frecuencias observadas de un conjunto de datos (Montgomery D.C., 1991); es uno de los métodos gráficos más comúnmente usados para ver la distribución de los datos. Tiene varias ventajas, una de ellas es que podemos observar la tendencia central y su dispersión (ver figura 2.4).. Figura 2.4 Histograma 11

Figura 2.5 Formas Típicas del Histogramas 12

Dependiendo de las características de los datos, el histograma puede tomar varias formas típicas, en la figura 2.5 se dan algunos ejemplos de las formas típicas en que suelen presentarse en un histograma. Ejemplo 2.5. Realizar el histograma de los datos de la tabla 2.2 que representan las edades de 40 personas. 36 25 37 24 39 20 36 45 31 31 30 25 24 24 30 35 38 40 30 41 39 24 29 23 41 40 33 24 34 40 35 35 36 29 27 29 35 33 32 38 Tabla 2.2 Edades de 40 personas CONSTRUCCION DEL HISTOGRAMA Usando los datos de la tabla 2.2, el histograma para las edades de las personas se obtiene mediante los siguientes pasos: PASO 1. Calcular el rango de los datos. Rango= Dato mayor Dato menor = 45-20=25 PASO 2. Determinar el número de clases. Hay varias maneras de determinar el número de clases, el cual varía entre 5 y 15 dependiendo del número de datos, uno de los más comunes es que el número de clases sea aproximadamente igual a la raíz cuadrada del número de datos. En las edades de los adultos se tiene que son 40 datos, entonces el numero de clases será aproximadamente igual a 40 6. 32, como tiene que ser un numero entero, en este caso puede ser el 6 o el 7, tomaremos el numero 6. 13

PASO 3. Fijar la longitud de clase. Una forma de asignar la misma importancia a todas las clases es tomando la longitud de clase (lc) igual a PASO 4. Construir los intervalos de clase. Los intervalos se obtienen dividiendo el total de los datos en seis intervalos de igual longitud de clase, como se muestra en la tabla 2.3. CLASE INTERVALO 1 20-24.16 2 24.16-28.32 3 28.32-32.48 4 32.48-36.64 5 36.64-40.80 6 40.80-45.00 Tabla 2.3 Intervalos de clase para las edades de las personas PASO 5. Cuantificar la frecuencia de cada clase. Realizar el conteo de los datos que caen en cada intervalo de clase y especificar su frecuencia, como se ilustra en la tabla 2.4 CLASE INTERVALO FRECUENCIA 1 20-24.16 7 2 24.16-28.32 3 3 28.32-32.48 9 4 32.48-36.64 10 5 36.64-40.80 8 6 40.80-45.00 3 Tabla 2.4 frecuencias de edades 14

frecuencia porcentaje=frec. relativa*100 PASO 6. Las frecuencias relativas de cada intervalo de clase. Las frecuencias relativas se obtienen dividiendo cada frecuencia por el total de datos, como se puede ver en la tabla 2.5. CLASE INTERVALO FRECUENCIA FRECUENCIA RELATIVA 1 20-24.16 7 0.1750 2 24.16-28.32 3 0.075 3 28.32-32.48 9 0.225 4 32.48-36.64 10 0.25 5 36.64-40.80 8 0.20 6 40.80-45.00 3 0.075 Tabla 2.5 Frecuencias relativas para las edades PASO 7. Hacer el histograma de frecuencias o de frecuencias relativas. El histograma consiste en una serie de barras cuya longitud de las bases son los intervalos de clase y la altura representa la frecuencia o la frecuencia relativa de los datos contenida en cada clase. En la figura 2.6 se puede ver el histograma de la frecuencia y en la figura 2.7 esta el histograma de la frecuencia relativa. Histograma Histograma 10 25 8 20 6 15 4 10 2 5 0 20 25 30 35 40 45 EDADES 0 20 25 30 35 40 45 EDADES Figura 2.6 Histograma de frecuencias para edades Figura 2.7Histograma de frecuencias relativas para edades 15

2.2.2 Diagrama de caja. Un diagrama de Caja o Caja y Bigotes es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y los "bigotes". Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes. Ejemplo 2.6. Realizar el diagrama de Caja y-bigotes de los datos de las edades de 20 personas. 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40 Ordenar los datos de menor a mayor para calcular los estadísticos. 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calculo de cuartiles: Q 1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q 1 =(24 + 25) / 2 = 24,5 Q 2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos 16

ordenados. Como N/2 =10; como N es un numero par, la mediana es el valor promedio del decimo dato mas el dato que le sigue, = Q 2 = (33 + 34)/ 2 =33,5 Q 3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En este caso, como 3N / 4 = 15, resulta que Q 2 = (39 + 39) / 2 = 39 DIBUJAR LA CAJA Y LOS BIGOTES; en la figura 2.8 se muestra la gráfica de Caja- Bigotes de las edades de las 20 personas. Figura 2.8 Caja-Bigotes Nótese que en la figura 2.8, el bigote de la parte izquierda representa al 25% de edades ( X mín, Q 1 ). La primera parte de la caja a (Q 1, Q 2 ) es el otro 25%. La segunda parte de la caja a (Q 2, Q 3 ) es otro 25% y finalmente el bigote de la parte derecha viene dado por (Q 3, X máx ) y que representa el ultimo 25% de los datos. Interpretaciones de la caja de bigotes Dependiendo de la cantidad de datos y de la dispersión de los datos, el diagrama de caja y bigotes puede presentar algunas variantes en su interpretación, a continuación se presentan algunos casos 17

1- Si la parte izquierda de la caja es mayor que la de la derecha, ello quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%. 2- El bigote de la izquierda (Xmím, Q 1 ) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados que el 25% de los mayores. 3- El rango intercuartílico = Q 3 - Q 1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años. 2.3 Descripción de datos categóricos. 2.3.1 Diagrama de barras y gráfica circular. El grafico de barras y la grafica circular son muy útiles para cuando los datos son del tipo cualitativo o categórico. Los Datos Cualitativos o Categóricos, son aquellos que expresan atributos o categorías. Para facilitar el análisis estadístico de este tipo de datos frecuentemente se codifican a números, esta codificación da lugar a dos subtipos de datos categóricos: Datos Nominales: Son aquellos datos categóricos que pueden ser codificados numéricamente pero donde hay una relación arbitraria entre los números asignados y el valor de la variable. Datos Ordinales: Son aquellos que al ser codificados numéricamente deben guardar una correspondencia entre los números asignados y el verdadero valor de la variable. Las graficas de barras son de utilidad para describir una variable cuyos valores son categorías o para clasificar o ver la relación entre dos o más variables. En la figura 2.9 esta la grafica de barras que muestra las temperaturas en grados Fahrenheit diarias durante una semana. 18

Fig. 2.9 Gráfica de Barras Gráfica circular que utiliza radios para dividir un círculo en sectores de manera que las áreas de los sectores son proporcionales a las cantidades representadas. Fig. 2.10 Gráfica circular Ejemplo 2.7. En una fábrica de ropa se registran los defectos encontrados en prendas de vestir cuando se hace la inspección final. Los registros de las últimas dos semanas se muestran a continuación. T C H T H O M H T H C H O T H O M H C H O C C C H M M O H H T O T Donde: C= COSTURA, M= MONTAJE, T=TELA, O=CORTE y H=HILO. 19

frecuencia En la Tabla 2.6 se puede ver la tabla de frecuencias para los defectos de ropa encontrados. En las figuras 2.11; y 2.12 se muestran, la gráfica de barras y la gráfica circular respectivamente del ejemplo 2.7. Frecuencia Frecuencia Frecuencia Clase Valor Frecuencia Relativa Acumulada Rel. acum. 1 C 6 0.1818 6 0.1818 2 H 11 0.3333 17 0.5152 3 M 4 0.1212 21 0.6364 4 O 6 0.1818 27 0.8182 5 T 6 0.1818 33 1.0000 Tabla 2.6 Tabla de frecuencias para defectos en prendas de vestir Diagrama de Barras de DEFECTO Diagrama de Sectores de DEFECTO 12 18.18% 18.18% 10 8 6 4 2 18.18% DEFECTO COSTURA HILO MONTAJE CORTE TELA 33.33% 0 COSTURA HILO MONTAJE CORTE TELA 12.12% Figura 2.11 Grafica de barras para defectos en prendas de vestir Figura 2.12 Grafica Circular para defectos en prendas de vestir 2.3.2 Diagrama de Pareto. El Diagrama de Pareto es una forma especial de gráfico de barras verticales que separa los problemas muy importantes de los menos importantes, estableciendo un orden de prioridades. Fue creado sobre la base del principio de Pareto, según el cual, el 80% de los problemas son provenientes de apenas el 20% de las causas (ley 80-20, pocos vitales, muchos triviales). Vilfredo Pareto fue un economista italiano 20

que, en el siglo XIX, presentó una fórmula que mostraba la desigualdad en la distribución de los salarios. El Diagrama de Pareto se usa para, identificar y dar prioridad a las causas o defectos más importantes en cualquier proceso, evaluando el comportamiento de un problema, comparando los datos entre el "antes" y el "después". Ejemplo 2.8. Utilizando los datos del ejemplo 2.7 El de la fábrica de ropa; realizar el diagrama de Pareto. T C H T H O M H T H C H O T H O M H C H O C C C H M M O H H T O T Donde: C= COSTURA, M= MONTAJE, T=TELA, O=CORTE y H=HILO. COMO CONSTRUIRLO? Se trazan dos ejes verticales de la misma longitud perpendicular en cada esquina de un eje horizontal. En el eje vertical izquierdo, se traza una escala desde el cero hasta el número de defectos en listados. En el eje vertical derecho haga una escala de 0 a 100%. El 100% corresponderá al total de defectos enlistados. Divida el eje horizontal en intervalos iguales, de acuerdo con la cantidad de categorías o lista de defectos. Construya y denomine las barras, colocando las categorías en orden decreciente de frecuencia, de izquierda a derecha. Trace una línea punteada que conecte el origen con la esquina superior derecha de la primera barra, se suma la altura de la primera barra, la altura de la segunda barra. Marque con un punto el valor obtenido en la prolongación del lado derecho de la segunda barra. Sume a esta nueva altura la altura de la tercera barra. Marque con un punto el valor obtenido en la prolongación del lado derecho de la tercera barra. Hacer esto, sucesivamente, hasta la última barra.enlace todos los puntos marcados con una línea, dando continuidad a la línea punteada iniciada en el origen, para formar la curva de Pareto. El último punto representa el 100 % de los eventos. Complete el 21

frecuencia gráfico con informaciones tales como: nombre del gráfico, período, responsable, etc. Nótese en el diagrama de Pareto de la figura 2.13, que el defecto mas importante en la ropa es el derivado del hilo. Gráfica de Pareto para DEFECTO 40 30 20 51.52 69.70 87.88 100.00 10 33.33 0 Hilo Tela Corte Costura Montaje Figura 2.13 Diagrama de Pareto para defectos en ropa Ejercicios de la unidad 2. Para cada ejercicio del 1 al 8 calcular: La Media, Mediana y Moda Identificar si existe sesgo y de que tipo. Calcular la Amplitud, Varianza, Desviación Estándar y Coeficiente de Variación. Calcule los porcentajes de datos según la Regla Empírica. Elabore la tabla de Frecuencias, Histograma, Barras y/o Circular. Elabore el Diagrama de Caja. Escribe una breve conclusión o interpretación. 22

Problema 1.- En un estudio de dos semanas sobre la productividad de 100 trabajadores, se obtuvieron los siguientes datos sobre el número total de piezas fabricadas por trabajador. 65 39 54 79 32 43 53 41 40 47 68 35 68 22 35 50 35 43 76 58 46 51 61 65 34 76 69 57 33 40 45 85 84 63 53 64 54 51 52 70 55 55 62 44 28 21 36 34 82 56 60 47 73 53 88 42 56 45 37 48 65 49 52 50 80 41 70 68 38 77 35 55 45 56 51 67 74 74 75 62 36 57 45 82 67 60 61 78 60 26 72 62 73 59 59 74 52 50 61 48 Problema 2.- Se registro el tiempo (en meses) entre el inicio de una enfermedad en particular y su repetición en 50 pacientes. 2.1 19.2 14.1 3.7 9.0 4.1 8.7 1.6 8.2 0.2 8.2 1.3 26.7 9.9 1.2 18.0 0.4 6.1 9.6 1.6 0.3 18.0 32.3 3.3 2.4 5.6 3.9 1.4 7.4 7.4 11.4 2.7 4.3 2.4 23.1 6.6 0.2 14.7 5.8 8.3 4.4 6.9 1.0 12.6 2.0 18.4 24.0 13.5 16.7 3.5 23

Problema 3.-Los datos siguientes son las velocidades del viento promedio (en millas por hora) que se producen en 45 ciudades seleccionadas de la Republica Mexicana. 8.9 7.9 6.2 9.4 12.5 6.2 9.7 8.9 7.9 9.3 9.5 8.2 10.2 7.8 7.0 8.9 10.7 11.9 10.5 7.7 9.1 9.2 8.9 11.5 8.9 12.9 10.4 11.0 9.1 10.8 9.6 8.8 8.3 10.4 9.4 35.3 7.1 10.4 11.1 10.5 11.3 8.7 9.1 8.6 7.9 Problema 4.- Considere la siguiente muestra (La resistencia de 50 lotes de algodón, libras necesarias para romper una madeja). 74 100 90 99 97 89 108 94 87 79 101 90 105 83 91 96 81 98 81 98 105 110 91 99 101 94 106 98 93 82 90 86 96 88 97 103 85 106 92 115 97 101 102 96 100 76 96 81 101 93 24

Problema 5.-.En la elaboración de envases de plástico primero se elabora la preforma, para la cual se tienen varios criterios de calidad, uno de ellos es el peso de esta. Para cierto envase se tiene que el peso debe estar en 28 A continuación se muestran los últimos 112 datos. 27.72 28.39 28.21 28.19 28.02 27.93 27.89 27.88 28.06 27.91 27.97 27.95 27.96 27.94 28.04 28.05 27.81 27.74 27.95 27.91 27.93 28.07 28.13 27.98 27.87 27.87 27.82 28.23 27.9 27.91 28.16 27.94 27.86 27.84 27.7 27.98 28.02 28 27.99 28.13 28.26 28.1 27.94 28.07 27.84 27.9 27.87 27.76 27.95 27.94 27.81 27.76 27.96 27.84 27.85 27.93 28.22 27.96 27.88 28.08 28.04 28.19 27.89 28.08 28.09 28.02 27.85 28.27 27.75 27.98 27.75 27.82 28.13 27.88 28.11 28.05 28.14 28.11 28.08 28.16 28.04 28.05 27.75 27.89 27.94 28.19 28.1 27.78 27.63 27.93 27.74 28.1 28.14 27.91 27.84 28.21 27.85 27.84 28.12 28.01 27.97 27.88 28 28.1 28.16 28.16 28.01 28.13 27.97 27.9 27.87 27.94 Problema 6.-Una característica clave en la calidad de las pinturas es su densidad, y un componente que influye en ésta es la cantidad de arenas que se utilizan en su elaboración. La cantidad de arena en la formulación de un lote se controla por medio del número de costales, que según el proveedor contiene 20 kg. Sin embargo, continuamente se tienen problemas en la densidad de la pintura que es necesario corregir con el retrabajo y reprocesos adicionales. En este contexto se decide investigar cuanta arena contiene en realidad los costales. Para ello, se toma una muestra de 30 costales de cada lote o pedido (500). Los pesos obtenidos en las muestras de los últimos tres lotes se muestran en la siguiente tabla. Las especificaciones iniciales que se establecen para el peso de los costales de arena son de 20 25

Lote Peso en costales Lote Peso en costales Lote Peso en costales 18.6 19.1 19.6 18.6 19.6 18.9 20.1 19.7 19.9 19.2 18.6 19.4 19.5 19.7 19.3 20 19.6 20.4 19.5 19.4 19.8 20 19 18.8 20.2 20.1 20.5 19.2 18.7 19.1 19.9 19.4 18.4 20.2 19.7 20.3 18.9 21 20 19.1 17.8 20.7 19.7 19.7 19.6 19.4 19.8 20.4 18.4 20.1 19.2 19.7 20 20 19 19 18.8 18.8 19.6 19 21 20.4 20.4 20 18.6 19.3 18.5 19.4 19.6 20.8 19.8 20.6 19.3 19.6 19.1 18.9 19.7 20.6 20 19.1 20 1 20 19 19.1 2 18.4 20.3 19.7 3 19.7 19.8 20.2 Problema 7.- Una característica importante en la calidad de leche de vaca es la concentración de grasa. En una industria en particular se fijo el 3% como el estándar mínimo que debe cumplir el producto que se recibe directamente de los establos lecheros. Por medio de muestreos y evaluaciones en cierta época del año se obtuvieron los siguientes 90 datos sobre concentración de grasa en cierta región. Obtenga resultados e interprete. 2.7 3.4 2.9 3.3 3.3 2.9 3.1 2.8 3 3.4 3.1 3.1 3.2 2.8 3.3 3.2 2.7 2.9 2.2 3 3.2 3.1 2.7 3.3 3.2 3.4 3.8 3.2 3.5 3.2 2.9 3.6 2.9 3.5 3 3.1 3.4 3.1 4 3.4 3 3 3.3 2.9 2.8 2.9 3 3.6 3.3 3.1 3.3 3.1 3.4 3.3 3.4 3.5 2.5 3.2 3.3 3.6 3.3 2.6 3.5 2.9 3.3 2.7 3 3.8 3.6 3.1 3.1 3.5 3.4 3.3 3.2 3.2 3.5 3.1 3.5 3.7 3.4 2.7 2.9 3.5 3.3 3 3.9 3.4 3 3.2 26

Problema 8.- En la elaboración de una bebida se desea garantizar que el porcentaje de (gas) éste entre 2.5 y 3. En el monitoreo del proceso se obtuvieron los siguientes 115 datos. Obtenga resultados e interprete. 2.61 2.56 2.63 2.56 2.53 2.64 2.61 2.6 2.48 2.69 2.51 2.64 2.68 2.59 2.63 2.63 2.67 2.56 2.61 2.61 2.57 2.63 2.59 2.67 2.52 2.57 2.7 2.57 2.49 2.59 2.61 2.56 2.67 2.66 2.55 2.65 2.73 2.62 2.56 2.64 2.52 2.64 2.52 2.57 2.52 2.6 2.65 2.66 2.64 2.61 2.62 2.56 2.67 2.61 2.6 2.58 2.69 2.66 2.6 2.6 2.6 2.64 2.65 2.58 2.67 2.66 2.57 2.61 2.59 2.5 2.67 2.71 2.67 2.56 2.58 2.6 2.57 2.56 2.49 2.66 2.64 2.61 2.64 2.59 2.53 2.62 2.52 2.72 2.57 2.53 2.67 2.49 2.58 2.53 2.61 2.65 2.51 2.57 2.57 2.58 2.55 2.64 2.55 2.55 2.52 2.6 2.65 2.65 2.53 Problema 9.-Diseñar el Diagrama de Pareto Tipo de queja MARZO Semana 1 Semana 2 Semana 3 TOTAL Limpieza de la sala de espera ll lll lll 8 Limpieza Baños llll ll llll llll l llll 23 Atencion del personal llll llll llll llll llll llll llll llll 40 Calidad de los alimentos ll l l 4 Existencia de medicamentos lll llll lll Limpieza en camas llll llll llll TOTAL 33 34 31 10 13 98 Problema 10.- En una empresa se está buscando reducir las quejas de clientes. Se tienen los registros del último semestre, clasificados por área de trabajo y turno. 27

Área Turno1 Turno2 Quejas: A Ooo oooooooooo o Retrasos x Pedidos xxx xxxxxx + Facturas / Otros ++ / a) Realice un análisis de Pareto completo. Empezando por un Pareto para problemas, y luego a partir del B Oooo ooooooooo mismo, enfocar Paretos para causas. xx Xxxxxxx b) Cuál es el problema más importante? c) Cuáles son las principales pistas para encontrar la +++ / ++ causa del problema principal? C Ooooo Oooooooo x Xxxxx + / D Oooo ooooooooooooo xx xxxxx ++ // ++++ Problema 11.- En una empresa procesadora de carnes frías se tienen los datos de una semana de los defectos en la inspección final de la salchicha se muestran a continuación. Máquina Turno Defecto y número de paquetes defectuosos empacadora Falta de vacío Mancha verde Mancha amarilla A I 4300 700 700 II 6300 650 650 B I 3500 700 400 II 6600 500 420 C I 8500 800 324 II 9120 655 345 Realice un análisis de Pareto completo y encuentre las principales pistas para resolver los problemas en las salchichas. 28