1 Tema 2: Distribuciones de frecuencia y gráficas para datos categórico y discretos 1.1-1
Características importantes de la data 1. Centro: Un valor representativo o promedio que indica dónde se encuentra el centro del conjunto de datos. 2. Variación: Una medida de cuánto varían la data. 3. Distribución: La forma de la dispersión de la data sobre el rango de valores de la variable (acampanada, sesgada o uniforme). 4. Datos extremos: Valores que son muy distintos a los otros valores de la variable. 5. Tiempo: Características que cambian sobre el tiempo. Copyright 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved. 1.1-2
Formas para organizar datos Cuando se obtiene data de una encuesta o de un experimento, ésta se debe organizar en una forma manejable. Formas de Organizar Data Tablas Gráficas Construir un resumen numérico 1.1-3
Tablas Una tabla o distribución de frecuencias agrupa la data en categorías o clases (que no tienen nada en común) indica el número de observaciones en cada categoría. 1.1-4
Razones para construir una distribución de frecuencia 1. Resumir conjuntos de datos grandes. 2. Analizar la naturaleza de los datos 3. Tener una base para la construcción de gráficas importantes. Copyright 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved. 1.1-5
Ejemplo 1: Tabla de frecuencia para data cualitativa o categórica Problema: Un fisioterapeuta quiere determinar los tipos de rehabilitación requeridos por sus pacientes. Para ello, obtiene una muestra aleatoria simple de 36 de sus pacientes y registra la parte del cuerpo que requieren rehabilitación. Construya una distribución de frecuencias para la localización de la lesión. 1.1-6
EJEMPLO: cont Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes. Cadera Espalda Codo Cuello Espalda Espalda Rodilla Mano Espalda Espalda Cadera Ingle Hombro Espalda Espalda Espalda Espalda Codo Mano Hombro Espalda Hombro Ingle Mano Hombro Muñeca Rodilla Muñeca Rodilla Rodilla Muñeca Rodilla Hombro Rodilla Espalda Rodilla Región del cuerpo Conteo Frecuencia Cadera Codo Cuello Espalda Hombro Ingle Mano Muñeca Rodilla 1.1-7
Frecuencia absoluta y frecuencia relativa La tabla anterior muestra frecuencias absolutas (número de observaciones incluidas en cada categoría o clase). La frecuencia relativa es la proporción (o porcentaje) de observaciones dentro de una categoría. Se encuentra usando la fórmula: frecuencia relativa = frecuencia absoluta total de observaciones Una distribución de frecuencias relativas muestra la frecuencia relativa de cada categoría 1.1-8
EJEMPLO: cont Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes. Construya una distribución de frecuencia relativa de los datos. Categoría Frecuencia absoluta Cadera 2 Codo 2 Cuello 1 Espalda 11 Hombro 5 Ingle 2 Mano 3 Muñeca 3 Rodilla 7 Frecuencia relativa 1.1-9
Distribución de frecuencias acumuladas La frecuencia acumulada correspondiente a una clase particular es la suma de todas las frecuencias hasta e incluyendo esa clase. Una distribución de frecuencias acumuladas muestra la frecuencia acumulada de cada categoría. Una distribución de frecuencias relativas acumuladas muestra el porciento acumulado de observaciones menores o iguales a la categoría. 2-10 1.1-10
Distribución de frecuencias acumuladas Ejemplo: La siguiente tabla muestra la distribución de frecuencia absoluta del número de autos vendidos en cierta compañía de autos. Determine la distribución de frecuencias acumuladas y la distribución de frecuencias relativas acumuladas. 2-11 1.1-11
Gráficas para data categórica o cuantitativa discreta Las gráficas nos permiten resumir la data y nos ayudan a entender lo que la data dice, en general, acerca de los individuos en el estudio. Las gráficas para data categórica o cuantitativa discreta se construyen colocando cada categoría de data en uno de los ejes (normalmente el eje horizontal) y la frecuencia absoluta o la frecuencia relativa de cada categoría en el otro eje. 1.1-12
Construcción de una gráfica de barra de frecuencia Usaremos data sobre colores de los M&M para construir una gráfica de barra de frecuencia absoluta y relativa Cantidad de M&M dulces Azul 5 Marrón 12 Rojo 9 Anaranjado 6 Amarillo 10 Verde 3 Tabla 1: Distribución de colores en una bolsa de M&M s de 12 oz. Azul M&M Marrón Rojo Anaranjado Amarillo Verde Frecuencias absolutas Frecuencias relativas 1.1-13
Frecuencia Absoluta Gráfica de barra de frecuencia relativa (creada en Excel) Color de M&M Frecuencia absoluta Azul 5 Marron 12 Rojo 9 Anaranjado 6 Amarillo 10 Verde 3 14 12 10 8 6 4 2 Distribución de frecuencias para M&M's 0 Azul Marron Rojo Anaranjado Amarillo Verde Características: Las barras, que son del mismo ancho, se dibujan por cada categoría. La altura de cada barra representa la frecuencia o frecuencia relativa de la categoría. 1.1-14
Frecuencia relativa Gráfica de barra de frecuencia relativa (creada en Excel) Color de M&M Frecuencia absoluta Azul 5 Marron 12 Rojo 9 Anaranjado 6 Amarillo 10 Verde 3 0.3 0.25 0.2 0.15 0.1 0.05 Distribución de frecuencias relativas para M&M's 0 Azul Marron Rojo Anaranjado Amarillo Verde 1.1-15
Una gráfica circular es un círculo dividido en sectores. Cada sector representa una categoría de datos. El área de cada sector es proporcional a la frecuencia de la categoría. Ejemplo: Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital. Determine el % del círculo ocupado por cada categoría. TOTAL: 20 Gráfica circular Número de sectores en la gráfica circular: % del círculo que ocupa cada sector: Asalto: Caída: Herida de bala: Accidente de vehículo: 1.1-16
Gráfica circular (cont.) Número de sectores en la gráfica circular: Grados del círculo que ocupa cada sector: Asalto: 5% de 360 = Caída: 10% de 360= Herida de bala: 40% de 360= Accidente de vehículo: 35% de 360= A mano, utilizamos un transportador para medir cada ángulo y dibujarlo dentro del círculo. 1.1-17
Gráfica circular 1.1-18
Gráfica circular vs Gráfica de barra Las gráficas circulares sólo pueden crearse si todas las categorías de la variable bajo estudio están representados. Las gráficas circulares son útiles para mostrar la división de todos los valores posibles de una variable cualitativa en sus partes. Las gráficas circulares no son tan útiles en la comparación de dos valores específicos de la variable cualitativa. El énfasis está en la comparación de las partes con el todo. Utilice una gráfica de barras cuando se quiere comparar los diferentes valores de la variable entre si y no las partes con el todo. 1.1-19
Distribución de frecuencia para data cuantitativa discreta (muchos valores posibles) Características de esta data: discreta con muchos valores posibles Método para crear distribución de frecuencia: Agrupar por categorías o clases 1.1-20
Pasos para construir una distribución de frecuencias 1. Determinar el número de clases que se va a usar (debe ser entre 5 y 20). 2. Determinar el valor máximo y mínimo del conjunto. 3. Calcular el ancho de la clase (redondear hacia arriba). ancho de clase (valor máximo) (valor mínimo) número de clases 4. Elegir un punto de comienzo (el valor mínimo del conjunto de datos o un valor conveniente) Copyright 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved. 1.1-21
Ejemplo: Construir una distribución de frecuencia para el conjunto que contiene pulsos de 40 féminas SOLUCION: Usaremos 7 clases. Identificar el valor mínimo y máximo mínimo, máximo Determinar el ancho de las clases: ancho = valor máximo valor mínimo ancho = número de clases 60 60 60 64 64 64 64 68 68 68 68 68 72 72 72 72 72 72 72 72 76 76 76 76 76 76 80 80 80 80 80 80 88 88 88 88 88 96 104 124 Decidir punto de comienzo: 1.1-22
Ejemplo: (continuación) SOLUCION (continuación): 5. Usando el límite inferior de la primera clase, le sumas el ancho de clase para conseguir los límite inferiores de las demás clases. 60 60 60 64 64 64 64 68 68 68 68 68 72 72 72 72 72 72 72 72 76 76 76 76 76 76 80 80 80 80 80 80 88 88 88 88 88 96 104 124 1.1-23
Ejemplo: (continuación) SOLUCION (continuación): 6. Determinar los límites superiores de las clases. 7. Determinar las frecuencias de cada clase 60 60 60 64 64 64 64 68 68 68 68 68 72 72 72 72 72 72 72 72 76 76 76 76 76 76 80 80 80 80 80 80 88 88 88 88 88 96 104 124 1.1-24
Ejemplo 2 : Construir una distribución de frecuencia absoluta de datos discretos (muchos valores posibles) valor mínimo y valor máximo? 672 y 738 Usemos como límite inferior de la primera clase 670 Usemos como ancho de la clase: 10 Las clases y frecuencias: Clases Frecuencia Los datos dados representan el tiempo entre erupciones (en segundos) de una muestra aleatoria de 45 erupciones del géiser Old Faithful 1.1-25
Ejemplo: Construir una tabla de frecuencias relativas para los datos del géiser Old Faithful Tiempo entre Frecuencia Frecuencia erupciones absoluta relativa 670 679 680 689 690 699 700 709 710 719 720 729 730 739 1.1-26