Capítulo 3 2 Organizar y resumir datos 2010 Pearson Prentice Hall. All rights reserved
Pasos para la obtención de los datos: 1. Definir los objetivos de la investigación o experimento. Ejemplos: a. Estimar el ingreso promedio de la familia puertorriqueña. b. Comparar la eficacia de dos métodos de enseñanzas. 2. Definir la variable y la población. Ejemplos: a. El ingreso total en el hogar de la familia puertorriqueña. (variable) b. Todos los hogares puertorriqueños. (población)
Pasos para la obtención de los datos: (cont.) 3. Definir los esquemas para recolectar y medir los datos. Se define el tamaño de la muestra y el instrumento a utilizar, que puede incluir cuestionarios, entrevistas telefónicas, etc. 4. Determinar las técnicas para analizar los datos. Se debe describir el grupo observado (estadística descriptiva) o estimar algún parámetro de la población (estadística inferencial).
Algunos métodos para recolectar datos: 1. Experimento El investigador diseña el experimento específicamente para obtener los datos necesarios para estudiar el efecto de un tratamiento sobre la variable de interés. EJEMPLO Deseamos saber si el uso de las calculadoras gráficas mejora el aprendizaje de las destrezas de álgebra. Diseño del experimento: Observación Tratamiento Observación Preprueba Enseñar el curso usando la calculadora Postprueba
Algunos métodos para recolectar datos: 1. Experimento (cont.) Otros factores que pueden haber afectado los resultados: la selección de alumnos sobresalientes la habilidad de enseñar del profesor Para descartar esto es necesario: seleccionar aleatoriamente la muestra usar un grupo control
Algunos métodos para recolectar datos: 2. La Encuesta - Los datos son obtenidos mediante muestreo de una parte de la población de interés. El investigador no modifica el entorno. - Cuando se observa cada elemento de la población, entonces es llamado un censo. Selección de los elementos de la muestra: Muestreo aleatorio simple Muestreo estratificada Muestreo sistemático
Cuando se obtienen datos de una encuesta o un experimento, éstos se deben organizar en una forma manejable. Formas de Organizar Datos Tablas Gráficas Resumen numérico (Cap. 3) 2010 Pearson Prentice Hall. All rights reserved 2-7
Tablas Una tabla de frecuencias o distribución de frecuencias agrupa datos en categorías o clases que son mutuamente excluyentes e indica el número de observaciones en cada categoría. 2010 Pearson Prentice Hall. All rights reserved 2-8
EJEMPLO La organización de los datos cualitativos en una tabla de frecuencias Un fisioterapeuta quiere tener una idea de los tipos de rehabilitación requeridos por sus pacientes. Obtiene una muestra aleatoria simple de 30 de sus pacientes. Cadera Cadera Codo Cuello Espalda Espalda Espalda Espalda Espalda Espalda Espalda Espalda Espalda Espalda Espalda Espalda Hombro Hombro Hombro Hombro Ingle Mano Mano Muñeca Muñeca Rodilla Rodilla Rodilla Rodilla Rodilla Parte del cuerpo Frecuencia Cadera 2 Codo 1 Cuello 1 Espalda 12 Hombro 4 Ingle 1 Mano 2 Muñeca 2 Rodilla 5 2-9
La tabla anterior muestra frecuencias absolutas (número de observaciones incluidas en cada categoría o clase). La frecuencia relativa es la proporción (o porcentaje) de observaciones dentro de una categoría. Se encuentra usando la fórmula: frecuencia relativa = frecuencia absoluta total de observaciones Una distribución de frecuencias relativas muestra la frecuencia relativa de cada categoría. 2010 Pearson Prentice Hall. All rights reserved 2-10
EJEMPLO La organización de data cualitativa en una distribución de frecuencias relativas Utilice la distribución de frecuencias absolutas para construir una distribución de frecuencias relativas. 12 45 0.2667 2010 Pearson Prentice Hall. All rights reserved 2-11
Gráficas Una gráfica de barra se construye colocando cada categoría de datos en uno de los ejes y la frecuencia absoluta o la frecuencia relativa de cada categoría en el otro eje. Muestra la cantidad de datos que pertenecen a cada categoría como áreas rectangulares de tamaño proporcional. 2010 Pearson Prentice Hall. All rights reserved 2-12
EJEMPLO Construir una gráfica de barra de la frecuencia absoluta o la frecuencia relativa Usaremos data sobre colores de los M&M para construir la gráfica de frecuencia absoluta en EXCEL 2010 2-13
2-14
Frecuencia relativa Gráfica de barra de frecuencia relativa 0.3 Colores de M&M 0.25 0.2 0.15 0.1 0.05 0 Marrón Amarillo Rojo Anaranjado Azul Verde Color 2-15
Diagrama de pareto Un diagrama de pareto es una gráfica de barra donde las categorías se dibujan en orden de frecuencia o frecuencia relativa decreciente. Puede ser: una gráfica hecha a base de rectas que muestran los porcentajes acumulados una gráfica de barras que representan la cantidad de datos en cada categoría. Es usada con frecuencia en aplicaciones de control de calidad. 2010 Pearson Prentice Hall. All rights reserved 2-16
Frecuencia relativa Diagrama Pareto 0.3 Colores de M&M 0.25 0.2 0.15 0.1 0.05 0 Marrón Amarillo Rojo Anaranjado Verde Azul Color 2010 Pearson Prentice Hall. All rights reserved 2-17
Gráfica circular Una gráfica circular es un círculo dividido en sectores. Cada sector representa una categoría de datos. El área de cada sector es proporcional a la frecuencia de la categoría. 2010 Pearson Prentice Hall. All rights reserved 2-18
EJEMPLO Construir una gráfica circular Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital. Admisiones al hospital Frecuencia Asalto 1 Cancer 1 Fallo cardiaco 1 Caída 2 Herida de bala 8 Accidente de vehículo de motor 7 La gráfica circular tendrá seis partes o sectores, que corresponden a las seis categorías de los datos. El área de cada sector es proporcional a la frecuencia de cada categoría. Por ejemplo, 1 20 = 0.05 = 5% La categoría Asalto" constituirá 5% del área de la gráfica circular. t2-19
EJEMPLO Construir una gráfica circular (cont.) Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital. Admisiones al hospital Frecuencia Asalto 1 Cancer 1 Fallo cardiaco 1 Caída 2 Herida de bala 8 Accidente de vehículo de motor 7 Tamaño del sector Como un círculo tiene 360 grados, la medida en grados de ese sector será: (0.05)(360) = 18 A mano, utilizamos un transportador para medir cada ángulo. 18 18 18 36 144 126 t2-20
EJEMPLO Construir una gráfica circular (cont.) Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital. Admisiones al hospital Frecuencia Asalto 1 Cancer 1 Fallo cardiaco 1 Caída 2 Herida de bala 8 Accidente de vehículo de motor 7 Accidente de vehículo de motor 35% Frecuencia de Admisiones al Hospital Asalto 5% Cancer 5% Fallo cardiaco 5% Caída 10% Herida de bala 40% t2-21
Gráfica circular vs gráfica de barra Las gráficas circulares sólo pueden crearse si todas las categorías de la variable bajo estudio están representados. Las gráficas circulares son útiles para mostrar la división de todos los valores posibles de una variable cualitativa en sus partes. Las gráficas circulares no son tan útiles en la comparación de dos valores específicos de la variable cualitativa. El énfasis está en la comparación de las partes con el todo. Utilice una gráfica de barras cuando se quiere comparar los diferentes valores de la variable entre si y no las partes con el todo. 2010 Pearson Prentice Hall. All rights reserved 2-22
Resumir datos cuantitativos Si los datos son discretos y hay relativamente pocos valores diferentes de la variable, las categorías de datos serán las observaciones. EJEMPLO: Cierta universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus alumnos, para lo cual aplicó un examen de C.I. a un grupo de 20 alumnos escogidos al azar, obteniendo los siguientes resultados: 106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124 categorías o clases Dato Frecuencia 106 3 109 5 112 7 119 2 124 3 2-23
Resumir datos cuantitativos (cont.) Si los datos son discretos, pero hay muchos valores diferentes de la variable, o si los datos son continuos, las clases deben ser creados usando intervalos de números. EJEMPLO: categorías o clases En la Tabla 10, los datos representan el número de residentes de Estados Unidos entre las edades de 25 y 74 años que tienen un grado de bachiller. En la tabla, los datos se clasifican o se agrupan, por intervalos de números. 2-24
Resumir datos cuantitativos (cont.) El límite inferior de una clase es el valor más pequeño dentro de la clase El límite superior es el valor más grande dentro de la clase. El ancho de la clase es la diferencia entre dos límites inferiores consecutivas. El ancho de clase para los datos de la Tabla 10 es 35 25 =10 Tenga en cuenta que las clases no se sobreponen. categorías o clases 2-25
Resumir datos cuantitativos (cont.) Directrices para determinar el límite inferior de la primera clase y el ancho de clase Decidir el límite inferior de la primera clase Elija la observación más pequeña del conjunto de datos o un número conveniente ligeramente más bajo que la observación más pequeña del conjunto de datos. Decidir el número de clases. En general, debería haber entre 5 y 20 clases. valor mayor valor menor Ancho de Clase = número de clases Se redondea hacia arriba. 2-26
EJEMPLO: Resumir datos cuantitativos Los siguientes datos representan el precio promedio la electricidad (centavos / kwh) en 2006 para el 50 estados más el Distrito de Columbia. Construya una distribución de frecuencias. límite inferior de la 1ra clase? 4.92 4.5 número de clases? 5 ancho de las clases? valor mayor valor menor número de clases 20.72 4.92 5 las clases? 3.5 4.5 7.99 8-11.49 11.5 14.99 15 18.49 18.5 22 2-27
EJEMPLO: Resumir datos cuantitativos (cont.) Los siguientes datos representan el precio promedio la electricidad (centavos / kwh) en 2006 para el 50 estados más el Distrito de Columbia. Construya una distribución de frecuencias. Clases Cuenta Frecuencia 4.5 7.99 111111111 111111111 111111111 27 8-11.49 111111111 1111 13 11.5 14.99 1111111 7 15 18.49 11 2 18.5 22 1 1 2-28
Histogramas Un histograma se construye dibujando, para cada clase, rectángulos cuya altura es la frecuencia o frecuencia relativa de la clase. El ancho de cada rectángulo debe ser el mismo y los rectángulos deben tocarse. 2010 Pearson Prentice Hall. All rights reserved 2-29
EJEMPLO Histograma para datos discretos Dibuje un histograma de frecuencia absoluto y otro de frecuencia relativa para cantidad de autos por hogar 2010 Pearson Prentice Hall. All rights reserved 2-30
2010 Pearson Prentice Hall. All rights reserved 2-31
2010 Pearson Prentice Hall. All rights reserved 2-32
EJEMPLO Distribución de frecuencia absoluta y relativa para datos continuos Los siguientes datos representan el tiempo entre las erupciones (en segundos) de una muestra aleatoria de 45 erupciones en el Géiser Old Faithful en California. Construir una distribución de frecuencia absoluta y relativa de los datos. Source: Ladonna Hansen, Park Curator 2010 Pearson Prentice Hall. All rights reserved 2-33
EJEMPLO Distribución de frecuencia absoluta y relativa para datos continuos (cont.) El valor mínimo es 672 y el valor máximo es 738. Escogemos como límite inferior de la primera clase 670 Usaremos el ancho de la clase es 10 Las clases son: 670-679 680-689 690-699 700-709 710-719 720-729 730-739 2010 Pearson Prentice Hall. All rights reserved 2-34
2010 Pearson Prentice Hall. All rights reserved 2-35
EJEMPLO Construir un histograma para frecuencia aboluta y relativa para datos continuos Ancho de clase = 10: 2010 Pearson Prentice Hall. All rights reserved 2-36
2010 Pearson Prentice Hall. All rights reserved 2-37
Usando ancho de clase 5: 2010 Pearson Prentice Hall. All rights reserved 2-38
Ideas importantes sobre distribuciones de frecuencias El objetivo en la construcción de una distribución de frecuencias es para revelar características interesantes de los datos. No hay una distribución de la frecuencia correcta para un determinado conjunto de datos. Sin embargo, algunas distribuciones de frecuencias probablemente ilustran mejor patrones que existen dentro de los datos. Fórmula de Sturge para el número de clases nos puede guiar en la elección de clases: número de clases = 1 + 3.3 log n, donde n es el número de observaciones. 3 Fórmula de Rice: número de clases = 2 n, n es el número de observaciones. 2-39
Gráfica de tallo y hoja Usado para resumir datos Combina técnicas para graficar y clasificar Cada dato numérico se divide en dos partes: los dígitos principales corresponden al tallo y los dígitos posteriores se convierten en las hojas. Por ejemplo, para el dato 147, el 7 es la hoja y 14 forma el tallo. 2010 Pearson Prentice Hall. All rights reserved 2-40
EJEMPLO Construir una gráfica de tallo y hoja Un individuo es considerado como desempleado si no tienen empleo, pero está buscando empleo activamente. Los siguientes datos representan la tasa de desempleo en cada uno de los cincuenta estados de Estados Unidos incluyendo el Distrito de Columbia, para junio de 2008. 2010 Pearson Prentice Hall. All rights reserved 2-41
2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Construir una gráfica de tallo y hoja (cont.) La porción entera de cada dato será el tallo y la parte decimal será la hoja. Por ejemplo, el tallo de Alabama será 4 y la hoja será de 7. La gráfica queda inicialmente como se muestra: 2 8 3 888392922 4 782030104706 5 0145783237335253 6 89483940625 7 5 8 5 Luego de ordenar las hojas tenemos: 2 8 3 222388899 4 000012346778 5 0122333334555778 6 02344568899 7 5 8 5 2010 Pearson Prentice Hall. All rights reserved 2-43
Pasos para construir la gráfica de tallo y hoja Paso 1: El tallo de un valor consistirá de los dígitos a la izquierda del dígito de más a la derecha. La hoja de un valor será el dígito de más a la derecha. Paso 2: Escriba los tallos en una columna vertical de forma creciente. Dibuje un línea vertical a la derecha de los tallos. Paso 3: Escribe cada hoja correspondiente a los tallos a la derecha de la línea vertical. Paso 4: Dentro de cada tallo, reorganizar las hojas en orden ascendente, elige un título, y construya una leyenda que indique lo que representan los valores. 2010 Pearson Prentice Hall. All rights reserved 2-44
A veces, por la cantidad de datos que hay en un intervalo, se necesita partir el tallo : Este tallo representa 3.0 3.4 Este tallo representa 3.5 3.9 2 8 3 2223 3 88899 4 00001234 4 6778 5 0122333334 5 555778 6 02344 6 568899 7 7 5 8 8 5 2010 Pearson Prentice Hall. All rights reserved 2-45
Tallo y hoja versus Histogramas Una vez que se crea una distribución de frecuencias o histograma de datos continuos, los datos crudos se pierden (a menos que se reportan con la distribución de frecuencias). Sin embargo, los datos crudos pueden ser recuperados desde el diagrama de tallo y hojas. El diagrama de tallo y hojas se parece mucho a un histograma virado de lado. El tallo es la clase. Las hojas representan la frecuencia de la clase. La gráfica de tallo y hoja pierden su utilidad cuando los conjuntos de datos son grandes o cuando la amplitud de campo del conjunto (rango) es grande. 2010 Pearson Prentice Hall. All rights reserved 2-46