ORGANIZACIÓN DE LOS DATOS. La toma de datos es ua de las partes de mayor importacia e el desarrollo de ua ivestigació. Así los datos obteidos mediate u primer proceso recibe el ombre de datos si tratar o e bruto. Los datos e bruto so largas listas de úmeros que o so de gra utilidad y o brida al ivestigador la iformació que requiere si ates o se trata. Los datos si tratar se les debe sitetizar o resumir de maera que sea posible iterpretarlos, etederlos y utilizarlos. La maera de orgaizar los datos es mediate tablas de distribució de frecuecias. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS. E estadística existe ivestigacioes relacioadas co los precios de los productos de la dieta diaria, la estatura y el peso de u grupo de idividuos, los salarios de los empleados, los grados de temperatura del medio ambiete, las calificacioes de los estudiates, etc., que puede adquirir diferetes valores gracias a ua uidad apropiada, que recibe el ombre de variable. La represetació umérica de las variables se deomia dato estadístico. Las tablas de distribució de frecuecia es ua disposició tabular de datos estadísticos, ordeados ascedete o descedetemete, co la frecuecia (fi) de cada dato. Las distribucioes de frecuecias puede ser para datos o agrupados y para datos agrupados o de itervalos de clase. TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS. Es aquella distribució que idica las frecuecias co que aparece los datos estadísticos, desde el meor de ellos hasta el mayor de ese cojuto si que se haya hecho igua modificació al tamaño de las uidades origiales. E estas distribucioes los valores de cada variable ha sido solamete reagrupados, siguiedo u orde lógico co sus respectivas frecuecias. La distribució de frecuecias o agrupadas o tabla co datos o agrupados se emplea si las variables toma u úmero pequeño de valores o la variable es discreta (siempre se asocia co valores eteros). Tipos de frecuecias. Frecuecia absoluta (fi). La frecuecia absoluta es el úmero de veces que aparece u determiado valor e u estudio estadístico. La suma de las frecuecias absolutas es igual al úmero total de datos, que se represeta por N. fi1 + fi 2 + fi 3...fi = N
Frecuecia relativa (fri). La frecuecia relativa es el cociete etre la frecuecia absoluta de u determiado valor y el úmero total de datos. Se puede expresar e tatos por cieto y se represeta por fri. fi fri = La suma de las frecuecias relativas es igual a 1. N Frecuecia acumulada (fai). La frecuecia acumulada es la suma de las frecuecias absolutas de todos los valores iferiores o iguales al valor cosiderado. Frecuecia relativa acumulada (frai). La frecuecia relativa acumulada es el cociete etre la frecuecia acumulada de u determiado valor y el úmero total de datos. Se puede expresar e tatos por cieto fai frai = N Ejemplo resuelto. Los siguietes datos correspode al úmero de libros leídos por u grupo de alumos, e u lapso de 2 años. Elaborar la tabla de distribució de frecuecias. 3 2 1 4 5 3 2 1 3 1 2 3 5 1 2 2 1 3 4 2 3 4 0 1 2 2 0 1 2 3
E la primera columa de la tabla colocamos la variable ordeada de meor a mayor, e la seguda hacemos el recueto y e la tercera aotamos la frecuecia absoluta. N de libros leídos. Frecueci a fi Frecuecia relativa fri Frecuecia acumulada fai Frecuecia relativa acumulada frai 0 2 2 = 0. 066 2 = 0. 066 1 7 7 = 0. 23 9 = 0. 3 2 9 9 = 0. 3 9+9=18 18 = 0. 66 3 7 7 = 0. 23 18+7=25 25 = 0. 83 4 3 3 = 0. 1 25+3=28 28 = 0. 93 5 2 2 = 0. 066 28+2= = 1 Total 1 Nota. Los valores de la frecuecia relativa y la frecuecia relativa acumulada al multiplicarse por 100%, os daría el porcetaje que represeta la variable que se aaliza. Qué porcetaje de alumos leyero 5 libros? 0.066x100%= 6.6% Qué porcetaje de alumos leyero meos de 4 libros? 0.83x100%= 83%
TABLA DE DISTRIBUCIÓN DE FRECUENCIA DE CLASE O DE DATOS AGRUPADOS. Es aquella distribució e la que la disposició tabular de los datos estadísticos se ecuetra ordeada e clases y co la frecuecia de cada clase; es decir, los datos origiales de varios valores adyacetes del cojuto se combia para formar u itervalo de clase. No existe ormas establecidas para determiar cuádo es apropiado utilizar datos agrupados o datos o agrupados; si embargo, se sugiere que cuado el úmero total de datos (N) es igual o superior 50 y además el rago o recorrido de la serie de datos es mayor de 20, etoces, se utilizará la distribució de frecuecia para datos agrupados, tambié se utilizará este tipo de distribució cuado se requiera elaborar gráficos lieales como el histograma, el polígoo de frecuecia o la ojiva. La distribució de frecuecias agrupadas o tabla co datos agrupados se emplea si las variables toma u úmero grade de valores o la variable es cotiua (se le puede asociar co u úmeros racioales e irracioales). La orgaizació de los datos geeralmete implica el arreglo de las observacioes e clases. Al arreglo de los datos para expresar la frecuecia de ocurrecia de las observacioes e cada ua de estas clases se cooce como distribució de frecuecias. La costrucció de ua tabla de distribució de frecuecias requiere e primer lugar de la selecció de los itervalos de clase. Au cuado la selecció de los itervalos de clase es u arte y depede de los datos ivolucrados, los siguietes pasos resultara útiles: Paso 1. Ordear los datos de meor a mayor para su clasificació. Paso 2. Calcular el rago (R) de los datos, es decir, la logitud del itervalo (I) que los cotiee: R = Xmáx Xmi I=[ Xmi, Xmáx] R=Rago. Xmáx= Dato de mayor valor umérico. Xmi=Dato de meor valor umérico. I= Itervalo umérico.
Paso 3. Defiir el úmero de clases (Nc), el cual o deberá ser ta pequeño (meos de 6) o ta grade (más de 20) que la verdadera aturaleza de la distribució sea imposible visualizar. A cotiuació se debe elegir u úmero específico de clases o categorías e las que se debe clasificar los datos, la elecció del úmero de clases o categorías es de maera arbitraria, si embargo deberá elegirse u úmero suficiete de clases de modo que los datos o quede amotoados, pero tampoco se elije demasiados puesto que las tablas de distribució de frecuecias sería difícil de maejar. Existe dos métodos para determiar el úmero de clases, los cuales so los más utilizados: 1er. Método. Método de la raíz, el cual cosiste e extraer la raíz cuadrada del tamaño de la muestra y redodear el resultado así obteido al etero mayor. Nc = Nc=Número de clases. = Tamaño de la muestra. 2do. Método. Método de Sturges. Este método puede daros ua aproximació razoable para determiar el úmero de clases; éste se obtiee co el siguiete modelo matemático. Nc= 1+ 3.3 (log) Nc= Número de clases. Log= Logaritmo de base 10. = Tamaño de la muestra.
Paso 4. El siguiete paso cosiste e determiar la Amplitud de clase (Ac), es coveiete que el tamaño de las clases sea u úmero etero, por tato es ecesario redodear el cociete al etero más cercao. Ac = R Nc Ac= Amplitud de clase. R=Rago. Nc = Número de clases. Paso 5. A cotiuació clasifiquemos los datos e cada ua de las clases defiiedo el límite iferior (Li) y el límite superior (Ls) de cada clase. E el caso e que se llegue a presetar u exceso o faltate co respecto al dato de mayor valor umérico (Xmáx) se deberá repartir el exceso o faltate de la maera más equitativa posible etre los extremos del itervalo. Paso 6. Defiir los límites reales de clase de acuerdo a la siguiete forma: Límite real iferior (Lri)= Li - 0.5 Limite real superior (Lrs)= Ls + 0.5 Paso 7. Defiir las frecuecias de cada clase (fi), los cuales so el úmero de datos que queda icluidos e cada itervalo de clase.
Paso 8. Defiir las frecuecias relativas de cada clase (fri), éstas so porcetajes de los datos que hay e cada itervalo de clase co respecto al tamaño de la muestra, por lo que para obteerlas se divide la frecuecia de cada itervalo de clase etre el tamaño de la muestra. fi fri = fri=frecuecia relativa de la clase i. fi= Frecuecia de la clase i. =Tamaño de la muestra. Paso 9. Determiar la marca de clase (mi), es el puto medio de la amplitud de clase. Li + Ls mi = mi= marca de clase de la clase i. 2 Paso 10. Defiir la frecuecias acumuladas (fai), se puede obteer secillamete si se suma las frecuecias de los itervalos de clase precedetes. Paso 11. Defiir la frecuecia relativa acumulada (frai), Se obtiee dividiedo cada ua de las frecuecias acumuladas etre el tamaño de la muestra () fai frai = frai=frecuecia relativa acumulada de la clase i. fai= Frecuecia acumulada de la clase i. =Tamaño de la muestra.
Ejemplo resuelto 1. Los siguietes datos correspode al úmero de clietes que acudiero al CAFÉ INTERNET INN durate 40 días. 35 15 21 18 32 39 20 19 20 20 34 13 13 20 35 17 31 10 32 22 14 36 23 14 20 34 20 28 20 16 31 38 22 12 28 13 Para elaborar la tabla de distribució de frecuecia, seguir los siguietes pasos. Paso 1. Ordear de meor a mayor. 10 12 13 13 13 14 14 15 16 17 18 19 20 20 20 20 20 20 20 21 22 22 23 28 28 31 31 32 32 34 34 35 35 36 38 39. Paso2. Calcular el rago R= Xmáx Xmi R= 39 10 R= 29 Paso 3. Calcular el úmero de clases Nc= Nc= 40 Nc=6.32= 6 Paso 4. Calcular la amplitud de clase. Ac = Ac R Nc 29 = 6 = 4.8 = 5 Paso 5 al paso 11. Tabla de distribució de frecuecias Frecuecia marca de frecuecia frecuecia relativa Clase Límites de clase Límites reales de clase Frecuecia relativa clase acumulada acumulada N Li Ls Lri Lrs fi fri mi fai frai 1 10 14 9.5 14.5 7 0.175 12 7 0.175 2 15 19 14.5 19.5 5 0.125 17 12 0.3 3 20 24 19.5 24.5 11 0.275 22 23 0.575 4 25 29 24.5 29.5 2 0.05 27 25 0.625 5 34 29.5 34.5 10 0.25 32 35 0.875 6 35 39 34.5 39.5 5 0.125 37 40 1
Como llear la tabla. Para los límites de clase. Para la clase 1 Li=Xmi= 10 Ls=Xmi + (Ac-1) esto es porque el itervalo debe correspoder a la Ac. Ls= 10+4= 14 Para la clase 2 Li= Ls de la clase aterior más 1 Li= 14+1=15 Ls= Li de la clase 2 + (Ac-1) Ls= 15+4=19 Así sucesivamete para las clases posteriores. Para los límites reales de clase. Para la clase 1 Lri= Límite real iferior= Li 0.5 Lri=10-0.5=9.5 Lrs= Límite real superior= Ls + 0.5 Lrs=14+0.5=14.5 Así sucesivamete para las clases posteriores. Para la frecuecia de cada clase. fi= Número de datos que queda icluidos e cada itervalo de clase. Para la clase 1. Para saber cuátos datos queda icluidos e el itervalo I= [10,14], se deberá cotar e los datos ordeados, para esta primera clase fi= 7, que correspode a los datos 10, 12, 13, 13, 13, 14 y 14 Para la clase 2. Para saber cuátos datos queda icluidos e el itervalo I= [15,19], se deberá cotar e los datos ordeados, para esta primera clase fi= 5, que correspode a los datos 15, 16, 17, 18 y 19. Así sucesivamete para las clases posteriores. Para la frecuecia relativa. Para la clase 1. fi fri = 7 fri = = 0.175 40 Para la clase 2. fi fri = 5 fri = = 0.125 40 Así sucesivamete para las clases posteriores.
Para el cálculo de la marca de clase (mi). mi = Li + Ls 2 Para la clase 1 10 + 14 24 mi = = = 12 2 2 Para la clase 2. 15 + 19 34 mi = = = 17 2 2 Así sucesivamete para las clases posteriores. Para la frecuecia acumulada (fai). Se puede obteer secillamete si se suma las frecuecias de los itervalos de clase precedetes. Para la clase 1. Como o hay clases precedetes fai= la frecuecia de la clase 1. fai=7 Para la clase 2. Como ya es la seguda clase, sumamos la frecuecia de la clase 2 más la frecuecia de las clases precedetes. fai= 5+7=12 Para la clase 3. fai= 11+5+7=23 Así sucesivamete para las clases posteriores. Para la frecuecia relativa acumulada. fai frai = Para la clase 1. 7 frai = = 0.175 40 Para la clase 2. 12 frai = = 0.3 40 Así sucesivamete para las clases posteriores
Ejemplo resuelto 2. Los siguietes datos correspode al úmero de goles aotados e 40 partidos de futbol rápido e la liga local. 3 8 2 3 8 4 10 15 4 5 7 12 6 1 9 6 4 4 7 13 8 18 9 2 11 9 7 2 14 2 1 24 10 4 2 7 6 6 1 8 E base a estos datos se costruyo la siguiete tabla de distribució de frecuecia. Tabla de distribució de frecuecias Clase Límites de clase Límites reales de clase Frecuecia Frecuecia relativa marca de clase frecuecia acumulada frecuecia relativa acumulada N Li Ls Lri Lrs fi fri mi fai frai 1 1 4 0.5 4.5 15 0.375 2.5 15 0.375 2 5 8 4.5 8.5 13 0.325 6.5 28 0.7 3 9 12 8.5 12.5 7 0.175 10.5 35 0.875 4 13 16 12.5 16.5 3 0.075 14.5 38 0.95 5 17 20 16.5 20.5 1 0.025 18.5 39 0.975 6 21 24 20.5 24.5 1 0.025 22.5 40 1 40 E base a la tabla aterior cotestar lo siguiete: 1.- Cuál fue el meor úmero de goles que se aoto e la liga durate los 40 días? La respuesta a esto está e uestro meor dato, que es de 1gol aotado. 2- E cuátos partidos se aoto etre 1 y 8 goles? La respuesta es e 28 partidos, lo cual correspode a las frecuecias de clases 1y 2. 3.- Qué porcetaje de partidos se aoto etre 5 y 8 goles? La respuesta se ecuetra e la frecuecia relativa de la clase 2 y correspode a 0.325x100%= 32.5%
4.- Qué porcetaje de los partidos se aoto 12 goles o meos? La respuesta se ecuetra e la frecuecia relativa acumulada desde la clase 1 hasta la clase 3, esta es de 0.875x100%=87.5% 5.- Qué porcetaje de los partidos se aoto más de 12 goles? Solo e las clases 4, 5 y 6 se aotaro más de 12 goles, y el porcetaje se obtiee sumado las frecuecias relativas de dichas clases, siedo e 0.075+0.025+0.025=0.125x100%= 12.5% 6.- E la mayoría de los partidos etre cuátos goles se aotaro? La respuesta es etre 1y 4 goles que correspode a 15 partidos.