UNIDAD III DESCRIPCIÓN DE UN CONJUNTO DE DATOS 1. Medidas de resume descriptivas Para describir u cojuto de datos utilizamos ua serie de medidas, de igual forma que para describir a u persoa podemos utilizar su altura, peso, color de ojos, tipo de pelo, Las medidas de resume se llama estadísticos si se calcula a partir de ua muestra, y se deomia parámetros si se calcula a partir de todos los elemetos del uiverso, toda la població. E estadística descriptiva se utiliza tres tipos de medidas para describir a u cojuto de datos, que so: Medidas de tedecia cetral o posició, os idica como es el cojuto co u solo dato. Medidas de dispersió, os idica como varia el cojuto de datos respecto al valor de tedecia cetral, es decir como está desperdigados o disemiados los datos respecto al valor de tedecia cetral. Medidas de forma, os idica la forma que tiee la represetació gráfica de los datos. 2. Medidas de tedecia cetral. Estas medidas, estadísticos, pretede resumir las características del cojuto de datos e u solo valor. Los estadísticos más utilizados so: Promedio o media aritmética Mediaa Moda Cuartíles Percetíles. 2.1.- Moda La moda es el primer estadístico que se utiliza, y quizás el más ituitivo. La moda es el valor más frecuete del cojuto de datos, es decir, el dato que más veces se repite e el cojuto. Por tato tiee el mismo sigificado que socialmete. Lo que está de moda es lo que más persoas cosume o utiliza. E el caso que o se repita igú valor, o que varios valores se repita el mismo úmero de veces o existe moda e ese cojuto de datos. Ricardo López Pág. 1
Para calcular la moda es suficiete co observar los datos si el cojuto es pequeño, y cotar la frecuecia (úmero de veces que aparece) de cada valor e el caso que el cojuto tega muchos datos. 2.2.- Mediaa La mediaa es el valor que se ecuetra e el cetro de los datos, es decir, el que está e el medio, por supuesto co los datos ordeados. Para ecotrar la mediaa se ha de cosiderar todos los datos, o solamete los valores, es decir, si dos datos tiee el mismo valor se cotabiliza por separado y o se cosidera como uo solo. La mediaa idica que la mitad de los datos so más pequeños o iguales a ella, y la otra mitad mayores o iguales. Para ecotrar la mediaa se realiza el siguiete procedimieto: 1. Se ordea los datos 2. Se cueta el úmero total de datos 3. La posició de la mediaa es: úmero de datos a. o u úmero par de datos: = 2 2 + 1 úmero de datos más uo b. co u úmero impar de datos: = 2 2 4. La mediaa es el dato que esté e esa posició de la lista ordeada 2.3.- Promedio o media aritmética Es el valor cetral del cojuto de datos teiedo e cueta el valor de cada uo de los datos. Se calcula sumado todos los datos y dividiedo etre el úmero de datos que tiee el cojuto. Σ sigifica sumatoria, es decir, que se suma lo que se escribe a x cotiuació i x = 1 i idica la umeració de los datos, es decir, el primer dato es x 1, el segudo x 2, el tercero x 3, idica el úmero de total de datos, la catidad de datos x es el promedio de los datos deomiados x. 2.4.- Cuartíles Los cuartíles so los estadísticos que divide el cojuto de datos ordeado e cuatro partes, es decir, divide el cojuto e cuartas partes. El primer cuartil es el dato que está e la posició que es la cuarta parte del úmero de datos. El primer cuartil os idica que la cuarta parte, el 25%, de los datos so más pequeños o iguales a él. El segudo cuartil es el dato que está e la mitad de los datos ordeados, coicide co la mediaa. Ricardo López Pág. 2
El tercer cuartil es el dato que está e la posició que es la tercera parte del úmero total de datos, el 75%. Idica que la tercera parte (el 75%) de los datos so más pequeños o iguales a él, y por tato ua cuarta parte (el 25%) de los datos so mayores o iguales a él. El cuarto cuartil es el dato mayor de todo el cojuto. Por tato o es u estadístico que se utilice realmete. 2.4.- Percetíles Los percetíles tiee el mismo sigificado que los cuartíles, es decir, dividir el cojuto de datos e grupos. Pero e este caso e lugar de dividir el cojuto de datos e cuartos se divide e determiado porcetaje. Los percetíles so cualquier porcetaje que se preteda establecer, por ejemplo el 10%, 20%, 23%, 80%, El percetil 10 idica el 10%, es decir que el 10% de los datos so meores o iguales al valor que represeta el percetil 10. Alguos percetíles co ombre propio: El percetil 25, es el primer cuartil El percetil 50, es la mediaa El percetil 75, es el tercer cuartil. Ejemplo: Cosidere el siguiete cojuto de datos que represeta los salarios e dólares de u cojuto de 20 persoas. NOMBRE SALARIO NOMBRE SALARIO Federico US$ 100.00 Torcuato US$ 150.00 Segismudo US$ 180.00 Tiburcio US$ 250.00 Feliciao US$ 150.00 Sacho US$ 200.00 Fulgecio US$ 250.00 Mortadelo US$ 240.00 Filemó US$ 230.00 Ambrosio US$ 300.00 Simoa US$ 500.00 Soledad US$ 250.00 Filomea US$ 200.00 Pacracio US$ 190.00 Esperaza US$ 450.00 Egracia US$ 360.00 Eriqueta US$ 280.00 Victoriao US$ 550.00 Epifaía US$ 440.00 Sorretio US$ 390.00 El primer paso es ordear los datos e forma ascedete, es decir del más pequeño al más grade. Federico US$ 100.00 Torcuato US$ 150.00 Feliciao US$ 150.00 Segismudo US$ 180.00 Pacracio US$ 190.00 Sacho US$ 200.00 Filomea US$ 200.00 Filemó US$ 230.00 Mortadela US$ 240.00 Tiburcio US$ 250.00 Fulgecio US$ 250.00 Soledad US$ 250.00 Eriqueta US$ 280.00 Ambrosio US$ 300.00 Egracia US$ 360.00 Sorretio US$ 390.00 Epifaía US$ 440.00 Esperaza US$ 450.00 Simoa US$ 500.00 Victoriao US$ 550.00 Ricardo López Pág. 3
1) Moda. La moda es el valor que más veces se repita, e este caso el salario que sea más frecuete. La moda es US$ 250.00 porque se repite tres veces. 2) Mediaa. La mediaa es el valor que está e el cetro de los datos ordeados. Debido a que hay u úmero par de datos (20) se ha de sumar uo, y dividir etre dos. + 1 20 + 1 21 = = = 10.5 2 2 2 La mediaa es el dato úmero 10.5, es decir el dato etre el 10 y el 11, para calcularlo sumamos los datos 10 y 11 y lo dividimos etre dos. Como los datos 10 y 11 so 250, la mediaa es US$ 250.00 La mitad cobra 250 o meos E esta caso coicide co la moda pero eso o siempre sucede. 3) Promedio x = x 100 + 150 + 150 + 180 + 190 + 200 + 200 + 230 + 240 + 250 + 250 + 250 + 280 + 300 + 360 + 390 + 440 + 450 + 500 = 20 i 1 + xi 1 x = = 283.00 el promedio es US$ 283.00, pese a que o es iguo de los datos. 4) Cuartíles: 20 Primer cuartil = = 5 es el dato úmero cico US$ 190.00 4 4 La cuarta parte, uo de cada cuatro, cobra 190 o meos 20 Tercer cuartil 3 = 3 = 15 es el dato úmero cico US$ 360.00 4 4 Solo ua cuarta parte, uo de cada cuatro, cobra más de 360 5) Percetíles: 10 10 Percetil 10: el 10% de 20 es 2, = 20 = 2, es US$ 150.00 El 10%, uo de cada diez, cobra 150 o meos. 20 20 Percetil 20: el 20% de 20 es 4, = 20 = 4, es US$ 180.00 El 20%, uo de cada cico, cobra 180 o meos 60 60 Percetil 60: el 60% de 20 es 12, = 20 = 12 es US$ 250.00 80 80 Percetil 80: el 80% de 20 es 16, = 20 = 16 es US$ 390.00 El 80%, cuatro de cada cico, cobra 390 o meos 550 Ricardo López Pág. 4
TAREAS Calcule e los siguietes estadísticos e cada uo de los cojutos de datos: a. Moda b. Mediaa c. Promedio d. Primer cuartil e. Tercer cuartil f. Percetil 10 g. Percetil 20 h. Percetil 30 i. Percetil 40 j. Percetil 50 k. Percetil 60 l. Percetil 70 m. Percetil 75. Percetil 80 o. Percetil 90 NOMBRE NOTA Federico 80 Torcuato 60 Feliciao 55 Segismudo 40 Pacracio 85 Sacho 76 Filomea 88 Filemó 80 Mortadelo 61 Tiburcio 59 Fulgecio 90 Soledad 97 Eriqueta 76 Ambrosio 89 Egracia 55 Sorretio 23 Epifaía 99 Esperaza 100 Simoa 66 NOMBRE EDAD Federico 12 Torcuato 17 Feliciao 23 Segismudo 35 Pacracio 42 Sacho 17 Filomea 18 Filemó 23 Mortadelo 25 Tiburcio 39 Fulgecio 65 Soledad 32 Eriqueta 21 Ambrosio 19 Egracia 20 NOMBRE Federico Torcuato Feliciao Segismudo Pacracio Sacho Filomea Filemó Mortadelo Tiburcio Fulgecio Soledad Eriqueta Ambrosio ALTURA 1.56 m 1.86 m 1.67 m 1.82 m 1.84 m 1.75 m 1.59 m 1.48 m 1.58 m 1.91 m 1.65 m 1.63 m 1.87 m 1.61 m Ricardo López Pág. 5