ESTADÍSTICA UIDIMESIOAL..- ITRODUCCIÓ A LA ESTADÍSTICA.- Objeto de la estadística La Estadística es el cojuto de métodos ecesarios para recoger, clasificar, represetar y resumir datos así como para iferir (extraer cosecuecias) a partir de ellos. Se divide e dos ramas pricipales: Estadística descriptiva. Su objetivo es examiar a todos los idividuos de u cojuto. Trata del recueto, ordeació y clasificació de los datos obteidos mediate observacioes. Se orgaiza los datos e tablas, se realiza gráficos y se obtiee parámetros estadísticos que caracteriza la distribució de la població estudiada. Estadística iferecial. Establece previsioes y coclusioes geerales sobre ua població a partir de los resultados obteidos de ua muestra de la misma..- Població y muestra Població es el cojuto formado por todos los elemetos que tiee ua determiada característica que vamos a estudiar. Idividuo es cada uo de los elemetos de ua població. Muestra es u subcojuto extraído de ua població, co objeto de reducir el campo de experiecias. Tamaño de la muestra es el úmero de elemetos de la muestra. Muestreo es el proceso mediate el cual se extrae ua muestra de la població. 3.- Caracteres Carácter o atributo estadístico es la propiedad que estudiamos e los idividuos de ua població. Por ejemplo el color de ojos o la edad de u grupo de persoas. Variable es el cojuto de los valores que puede tomar u carácter o atributo. So variables la edad y la talla de las persoas y tambié el color de sus ojos o su profesió. Atediedo al tipo de valores (cada posibilidad recibe el ombre de modalidad) que toma puede ser: Cualitativas: o uméricas. Cuatitativas: uméricas. Las variables uméricas puede ser: Discretas: Toma valores que se puede ordear. Etre cada dos valores o hay valores itermedios. Cotiuas: Puede tomar todos los valores posibles detro de u itervalo de la recta real. Las variables cualitativas puede ser: Ordiales: Las que tiee u orde implícito. omiales: Las que o tiee u orde implícito. Dicotómicas: Las que sólo preseta dos modalidades. EJEMPLOS ESTADÍSTICA UIDIMESIOAL
.- Deseamos coocer la estatura de todos los soldados que forma el ejército. Eucia la població, los idividuos y ua posible muestra. La població está formada por todos los soldados. Los idividuos so cada uo de los soldados. Ua muestra es el subcojuto de los soldados que se talla, que puede ser los primeros e alistarse e cada provicia..- E ua fabrica de bombillas se efectúa u cotrol de calidad sobre 00 uidades para averiguar cuátas so defectuosas. Eucia la població, los idividuos y la muestra. La població está formada por toas las bombillas fabricadas. Los idividuos so cada ua de bombillas fabricadas. La muestra está formada por las00 bombillas examiadas. 3.- Eucia dos caracteres cuatitativos. La talla de u idividuo de ua determiada població. El diámetro de ua pieza de precisió de u lote fabricado. 4.- Eucia dos caracteres cualitativos. La profesió de las persoas mayores de 0 años de Ceuta. El estado civil de los habitates de Ceuta. 5.- Eucia dos modalidades de ua variable estadística cualitativa. Si cosideramos la variable cualitativa profesió so modalidades: ecoomista. sociólogo. 6.- Eucia dos variables estadísticas discretas. So variables estadística discretas: úmeros de empleados de cada fábrica de la PYME. úmero de hijos de 0 familias. 7.- Eucia dos variables estadísticas cotiuas. So variables estadística cotiuas: Peso de las persoas de ua població. Temperaturas de ua ciudad e u determiado período de tiempo. 8.- Eucia dos variables estadísticas cualitativas omiales. ESTADÍSTICA UIDIMESIOAL
So variables estadísticas omiales. Color de los ojos. Sabor de u helado. 9.- Eucia dos variables estadísticas cualitativas dicotómicas. So variables estadísticas dicotómicas. El sexo de los idividuos de ua clase. Teer o o teléfoo móvil los idividuos de ua població. EJERCICIOS PROPUESTOS.- Eucia la població, los idividuos y la muestra del experimeto estadístico cosistete e hallar el peso de los alumos de u istituto si se sólo se pesa los delegados/as y subdelegados/as. Solució: Població so todos los alumos del istituto. Muestra es el cojuto de delegados/as y subdelegados/as. Idividuo es cada uo de los alumos..- Eucia la població, los idividuos y la muestra del experimeto estadístico cosistete e hallar la achura de los torillos de ua caja si sólo se mide 0 torillos. Solució: Població so los torillos de la caja. Muestra so los 0 torillos que se mide. Idividuo es cada torillo. 3.- Cosidera los siguietes caracteres: el peso de u idividuo, el sexo de u idividuo, la logitud de u torillo, el color de los ojos de ua persoa, el úmero de gajos de ua araja, la profesió de u idividuo. Cuáles de los ateriores caracteres so cuatitativos? Solució: Peso, la logitud de u torillo, el úmero de gajos de ua araja. 4.- Cosidera los siguietes caracteres: el peso de u idividuo, el sexo de u idividuo, la logitud de u torillo, el color de los ojos de ua persoa, el úmero de gajos de ua araja, la profesió de u idividuo. Cuáles de los ateriores caracteres so cualitativos? Solució: el sexo de u idividuo, el color de los ojos, la profesió de u idividuo. 5.- Cosidera las siguietes modalidades: cicueta kilos, mujer, doce cetímetros, azules, 3 gajos, profesor: a) Cuáles perteece a ua variable cuatitativa?, b) Cuáles perteece a ua variable cualitativa? Solució: a) cicueta kilos, doce cetímetros, 3 gajos; b) mujer, azules, profesor. 6.- Cosidera las siguietes variables: alumos de u istituto, talla de esos alumos, hijos de ua familia, peso de los ateriores alumos, espectadores de u partido de fútbol, temperaturas de ua ciudad: a) cuáles de las ateriores so cotiuas?, b) cuáles so discretas? Solució: a) talla, peso, temperatura; b) alumos, hijos, espectadores. 7.- Cosidera las siguietes variables: opiió sobre u partido político, color del pelo, trato recibido e u hotel, sabor de ua comida, calificació de u exame, olor de ua habitació: a) cuáles de las ateriores so ordiales?, b) cuáles so cardiales? Solució: a) partido, trato recibido, calificació; b) color del pelo, sabor, olor. 8.- Cosidera las siguietes variables: opiió sobre el sabor de ua comida, opiió sobre si está salada ua comida, estar e posesió de ua tarjeta de crédito, calificació de u exame, olor de ua habitació. Cuáles so dicotómicas? Solució: opiió sobre si está salada, estar e posesió de ua tarjeta de crédito. ESTADÍSTICA UIDIMESIOAL 3
..- TABLAS ESTADÍSTICAS. FRECUECIAS.- Tablas estadísticas Las tablas estadísticas so ua forma de presetar la iformació de ua variable estadística. E la primera columa se coloca los valores (x i ), marcas de clase o modalidades de la variable y e las siguietes las frecuecias. Para tabular los datos procederemos de la siguiete maera: Recogida de datos Ordeació de los datos de meor a mayor, si so uméricos, o e el orde atural, si se trata de ua variable cualitativa omial. Recueto de frecuecias o veces que se repite cada dato. Agrupació de los datos. Se agrupa cuado la variable es cotiua o discreta co u úmero muy grade de datos. Las clases o debe ser meos de 5 i más de 0. Se debe procurar que todas las clase tega el mismo tamaño a o ser que haya datos muy dispersos. Marca de clase: es el puto medio de los extremos de cada clase. Los valores extremos so los límites de clase: iferior, L i, y superior, L i+, Las clases o debe solaparse i teer huecos, es decir, el límite iferior de ua clase ha de ser igual al límite superior de la aterior; pero cada extremo sólo perteece a ua clase, para ello se toma itervalos cerrados por la izquierda y abiertos por la derecha. Costrucció de la tabla estadística: E la tabla aparecerá diversas columas, siedo habitual colocar de izquierda a derecha el valor de la variable, la marca de clase (para datos agrupados) y las frecuecias absolutas y relativas..- Frecuecia absoluta Frecuecia absoluta del valor x i de ua variable estadística, y lo represetamos por i, es el úmero de veces que se repite dicho valor. Frecuecia absoluta acumulada del valor x i, y la represetamos por i, es la suma de las frecuecias absolutas de todos los valores ateriores a x i más la frecuecia absoluta de x i : k = + +... + k = i= 3.- Frecuecia relativa k i Frecuecia relativa de u valor x i, f i, es el cociete etre la frecuecia absoluta de x i, y el i i= total de datos que iterviee e la distribució: f i = i. Es u tato por uo, f =. Frecuecia relativa acumulada del valor x i, F i, es el cociete etre la frecuecia absoluta acumulada de x i y el úmero total de datos que iterviee e la distribució: F i = i 4.- Observacioes Las tablas debe llevar u euciado explicativo si ecesidad de texto que las acompañe. Debe icluir los totales de cada columa. Debe idicarse las uidades de medida. Siempre hay que utilizar el mismo úmero de decimales ya que os da la precisió del dato. Suele haber redudacias para facilitar la lectura. EJEMPLOS.- Las otas de los alumos de º de Bachillerato so las siguietes: 5 3 4 8 9 8 3 6 5 4 7 9 5 0 8 3 8 3 Efectúa la tabla adecuada a dichos datos co frecuecias absolutas, relativas y acumuladas. ESTADÍSTICA UIDIMESIOAL 4
x i i i f i F i 4 4 0,6 0,6 3 7 0, 0,8 3 4 0,6 0,44 4 3 0,08 0,5 5 3 6 0, 0,64 6 7 0,04 0,68 7 8 0,04 0,7 8 4 0,6 0,88 9 4 0,08 0,96 0 5 0,04,00 5.- Las edades de u grupo de persoas so: 3 3 4 3 4 5 6 7 3 4 4 5 3 5 6 7 5 4 4 5 3 6 9 3 6 7 6 3 6 5 6 costruye la tabla estadística de datos agrupados Clase Marca de clase i i f i F i [0-5),5 4 4 0,350 0,350 [5-0) 7,5 6 0,300 0,650 [0-5),5 7 33 0,75 0,85 [5-0) 7,5 35 0,050 0,875 [0-5),5 37 0,050 0,95 [5-30) 7,5 3 40 0,075 40 3.- Completa los datos que falta e la siguiete tabla estadística, dode, y f represeta frecuecia absoluta, acumulada y relativa. x i i i f i 4 6 0, 3 5 4 6 0, 5 3 6 9 0,8 7 4 8 Completamos la tabla observado la columa de frecuecias absolutas acumuladas i y la frecuecia relativa f i = i / siedo = i y f i =. Como la frecuecia absoluta de es 6 y la frecuecia relativa de es 0,: 6 6 0, = = = 50. 0, x i i i f i 4 4 0,08 6 0 0, 3 5 5 0,0 4 6 0, 5 0 3 0,0 6 9 40 0,8 7 4 44 0,08 8 6 50 0, 50,00 i= i= ESTADÍSTICA UIDIMESIOAL 5
EJERCICIOS PROPUESTOS.- Las otas de los 30 alumos de ua clase de Filosofía de º de Bachillerato so las siguietes: 6 3 5 8 9 8 3 7 6 4 5 9 7 7 8 9 5 0 0 3 8 3 0 Efectúa la tabla adecuada a dichos datos co frecuecias absolutas y relativas..- Las edades de u grupo de persoas so: 3 3 4 3 4 5 6 4 5 3 5 7 5 4 3 6 9 3 6 7 6 3 6 5 6 costruye la tabla estadística de datos agrupados 3.- Completa la siguiete tabla Solució: x i i i f i 0, 3 7 4 5 0,5 5 x i i i f i 3 3 0, 5 6/9 3 7 6/9 4 5 0,5 5 8 30 8/30 4.- Sea X ua variable estadística que idica el tiempo de permaecia de quice empleados e ua empresa. Costruye 6 itervalos de clase de igual amplitud siedo el primero (0, 5]. X 0 5 6 0 4 30 9 4 5 6 3 Solució: (0,5], (5,0], (0,5], (5,0], (0,5], (5,30]. 5.- Completa la siguiete tabla Solució: Clases Marcas i i f i [5-0) 7,5 0,05 0,0 [5-30) 7,5 3 3,5 3 5 [40,45) 39 [45-50) Clases Marcas i i f i [5-0) 7,5 0,05 [0-5),5 8 0 0,0 [5-30) 7,5 3 3 0,35 [30-35) 3,5 8 3 0,0 [35-40) 37,5 5 36 0,5 [40,45) 4,5 3 39 0,075 [45-50) 47,5 40 0,05 ESTADÍSTICA UIDIMESIOAL 6
.3.- REPRESETACIOES GRÁFICAS A veces es coveiete expresar la iformació mediate u gráfico para hacerla clara y evidete. Su fialidad es etrar por los ojos, así pues ha de ser muy fáciles de iterpretar. Aparte de los que estudiamos existe otros, como pirámides de població y series temporales. - Diagrama de barras Los diagramas de barras so útiles para datos cualitativos o datos cuatitativos de tipo discreto. Se represeta e el eje de abscisas los valores de la variable, y e el de ordeadas las frecuecias absolutas o relativas, segú proceda. Por los putos marcados de la variable e eje X, se levata barras de la misma achura y de altura igual a la frecuecia correspodiete..- Polígoo de frecuecias Los polígoos de frecuecias se usa para datos cualitativos ordiales o cuatitativos discretos. Se represeta e el eje de abscisas los valores de la variable, y e el de ordeadas las frecuecias absolutas o relativas, segú proceda. A cada valor de la variable se le asiga u puto del plao de abscisa el valor de la variable y de ordeada su frecuecia. La serie de putos obteidos de esta forma se ue mediate segmetos. E alguos casos el polígoo ue los extremos de las frecuecias acumuladas. 3.- Histogramas Los histogramas se usa para represetar distribucioes cuatitativas cotiuas. Sobre el eje de abscisas se señala los límites de las clases. Sobre el mismo eje se costruye uos rectágulos que tiee por base la amplitud de la clase y por altura la ecesaria para que las áreas de estos rectágulos sea proporcioales a las frecuecias respectivas. E el caso de clases de igual tamaño, las alturas de los rectágulos puede ser iguales que las frecuecias. 4.- Diagrama de sectores Los diagramas de sectores se usa para distribucioes cualitativas o cuatitativas discretas. Para dibujarlo debemos teer e cueta que cada sector represeta los distitos valores de la variable. El águlo cetral de cada sector ha de ser proporcioal a la frecuecia absoluta o relativa correspodiete. Es decir: α i = 360.h i ESTADÍSTICA UIDIMESIOAL 7
EJEMPLOS. Costruye los diagramas de barras absolutas y acumuladas de las otas de 30 alumos dadas e la tabla adjuta. x i 0 3 4 5 6 7 8 9 i 3 3 5 7 5 Los diagramas so las figuras adjutas:. Costruye el polígoo de frecuecias absolutas y acumuladas de las otas de 30 alumos dadas e la tabla adjuta. x i 0 3 4 5 6 7 8 9 i 3 3 5 7 5 Los polígoos so las figuras adjutas: 3. Costruye el histograma de frecuecias absolutas y acumuladas de las otas de 36 alumos dadas e la siguiete tabla. Edades [0,5) [5,0) [0,5) [5,0) [0,5) [5,30) i 3 6 3 Los histogramas so las figuras adjutas: ESTADÍSTICA UIDIMESIOAL 8
4.- Costruye el diagrama de sectores correspodiete a la tabla que muestra la iversió publicitaria (milloes $) e la Uió Europea: Países Iversió Alemaia 8.34 Gra Bretaña 6.95 Fracia 4.663 España 3.000 Holada.970 Italia.846 Diamarca.084 Bélgica 464 Grecia 64 Irlada 7 Es la figura de la derecha. EJERCICIOS PROPUESTOS.- Se ha tabulado el peso de los recié acidos durate ua semaa e ua materidad, obteiédose los siguietes resultados: Peso e kg. [.5,.8) [.8, 3.) [3., 3.4) [3.4, 3.7) [3.7, 4.3) º de iños 8 4 5 Teiedo e cueta que o todos los itervalos tiee igual amplitud, represeta gráficamete estos datos mediate el procedimieto más adecuado. Solució: Histograma de alturas, 4, 6, 8 y 5 respectivamete..- Los valores de los datos y la frecuecia absoluta de ua distribució viee dados e la siguiete tabla. Represeta el diagrama de barras y de barras acumuladas de la distribució. x 3 4 5 6 7 8 4 5 8 7 5 0 7 4 3. La siguiete tabla recoge el tiempo de retraso que sufre e la icorporació a clase los alumos de u istituto: Retraso e miutos [0,4) [4,8) [8,) [,6) [6,0) º de alumos 5 5 8 0 4 a) Represeta los datos mediate u histograma. b) A cotiuació represeta los datos mediate u sector circular. c) Es adecuado el uso de este diagrama para la distribució? 4.- El gráfico siguiete muestra la distribució de la població ocupada e España e 996. Teiedo e cueta que la població ocupada e España es de,5 milloes halla la tabla correspodiete a dicho gráfico. ESTADÍSTICA UIDIMESIOAL 9
.4.- MEDIDAS DE CETRALIZACIÓ.- Media aritmética La media aritmética de ua variable estadística es el cociete etre la suma de todos los valores de la variable y el úmero de valores. Se represeta por x. Su fórmula es: x = xi i Cosideracioes: Para distribucioes cotiuas el cálculo de la media se efectúa co las marcas de clase. o se puede calcular la media co datos cualitativos o si la distribució tiee clases abiertas. Si a todos los valores de la distribució se les suma u mismo valor la media aumeta e dicho valor. Si a los valores de la distribució se les multiplica por mismo úmero la media se multiplica por dicho úmero..- Moda Moda de ua variable estadística es el valor de la variable que preseta la mayor frecuecia absoluta. La moda se represeta por M o La moda o tiee por qué ser úica, puede haber varios valores de la variable co la mayor frecuecia, se dice que es bimodal, trimodal, etc.. Cálculo: Datos simples: M o será el valor x i de mayor frecuecia i. Si todos los datos de ua distribució tiee la misma frecuecia, esa distribució o tiee moda. Datos agrupados: El itervalo modal será el itervalo de mayor frecuecia f i, la moda M o se obtiee co la fórmula: D M 0 = L i + C D + D siedo: L i límite iferior de la clase modal. c amplitud de los itervalos. D frecuecia absoluta de la clase modal meos la de la clase aterior (f i - f i- ) D frecuecia absoluta de la clase modal meos la de la clase siguiete (f i - f i+ ) Cosideracioes: La moda es meos represetativa que la media aritmética, pero se puede hallar aú cuado se trate de distribucioes de datos cualitativos. E la moda o iterviee todos los datos de ua distribució. La moda puede tomar valores extremos de la distribució y o tiee porqué estar cetrada. Cálculo gráfico Para distribucioes cotiuas se obtiee ua aproximació de forma gráfica. Para ello se represeta el histograma de frecuecias absolutas y a cotiuació se ue cada extremo de la clase modal co el extremo correspodiete de las cotiguas, tal como se ve e la figura. La moda M o viee dada por la abscisa del puto de corte de estos dos segmetos. i= 3.- Mediaa Mediaa, M e, de ua variable estadística es el valor cetral; es decir aquel que verifica, tal que el úmero de observacioes meores que él es igual al úmero de observacioes mayores que él. ESTADÍSTICA UIDIMESIOAL 0
Cálculo: Datos simples: Se ordea los datos de meor a mayor, la mediaa es el valor cetral de la variable si es úico. Si hay dos valores cetrales, se toma como mediaa la semisuma de esos dos valores cetrales. Datos agrupados: el itervalo viee dado por el primer valor de la variable cuya frecuecia absoluta acumulada ( i ) excede a la mitad del úmero de datos. A cotiuació e la columa de frecuecias acumuladas se calcula dode está el valor mediao mediate la fórmula: - i- M e = Li + c i siedo: L i límite iferior de la clase mediaa c amplitud del itervalo º de datos i- frecuecia absoluta acumulada de la clase aterior a la clase mediaa i frecuecia absoluta de la clase mediaa. Cosideracioes La mediaa es muy útil cuado existe algú valor raro que afecta a la media, o cuado los datos está agrupados e clases y algua de ellas es abierta. La mediaa es u parámetro que depede del orde e que esté situados los datos y o de su valor. Para distribucioes cotiuas o agrupadas que se pueda represetar mediate u histograma, la mediaa es el valor de la variable que divide al histograma e dos partes de igual área. Cálculo gráfico Para hallar gráficamete la mediaa se represeta el polígoo de frecuecias relativas acumuladas (F i ). Situamos e el eje de abscisas la variable y e el eje de ordeadas los porcetajes correspodietes. Se traza ua paralela al eje X por el puto correspodiete al 50 %. La abscisa del puto de corte de esa paralela co la gráfica os da la mediaa. EJEMPLOS.- Las aotacioes de los ecuetros de u jugador de balocesto se muestra e el siguiete cuadro. Halla la media y moda. Ecuetro º º 3º 4º 5º 6º 7º 8º 9º 0º Aotacioes 0 8 7 8 0 9 9 0 7 0 Para hallar la media utilizamos la siguiete tabla x i i x i i 7 7 8 8 9 9 0 4 40 7 7 8 8 9 9 0 8 ESTADÍSTICA UIDIMESIOAL
Siedo su valor: 8 x = xi i = =,8 putos i= 0 Para hallar la moda utilizamos la siguiete tabla x i 7 8 9 0 7 8 9 i 4 La moda es el valor más frecuete, por lo tato M o = 0 putos..- Dada la distribució estadística, calcula la media y moda. I i (0, 5] (5, 0] (0, l5] (5,0] (0,5] (5, 30] i 4 6 7 0 Costruimos la siguiete tabla auxiliar. Clases Marcas: x i i x i i (0-5],5 4 0 (5-0] 7,5 6 45 (0-5],5 7 87,5 (5-0] 7,5 0 75 (0-5],5 45 (5-30] 7,5 7,5 30 390 390 x = xi i = = 3 i= 30 El Itervalo modal es el de mayor frecuecia absoluta: (5-0]. Para hallar el valor de la moda aplicamos la fórmula de iterpolació: D 0-7 M 0 = L i + C = 5 + 5 = 6,36 D + D (0-7) + (0 - ) 3.- La superficie sembrada (miles de Ha) de letejas e España durate los años de 970 a 974 fue la dada e la tabla, calcula la superficie mediaa. Año 970 97 97 973 974 Superficie 68 75 87 99 05 La mediaa se obtiee buscado el valor que deja la mitad de la distribució a la izquierda; como / =,5; el primer valor de la variable cuya frecuecia absoluta acumulada excede a,5 es M e = 87. 4.- Dada la distribució de frecuecias calcula el valor de la mediaa. x i 3 4 5 i 4 Para calcular la mediaa utilizamos la tabla adjuta: x i 3 4 5 i 3 7 9 0 ESTADÍSTICA UIDIMESIOAL
Observamos e la columa de frecuecias acumuladas que valor tiee ua frecuecia acumulada que supera por primera vez / = 5. Resulta ser el valor 3, co frecuecia acumulada 7. EJERCICIOS PROPUESTOS.- El úmero de goles aotados por u equipo de fútbol e los partidos de liga, se muestra e el siguiete cuadro. Halla la media, mediaa y moda de las aotacioes. Ecuetro º º 3º 4º 5º 6º 7º 8º 9º 0º Aotacioes 4 3 0 3 Solució: x =,8; M e =,5; M 0 =..- Dada la distribució estadística calcula la media, mediaa y moda. x i (0, 6] (6, ] (, 8] (8,4] (4,30] i 6 7 0 5 Solució: x =7; M e = 8; M 0 = 0,5. 3.- Halla la media de la siguiete distribució estadística Color del cabello rubio pelirrojo egro castaño i 4 6 5 0 Solució: o se puede hallar. 4.- Dada la distribució estadística calcula la media. edad meor de 5 5 a 30 30 a 50 mayor que 50 º 450 54 656 43 Solució: o se puede hallar. 5.- Cosidera los datos, 4, 6, 8 y 0, calcula su media. a) Si sumas 5 a cada uo de los datos ateriores, cuáto vale la media? b) Si multiplicas por 0 cada uo de los datos ateriores, cuáto vale la media? Solució: x = 6, a) x +5 =, b)0 x = 60. 6. Dada la siguiete distribució calcula su moda y mediaa. x i 3 4 5 6 i 6 5 4 0 4 Solució: M e = 3,5; M 0 = 4. 7.- Dada la distribució estadística calcula su moda y mediaa. I i (0, 0] (0,0] (0, 30] (30,40] (40,50] i 6 7 4 Solució: M e = 4,3; M 0 =,5. 8.- Dada la distribució estadística calcula moda y media gráficamete. Solució: M 0 = 66,7, M e = 63. I i (30, 40] (40, 50] (50,60] (60,70] (70,80] i 7 8 5 5 0 ESTADÍSTICA UIDIMESIOAL 3
.5.- MEDIDAS DE DISPERSIÓ.- Rago Se llama rago o recorrido de ua distribució, y se deota R, a la diferecia etre los valores extremos de la variable. Además existe otros ragos: Rago itercuartílico: diferecia etre el tercer y primer cuartil. R i = Q 3. -Q Rago itercuartílico superior: diferecia etre el mayor valor de la variable y el tercer cuartil. Rago itercuartílico iferior: diferecia etre el primer cuartil y el meor valor de la variable. Rago etre percetiles: diferecia etre dos percetiles, p. e., P = P 90 -P 0. Observacioes: Cuato meor es el recorrido de ua distribució mayor es el grado de represetatividad de los valores cetrales. Es secillo de calcular. Viee dado e las mismas uidades que la variable. Preseta el icoveiete de que sólo depede de los valores extremos; de forma que basta que uo de ellos se separe mucho, para que el rago se vea afectado, es por lo que se defie los otros ragos..- Desviació media Se llama desviació media de ua variable a la media aritmética de las desviacioes absolutas respecto de la media. Se represeta por d m. Cálculo: d m = i= i x i - x Siedo: x media aritmética x i valores de la variable i frecuecia absoluta asociada a los valores ateriores úmero total de datos de la distribució Observacioes: La desviació media depede de todos los valores de la distribució. Si o es posible hallar la media o es posible hallar la desviació media. Viee expresada e las mismas uidades que los datos. 3.- Variaza Se llama variaza de ua variable a la media aritmética de los cuadrados de las desviacioes respecto a la media. Se represeta por S y a veces se llama desviació cuadrática media. Cálculo: s = i xi i (x - x ) i = i= - x i= Observacioes: La variaza depede de todos los valores de la distribució y de la media. Si o es posible hallar la media o es posible hallar la variaza. La variaza viee expresada e distitas uidades que los datos. Por lo tato es más iteresate la desviació típica que la variaza. Por la propia defiició de variaza ésta es siempre positiva. ESTADÍSTICA UIDIMESIOAL 4
4.- Desviació típica Se llama desviació típica de ua variable a la raíz cuadrada positiva de la variaza de dicha variable. Se represeta por S. Cálculo: Se obtiee mediate la fórmula: i= S = i (xi - x ) = - x i= i x i Observacioes: La desviació típica depede de todos los valores de la distribució. Si o es posible hallar la media o es posible hallar la desviació típica. Viee expresada e las mismas uidades que los datos. Coviee dar la variaza co u decimal meos que la desviació típica. Si a los valores de ua distribució se les suma u úmero la desviació típica o varía. Si todos los valores de ua distribució se multiplica por u mismo valor la desviació típica queda multiplicada por dicho valor EJEMPLOS.- Dada la distribució de frecuecias de la tabla adjuta: x i 3 4 5 6 7 8 i 4 6 5 6 0 9 4 6 Se pide la media, variaza y desviació típica. Para calcular los parámetros pedidos utilizamos la tabla siguiete. x i i i x i i x i i 4 4 4 4 6 0 4 3 5 5 5 45 4 6 4 96 5 0 3 50 50 6 9 40 54 34 7 4 44 8 96 8 6 50 48 384 50 35 33 La media: x = xi i 35 = 4,70 50 i= La variaza: S = x - x i i = i = La desviació típica: S = 4, 4 =,09 33 50 - (4,7) = 4,4.- Dada la distribució estadística I i (0, 5] (5, 0] (0, l5] (5,0] (0,5] (5, 30] i 4 6 7 0 Calcula la media, rago, variaza y desviació típica. ESTADÍSTICA UIDIMESIOAL 5
Para calcular los parámetros pedidos utilizamos la tabla siguiete. Clases Marcas i x i i x i i (0-5],5 4 0 5 (5-0] 7,5 6 45 337,5 (0-5],5 7 87,5 093,75 (5-0] 7,5 0 75 306,5 (0-5],5 45 0,5 (5-30] 7,5 7,5 756,5 30 390 687,5 La media es: x = xi i = 3 i= El rago es R = 30-0 = 30 i xi La variaza: s i= = - x = 688-3 30 = 40,6 Desviació típica: S = 40, 6 = 6,37 EJERCICIOS PROPUESTOS.- Halla los recorridos itercuartílicos de la distribució que represeta la superficie sembrada (e miles de Ha) de letejas e España durate los años de 970 a 974 fue: Año 970 97 97 973 974 Superficie 68 75 87 99 05 Solució: R i = 4; R isup = 6; R iif = 7..- Se ha pregutado a u grupo de deportistas las horas que dedica a etreamieto durate el fi de semaa. Los resultados aparece e la siguiete distribució de frecuecias calcula el rago, la media, variaza y desviació típica. Horas [0,0.5) [0.5,.5) [.5,.5) [.5,4) [4,8] Persoas 0 0 8 Solució: R = 8; x =,57 h; s = 3,7 h ; s =,93 h. 3.- Se ha tomado ua muestra de los precios de u producto e 6 comercios, elegidos al azar e u barrio de la ciudad, y se ha ecotrado los siguietes precios. Costruye 4 itervalos de clase de igual amplitud siedo el primero [95, 00) y calcula la media y la desviació típica. 95 08 97 99 06 05 00 99 98 04 0 07 03 0 Solució: x = 04,69; s =5,85. 4.- La suma de uos datos es de 5 uidades y la de sus cuadrados 50 uidades cuadradas. si la media y desviació típica iiciales coicide, cuál es su media y desviació típica? Solució: s = x = 5 5.- Sea la distribució formada por, 3, 5, 7 y 9. a) Calcula la media y desviació típica. b) Calcula la media y desviació típica si añadimos a cada uo de los datos. c) Calcula la media y desviació típica si multiplicamos por 7 cada uo de los datos. Solució: a) x = 5, s = 8 ; b) x = 7, s = 8 +; c) x = 35, s = 7 8 ESTADÍSTICA UIDIMESIOAL 6
.6.- COMPARACIÓ DE DISTRIBUCIOES.- Coeficiete de variació El coeficiete de variació de Pearso, CV, es la desviació típica por uidad de media multiplicada por 00. Mide la dispersió relativa de la muestra. Cálculo: CV = v p = x s x.00 Observacioes: El coeficiete de variació o depede de la uidad utilizada puesto que es el cociete etre la media y la desviació típica y viee ambas dadas e las mismas uidades. U coeficiete de variació del 30% idica que la media es poco represetativa como medida del promedio, debiédose optar por la mediaa o la moda. Dadas dos variables aquella que tega u coeficiete de variació mayor es más heterogéea y el que lo tega meor más homogéea, siedo su media más represetativa de la variable. El coeficiete de variació o debe usarse cuado la media esté próxima a cero, pues el deomiador pequeño distorsioa el cociete..- Putuacioes típicas. Usamos los datos de media y desviació típica de ua distribució para hallar los valores xi - x ormalizados o putuacioes típicas de la variable x i =. Estas putuacioes típicas s sirve para comparar los valores de dos distribucioes diferetes. EJEMPLOS.- Compara las putuacioes obteidas por u alumo e Matemáticas e Historia sabiedo que e ambas ha obteido u 7, estado caracterizadas las putuacioes e ambas asigaturas por los parámetros: x s Matemáticas 4 4 Historia 5 4 7-4 La ota ormalizada e Matemáticas es 4 7-5 4 = 0,75 y e Historia es = 0,5, luego comparativamete es mayor la ota e Matemáticas..- Las achuras de las aceras de cuatro barrios de ua ciudad viee dadas e la siguiete tabla y e las gráficas adjutas. Asocia a cada gráfica los parámetros correspodietes: A B C D x 98,5 98, 93 93,4 S 9,7 3,9 4,6 8, ESTADÍSTICA UIDIMESIOAL 7
() () (3) (4) Observado la tabla y las gráficas obteemos: A (4) B () C (3) D () 3.- E u Istituto hay dos grupos de Matemáticas. Las calificacioes de la primera evaluació e cada grupo fuero las siguietes: Grupo A 3 5 5 6 8 8 9 Grupo B 4 4 4 5 5 6 6 8 Utilizado la medida adecuada, di qué grupo es más homogéeo. Para determiar qué grupo es más homogéeo, utilizamos el coeficiete de variació que mide la desviació típica respecto a la media de ua variable, es decir, su homogeeidad. Para hallarlo utilizamos las tablas adjutas: x i i x i i x i i y i i y i i y i i 3 3 3 4 8 3 3 9 4 3 48 5 0 50 5 0 50 6 6 36 6 7 8 6 8 8 8 64 9 9 8 0 46 4 0 47 307 Media de x: x = xi i = 47 = 4,7 0 i= Desviació típica de x: ESTADÍSTICA UIDIMESIOAL 8
s x = i= i x i - x = 307 - (4,7) 0 =,93 Media de y: y = yi i = 46 = 4,6 0 i= Desviació típica de y: s y = i= y i i - y = 4 - (4,6 ) 0 =,74 Hallamos el coeficiete de variació, de fórmula v p = x s x.00, co valores:,93 v p =.00 = 6,3, para el primer grupo 4,7,74 v p =.00 = 37,8, para el segudo grupo 4,6 El segudo grupo es más homogéeo, ya que su CV es meor. 4.- Se ha realizado u estudio estadístico de los pesos de los alumos de tres aulas, siedo sus resultados redodeados los siguietes. Idetifica qué gráfica correspode a cada clase. Justifica la respuesta. A B C x 65 64,3 67, s 6,5 3, 4,5 Gráfico Gráfico Gráfico 3 El gráfico es el de la clase B El gráfico es el de la clase C El gráfico 3 es el de la clase A (tiee la meor desviació típica de las tres y su media es algo meor que 65) (tiee la desviació típica itermedia de las tres y su media es algo mayor que 65) (tiee la mayor desviació típica de las tres y su media es 65) La meor desviació típica correspode al primer gráfico, pues los datos está agrupados, si dispersió. ESTADÍSTICA UIDIMESIOAL 9
La mayor desviació típica correspode al tercer gráfico, pues los datos está muy dispersos, más o meos todos co la misma frecuecia, tato los próximos a la media como los alejados de ella. EJERCICIOS PROPUESTOS.- Las gaacias de dos tiedas (e miles de euros) durate los años 970 a 975 fuero Año Tieda A Tieda B 970 5,9 4,5 97,5 3,8 97 7,4 5,7 973 8, 3,5 974 4,8 5,5 975 3,7 4,6 a) Qué tieda da más beeficios?, b) Cuál tiee mayor estabilidad e dichos beeficios? Solució: a) mayores beeficios la A, ya que x A = 5,4 y x B = 4,6; b) más estable la B ya que s A =,97 y s B = 0,80..- Dada la distribució de frecuecias de la tabla adjuta, se pide el coeficiete de variació,0 Solució: v p = 3 x i 3 4 5 i 4.00 = 36,5% 3.- Las siguietes distribucioes tiee aproximadamete la misma media (5) y,, 3 y 4 como desviacioes típicas. Asiga a cada gráfica su desviació típica. (a) (b) (c) Solució: (a), (b) 3, (c), (d) 4. (d) ESTADÍSTICA UIDIMESIOAL 0
.7.- EJERCICIOS FIALES.- Completa los datos que falta e la siguiete tabla de distribució de frecuecias, dode i, i y f i represeta frecuecia absoluta, frecuecia absoluta acumulada y frecuecia relativa de X. Calcula la media y moda de la distribució aterior. X i i f i 4 0,08 4 3 0,6 4 7 3 5 5 6 38 7 7 45 8 Solució: x = 4,76 ; M 0 = 6. X i i f i 4 4 0,08 4 8 0,08 3 8 6 0,6 4 7 3 0,4 5 5 8 0,0 6 0 38 0,0 7 7 45 0,4 8 5 50 0,0. La siguiete tabla recoge el retraso e el trabajo de los empleados de ua empresa: a) Represeta los datos mediate u histograma. b) Calcula el retraso medio y la desviació típica. Retraso e miutos [0,4) [4,8) [8,) [,6) [6,0) º de empleados 5 5 8 0 4 Solució: x = 9,46 miutos; s = 4,30 miutos. 3.- Los pesos de los 00 alumos de ua clase viee dados por la siguiete tabla. a) Calcula la media, desviació típica, mediaa, moda. b) Efectúa ua represetació tipo histograma de dicha distribució. Peso [40-48) [48-56) [56-64) [64-7) [7-80) Frecuecia 3 5 8 Solució: x = 6,; s = 0,58; M e = 60,8; M o = 57,8. 4.- Las putuacioes obteidas por 0 persoas e ua prueba queda reflejadas e el siguiete histograma. a) Costruye la tabla adecuada a los siguietes datos. b) Efectúa u diagrama de sectores a partir de dicha tabla. c) Es adecuado dicho diagrama? Solució: Peso [0-) [-4) [4-6) [6-8) [8-0) Frecuecia 4 8 5 5.- Los siguietes datos idica el tiempo de permaecia de 5 empleados e ua empresa: a) Costruye 6 itervalos de clase de igual amplitud siedo el primero (0, 5]. ESTADÍSTICA UIDIMESIOAL
b) Represeta el histograma de frecuecias absolutas. Permaecia 0 5 6 0 4 5 6 3 6 9 4 Solució: [0-5) [5-0) [0-5) [5-0) [0-5) [5-30) 3 5 6.- El diagrama de barras muestra las calificacioes obteidas por u grupo de 50 alumos. Calcula la calificació media, teiedo e cueta el siguiete cuadro de equivalecias: otas Itervalo Suspeso [0,5) Aprobado [5,7) otable [7,9) Sobresaliete [9,0) Solució: x = 5,36. 7.- Los siguietes datos correspode a la altura e cetímetros de los alumos de ua determiada clase: 5, 53, 56, 57, 57, 60, 6, 6, 63, 64, 65 67, 68, 69, 70, 7, 7, 77, 78, 8, 83 Realiza ua represetació gráfica. 8.- Dada la distribució estadística calcula la media, mediaa y moda. I i [0, 5) [5, 0) [0, 5) [5, 0) [0,5) 5 o más i 3 5 7 8 5 Solució: x =5,7; M e =5; M o =5,7. 9.- Calcula la media, mediaa, moda y la desviació típica de la estatura de 40 chicos. Itervalo 48,5-53,5 53,5-58,5 58,5-63,5 63,5-68,5 68,5-73,5 73,5-78,5 Alumos 4 4 5 4 Solució: x =64,5; M e = 64,57; M o = 64,75; s = 6,4. 0.- Se ha aplicado u test sobre la satisfacció e el trabajo a los 88 empleados de ua fábrica obteiédose los siguietes resultados: Trabajadores [38-44) [44-50) [50-56) [56-6) [6-68) [68-74) [74-80) % Satisfacció 7 8 5 5 8 9 6 a) Represeta la distribució mediate algú diagrama b) Calcula la media, mediaa, moda, recorrido y desviació típica Solució: b) x = 58,98; M e = 59,36; M o = 59,53; R = 4; s = 9,76..- Sea X ua variable estadística cuya media vale. Defiimos otra variable Z que cumple que z i = 3 x i. Demuestra, usado la fórmula, que la media de Z es 6..- Se elige al azar tres úmeros etre el 0 y el 9 y co ellos se forma u úmero de tres cifras. Se sabe que la media de las tres cifras es 5 y que la moda existe y es 7. Cuál es el mayor úmero que se pudo formar de esta maera? Solució: 77. ESTADÍSTICA UIDIMESIOAL