I. En un regimiento de 900 soldados, deseamos conocer la estatura de todos ellos.

Documentos relacionados
Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

ESTADÍSTICA. Definiciones

Tema 1: Estadística Descriptiva Unidimensional

Descripción de una variable

INTRODUCCIÓN. Técnicas estadísticas

ESTADÍSTICA. x es el cociente entre la frecuencia absoluta del valor

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

16/02/2015. Ángel Serrano Sánchez de León

Medidas de Variabilidad

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Tema 1: Análisis de datos unidimensionales

1. Notación y tabulación

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objetos de nuestro estudio.

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

el blog de mate de aida CSI: Estadística unidimensional pág. 1

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

3. VARIABLES ALEATORIAS.

Medidas de centralización

Variables Aleatorias

SEMANA 13. CLASE 14. MARTES 20/09/16

Prueba de Evaluación Continua

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Estadística Unidimensional: SOLUCIONES

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

Introducción a la Física. Medidas y Errores

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

2 Dos tipos de parámetros estadísticos

EJERCICIOS RESUELTOS TEMA 2

17/02/2015. Ángel Serrano Sánchez de León

ESTADÍSTICA (GRUPO 12)

DISTRIBUCIONES BIDIMENSIONALES

Cálculo y EstadísTICa. Primer Semestre.

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

DEPARTAMENTO DE MATEMÁTICAS

MEDIDAS DESCRIPTIVAS

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

UNIDAD 1: Tablas de frecuencias

TEMA 10: ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA DESCRIPTIVA I

Estadística Descriptiva

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos:

Tema 6. Estadística descriptiva bivariable con variables numéricas


ESTADÍSTICA 4º ESO A) INICIACIÓN A LA ESTADÍSTICA 1.- QUÉ ES LA ESTADÍSTICA?

SEGUNDA PARTE RENTAS FINANCIERAS

5ª Parte: Estadística y Probabilidad

, x es un suceso de S. Es decir, si :

Tema 8: Estadística en una variable (unidimensional)

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

INICIACIÓN A LA ESTADÍSTICA. ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD ESTADÍSTICA. (SOLUCIONES)

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

GUÍA DE APOYO AL APRENDIZAJE N 2

Medidas de Tendencia Central y de Variabilidad

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

unidad 12 Estadística

Tema 4: Variables aleatorias

Organización y resumen de datos cuantitativos

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Estadística. Problemas de Estadística 1º Ciclo ESO Departamento de Matemáticas Raúl González Medina

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

1. ESTADÍSTICA DESCRIPTIVA.

Problemas donde intervienen dos o más variables numéricas

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

LISTA DE TALLERES DE ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

Tema 1.3_A La media y la desviación estándar

3º ESO ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICAS. SAGRADO CORAZÓN COPIRRAI_Julio César Abad Martínez-Losa ESTADÍSTICA

Estadísticos muéstrales

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO PLANTEL IGNACIO RAMÍREZ C. DE LA ESCUELA PREPARATORIA

Regresión y Correlación

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk

Figura 1

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN PREPARATORIA No. 3

1. Variable aleatoria. Clasificación

TEMA 3. VARIABLE ALEATORIA

ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR FUNDAMENTOS DE MATEMÁTICAS

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

ESTADÍSTICA DESCRIPTIVA Y BIDIMENSIONAL

Capitalización y descuento simple

ESTADÍSTICA DESCRIPTIVA

GUÍA DE APOYO AL APRENDIZAJE N 1

Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos. Frecuencia absoluta (f i )

Para un dado que no está cargado asignamos equiprobabilidad a los valores posibles de la variable aleatoria X:

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

Transcripción:

Estadístca Dstrbucones Undmensonales Poblacón y Muestra Varables estadístcas Tablas estadístcas Gráfcos estadístcos Parámetros estadístcos Calculadora centífca Caso Problemas resueltos

Introduccón La palabra Estadístca provene de que fueron los Estados los mpulsores de las prmeras elaboracones de datos, sobre todo, en el sglo XVIII. La Estadístca es la Cenca que utlza conjuntos de datos numércos para obtener a partr de ellos nferencas basadas en el cálculo de probabldades. Así pues, la estadístca estuda fenómenos que, de alguna manera, se pueden cuantfcar; que generan conjuntos de datos. Trabajando con estos datos el estadístco, utlzando las técncas apropadas, tratará de smplfcar al mámo la nformacón dsponble, a fn de que pueda ser clara y útl. Además, s el fenómeno lo requere, tratará de deducr, de nferr, las leyes que eplquen el comportamento de ese fenómeno. La dea de nferenca es la de deduccón arresgada y, por tanto, con posbldad de error (error que debe ser conocdo), pues la estadístca se mueve en el campo del azar, de lo probable, y es ahí donde pretende buscar las leyes que determnan su comportamento a fn de poder tomar las decsones oportunas, conocendo con antelacón la sgnfcacón de esos resultados. Veamos tres stuacones: I. En un regmento de 900 soldados, deseamos conocer la estatura de todos ellos. II. Se desea conocer la talla de los varones españoles que tengan una edad comprendda entre 8 y 30 años. III. Un fabrcante de bombllas se encuentra con una produccón de 0.000 undades que, por algún fallo en el proceso de fabrcacón, comprobado posterormente, teme que sean defectuosas. Desea, pues, conocer sus característcas antes de lanzarlas al mercado, porque, en caso de ser defectuosas, consdera preferble destrurlas. En el prmer caso es muy fácl tallar a los 900 soldados. Los resultados obtendos se tabularán y, s se quere, se representarán gráfcamente. En el segundo caso es práctcamente mposble tallar a los mllones de ndvduos que cumplen esas característcas. No quedará más remedo que tomar una muestra (un pequeño conjunto de ellos) y efectuar la medda en éstos. Las conclusones se harán etensvas a la totaldad. En el tercer caso, las característcas que el fabrcante de bombllas desea comprobar son la lumnosdad y la duracón de cada una de ellas. La prmera, la lumnosdad, la puede comprobar eahustvamente (en cada una de las 0.000 bombllas), pero sería un proceso demasado largo. La duracón, sn embargo, no puede medrla en todas, pues la únca forma de averguar la vda de una lámpara es dejarla encendda hasta que se funda y cronometrar su duracón (es un proceso destructvo). No le quedará más remedo que proceder al estudo de una muestra y etender las conclusones a la totaldad. La estadístca se puede dvdr en dos partes: I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

Estadístca descrptva Estadístca nferencal La estadístca descrptva o deductva, trata del recuento, ordenacón y clasfcacón de los datos obtendos por las observacones. Se construyen tablas y se representan gráfcos que permten smplfcar, en gran medda, la complejdad de todos los datos que ntervenen en la dstrbucón. Asmsmo se calculan parámetros estadístcos que caracterzan la dstrbucón. En esta parte de la estadístca no se hace uso del cálculo de probabldades, y úncamente se lmta a realzar deduccones drectamente a partr de los datos y parámetros obtendos (caso I). La estadístca nferencal o nductva plantea y resuelve el problema de establecer prevsones y conclusones váldas generales sobre una poblacón a partr de los resultados obtendos de una muestra. Utlza resultados obtendos medante la estadístca descrptva y se apoya fuertemente en el cálculo de probabldades (casos II y III). Poblacón y Muestra Se denomna poblacón al conjunto de todos los elementos que cumplen una determnada característca, que deseamos medr o estudar. Los elementos de la poblacón se llaman ndvduos (debdo a su orgen demográfco). Se llama muestra a cualquer subconjunto de la poblacón (precsamente aquel subconjunto sobre el que se va a realzar el estudo). El número de elementos de la muestra se llama tamaño de la msma. Cuando la muestra concde con la poblacón se llama censo. Ejemplo: En los problemas planteados anterormente, las poblacones estaban formadas por: 900 soldados de un regmento. Todos los varones españoles de edades entre 8 y 30 años. 0.000 bombllas. Los ndvduos son: cada uno de los soldados. cada uno de los varones españoles de 8 a 30 años. cada una de las 0.000 bombllas. Un msmo conjunto puede ser poblacón o muestra según los casos. Por ejemplo, el conjunto de seres vvos encontrados en una parcela de una Hectárea, será poblacón s nuestro nterés se lmta a esa parcela; será muestra s, pretendendo conocer la ecología de una regón, acotamos esa parcela para sacar de su estudo conclusones etensvas a toda la regón. I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

Varables estadístcas Se llama varable estadístca al conjunto de valores que toma un carácter estadístco. Dependendo del carácter, una varable estadístca puede ser cuanttatva o cualtatva. Varable estadístca dscreta Una varable estadístca se llama dscreta cuando puede tomar un número fnto de valores o nfnto numerable. Varables estadístcas dscretas son por ejemplo: Número de empleados de una fábrca. Número de hjos de 0 famlas. Número de goles marcados por la Seleccón Naconal de Fútbol en cada una de las últmas 30 temporadas. Varable estadístca contnua Una varable estadístca es contnua cuando puede tomar, al menos teórcamente, todos los valores posbles dentro de un certo ntervalo de la recta real. Varables estadístcas contnuas son por ejemplo: La altura de un ndvduo. El peso de un ndvduo. El tamaño de los objetos. El tempo que tarda en caer un objeto. En la práctca muchas meddas de carácter contnuo se hacen dscretas, como, por ejemplo, la talla de los ndvduos: la estatura suele redondearse en cm.. Otras veces, fundamentalmente para obtener resultados teórcos, una varable dscreta puede tratarse como contnua. Los valores de las varables estadístcas se acostumbran a representar por,,,, 3 n Frecuencas absolutas y relatvas Frecuenca absoluta Se llama frecuenca absoluta del valor, y lo representamos por f, al número de veces que se repte dcho valor. Frecuenca absoluta acumulada Se llama frecuenca absoluta acumulada del valor, y lo representamos por F, a la suma de las frecuencas absolutas de todos los valores anterores a más la frecuenca absoluta de : F = f + f + f3 + + f I.E.S. Hstorador Chabás -3- Juan Bragado Rodríguez

La frecuenca absoluta no es sufcente para reflejar la ntensdad con que se repte un determnado valor de la varable estadístca. Por ejemplo, no es lo msmo obtener tres veces un cnco en dez lanzamentos de un dado que obtenerlo en 000 lanzamentos del msmo. Frecuenca relatva Se llama frecuenca relatva de un valor y lo representaremos por f r, al cocente entre la frecuenca absoluta de y el número total de datos que ntervenen en la dstrbucón: f f r = f sendo f el número total de datos. S cada frecuenca relatva se multplca por 00 se obtene el tanto por cento correspondente a cada valor. Frecuenca relatva acumulada Se llama frecuenca relatva acumulada del valor, y la representaremos por F r, a la suma de las frecuencas relatvas de todos los valores anterores a más la frecuenca relatva de. En todos los casos, la suma de las frecuencas absolutas debe ser gual al total de elementos, la suma de las frecuencas relatvas será gual a la undad, y la suma de los porcentajes deberá ser gual a 00. Tratamento de la nformacón. Tablas estadístcas A contnuacón vamos a estudar cómo debemos proceder ordenadamente para analzar la muestra:. Recogda de datos: Consste en la toma de datos numércos procedentes de la muestra.. Ordenacón de los datos: Una vez recogdos los datos los colocaremos en orden crecente o decrecente. 3. Recuento de frecuencas: Efectuaremos el recuento de los datos obtendos. 4. Agrupacón de los datos: En caso de que la varable sea contnua o ben dscreta pero con un número de datos muy grande es muy aconsejable agrupar los datos. Se llama ntervalos de clase a cada uno de los ntervalos en que pueden agruparse los datos de una varable estadístca. Ahora ben, Cuál es el número dóneo de ntervalos que debemos escoger a la hora de agrupar? No este una contestacón tajante a esta pregunta; esten ncluso varos crteros para dar respuesta a esta cuestón. Con carácter muy general podemos enuncar como uno de los crteros muy sencllos el de Norclffe que establece que el número de ntervalos debe ser apromadamente gual a la raíz I.E.S. Hstorador Chabás -4- Juan Bragado Rodríguez

cuadrada postva del número de datos. Para obtener la ampltud de dchos ntervalos se procede del sguente modo: Se localzan los valores menor y mayor de la dstrbucón. Se restan. S la dferenca es dvsble entre el número de ntervalos, el cocente nos da su ampltud. En caso contraro se busca el prmer número entero por eceso de la dferenca que sea dvsble por el número de ntervalos. El cocente de esta dvsón nos da la ampltud de los msmos. Se forman los ntervalos de modo que contengan todos los datos. Con el fn de que la clasfcacón esté ben hecha se deben construr de tal manera que el límte superor de un ntervalo concda con el límte nferor del sguente. Se debe adoptar el crtero de que los ntervalos sean cerrados por la zquerda y abertos por la derecha. El punto medo entre los etremos de cada ntervalo se llama marca de clase que será la varable que utlzaremos para el cálculo de los parámetros estadístcos.. Construccón de la tabla estadístca: En la tabla deberán fgurar los valores de la varable (y en caso de que se encuentre agrupada en ntervalos, los límtes superor e nferor, así como las marcas de clase), frecuencas absolutas y frecuencas relatvas. A veces es convenente nclur las frecuencas absolutas acumuladas y las frecuencas relatvas acumuladas. En muchas ocasones es nteresante trabajar con porcentajes; éstos se obtenen multplcando las frecuencas relatvas por 00. I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

Gráfcos estadístcos Los gráfcos tenen un mayor poder de comuncacón de los resultados al utlzar formas vsuales de fácl comprensón (la nformacón entra por los ojos). La clardad que requere un gráfco hace que no sea ndferente el modelo utlzado. Según como sea la naturaleza del carácter estudado, utlzaremos uno u otro tpo de representacón gráfca. Dagrama de barras Recbe el nombre de dagrama de barras el gráfco que asoca a cada valor de la varable una barra estrecha, generalmente vertcal, de longtud proporconal a la frecuenca (o a la cantdad) con que se presenta. Suele usarse cuando la varable es dscreta. Ejemplo: Las notas de matemátcas de los 3 alumnos de una clase venen dadas por la sguente tabla: 0 Calfcacones MD Nºdealumnos 8 Ins 6 Suf Ben 6 4 Not Sob 0 MD Ins Suf Ben Not Sob Ejemplo En un barro de certa cudad se ha dado la sguente dstrbucón. Año Jóvenes mayores de años Estudantes de Bachllerato 00 40 00 37 003 30 3 004 39 4 00 4 7 006 4 6 007 0 0 008 8 En este caso este una coneón entre los dos caracteres estudados, pues los alumnos de Bachllerato son todos mayores de años. I.E.S. Hstorador Chabás -6- Juan Bragado Rodríguez

60 Jovenes Estudantes 0 40 30 0 0 Hstogramas 0 00 00 003 004 00 006 007 008 Los hstogramas son dagramas de barras que se utlzan específcamente para dstrbucones de varable estadístca contnua, o ben para dstrbucones de varable estadístca dscreta con gran número de datos y que se han agrupado por ntervalos (clases). Generalmente se acostumbra a agrupar los datos obtendos en ntervalos de gual ampltud. Estos gráfcos asocan a cada ntervalo un rectángulo de superfce proporconal a la frecuenca correspondente a dcho ntervalo. Para construr el hstograma se representa sobre el eje de abscsas los límtes de los ntervalos. Sobre dcho eje se construyen unos rectángulos que tenen por base la ampltud del ntervalo y por alturas los cocentes entre las frecuencas absolutas y las longtudes de los ntervalos correspondentes (densdad de frecuenca). De esta manera, el área del rectángulo concde con la frecuenca del ntervalo. Intervalos de la msma ampltud (alturas drectamente proporconales a la frecuenca) En un grupo de 40 alumnos se ha estudado su talla, obtenéndose los resultados de la tabla adjunta. Intervalos en cm. f [ ) [ ) [ ) [ ) [ ) [ ) [ ) [ ) 0, ',60 7' 3 60,6 6' 4 6,70 67' 7 70,7 7' 7,80 77' 8 80,8 8' 4 8,90 87' 40 0 8 6 4 0, 7, 6, 67, 7, 77, 8, 87, I.E.S. Hstorador Chabás -7- Juan Bragado Rodríguez

Intervalos de dstnta ampltud Cuando los ntervalos sean de dstnta ampltud, las alturas de los rectángulos deben ser sempre gual a la densdad de frecuenca. En el ejemplo sguente se observa que no todos los ntervalos tenen la msma ampltud. El últmo ntervalo tene una ampltud de 0 y por tanto la altura del rectángulo es de 0' que es el resultado de dvdr la frecuenca del ntervalo, en este caso, entre la anchura del msmo, 0. Observa que el producto de la ampltud por la altura del rectángulo da la frecuenca ndcada en la fgura. Ejemplo: En un grupo de 4 alumnos se ha estudado su talla, obtenéndose los resultados de la tabla adjunta.,0,00 Intervalos [,60) [ 60,6) [ 6,70) [ 70,7) [ 7,9) f 9 7 0 4 d 8 4 0,0,00 0,0 0,00 7, 6, 67, 7, 77, 8, 87, 9, Polígono de frecuencas Se consdera polígono de frecuencas a la línea polgonal (línea quebrada) que une los puntos correspondentes a las frecuencas de cada valor de la varable estadístca, o de los etremos superores de las barras. S los datos venen dados en ntervalos, unrá los puntos correspondentes a las marcas de clase. Ejemplo: En un grupo de 40 alumnos se ha estudado su talla, obtenéndose los resultados de la tabla adjunta. Intervalos f [ 0,), [,60) 7, 3 [ 60,6) 6, 4 [ 6,70) 67, 7 [ 70,7) 7, [ 7,80) 77, 8 [ 80,8) 8, 4 [ 8,90) 87, Totales 40 0 8 6 4 0, 7, 6, 67, 7, 77, 8, 87, I.E.S. Hstorador Chabás -8- Juan Bragado Rodríguez

Dagramas de sectores En los gráfcos de dagramas de sectores cada suceso vene representado por un sector crcular de ampltud proporconal a su frecuenca absoluta. La ampltud de cada sector se obtene medante una senclla regla de tres. Los dagramas de sectores son especalmente adecuados para representar las dstntas partes de un todo y para representar varas stuacones smlares y poder establecer comparacones. El dagrama de sectores correspondente al ejemplo anteror es: 4 360º º 4 360º 9 º 4 360º 7 º 4 360º 0 º 4 360º º = 94 8º = 77 4º = 60º = 8 7º = 4 8º Prámdes de poblacón Son un caso partcularmente mportante de hstogramas. En realdad se trata de dos hstogramas de dstrbucón de edades, uno para hombres y otro para mujeres. Se utlzan para estudar conjuntamente la varable edad y el atrbuto seo. En el eje de ordenadas se representa los ntervalos de edades cuya anchura puede ser anual, qunquenal o decenal, dependendo del detalle necesaro. En el eje de abscsas se representa el seo. Para la modaldad mujer se toma el semeje postvo, y para la modaldad hombre el semeje negatvo. Pctogramas Los pctogramas son gráfcos en los que utlzan dbujos alusvos a la dstrbucón que se pretende estudar, y que medante su forma, tamaño, etc., ofrecen una descrpcón lo más epresva posble de la dstrbucón estadístca Cartogramas Se llama cartograma a los gráfcos que se realzan sobre un mapa, señalando sobre determnadas zonas con dstntos colores o rayados lo que se trata de poner de manfesto. Por ejemplo, se suelen utlzar este tpo de dagramas para representar la densdad demográfca de una nacón, la renta per cápta, las horas de sol anuales sobre una determnada parte de la terra, los índces de lluvas de una nacón, etc. I.E.S. Hstorador Chabás -9- Juan Bragado Rodríguez

Parámetros estadístcos Los parámetros estadístcos resumen en un número un aspecto relevante de la dstrbucón estadístca que pueda dar una dea de la msma o compararla en ese aspecto, con otras. Evdentemente, todo proceso de síntess conlleva una pérdda de nformacón; pero se gana en el hecho de que es más fácl trabajar con unos pocos parámetros con sgnfcado muy precso que con la totaldad de los datos. Los parámetros estadístcos suelen clasfcarse, según el papel que juegan, de la sguente manera: Meddas de Centralzacón O de tendenca central, ndcan valores con respecto a los que los datos parecen agruparse. Las más mportantes son: Moda (el valor que se presenta con mayor frecuenca), Meda Artmétca (suma de todos los valores de una varable estadístca dvddo por el número de valores), Meda Geométrca, Meda Armónca y Medana (el valor del ndvduo que ocuparía el lugar central s se colocaran ordenados de menor a mayor). Meddas de Dspersón Srven para medr el grado de alejamento (dspersón) de los datos. Son la Desvacón Meda, Varanza, Desvacón Típca, Rango, etc. Meddas de Poscón Dvden un conjunto ordenado de datos en grupos con la msma cantdad de ndvduos. Son los Cuantles (Cuartles, Decles, Percentles, etc.). Meda artmétca Se llama meda artmétca de una varable estadístca a la suma de todos los valores de dcha varable dvdda por el número de valores. Sea una varable estadístca que toma los valores,, 3,..., n con frecuencas absolutas f, f, f 3,..., f n respectvamente. La meda artmétca de la varable se representa por, y vene dada por la sguente epresón: f + f + LLLL + f n n = = n f + f +...+ f n S la varable es contnua, o aún sendo dscreta, y por tratarse de muchos datos se encuentran agrupados en clases, se toman como valores,,,..., las marcas de clase. = n = f 3 n Ejemplo: Las calfcacones en la asgnatura Hstora del Arte de los 40 alumnos de una clase vene dada por la tabla adjunta. Hallar la calfcacón meda. f I.E.S. Hstorador Chabás -0- Juan Bragado Rodríguez

Calfcacones 3 4 6 7 8 9 Númerode alumnos 4 8 9 3 4 3 En la práctca, los cálculos se dsponen de la sguente forma: La meda artmétca será: + + 34 + 4 + 8 + 69 + 73 + 84 + 93 = = = 3 ' 40 40 Luego la calfcacón meda en Hstora del Arte es ' 3 Meda ponderada Hasta aquí hemos consderado todos los datos con la msma mportanca, es decr, como s todos ellos tuveran la msma fabldad. No obstante, puede suceder que en algún caso, debdo al crtero adoptado o a las crcunstancas en que se obtuveron los datos, sea necesaro dar más mportanca a unos datos que a otros. En este caso, la meda se llama meda ponderada y su epresón es: f a + f a + LLLL + f a n n n = = n fa + f a +...+ f na n = n = f a donde a son las dstntas ponderacones o pesos que se adjudcan a los datos. Ejemplo: En un curso de ESO los alumnos durante un período evaluatvo han realzado las sguentes pruebas: un eamen, dos controles y tres ntervencones en clase. Las pruebas, según acuerdo del Semnaro, se valoran de la sguente forma: 0% el eamen, 30% los controles y 0% las ntervencones. S un determnado alumno ha obtendo: 7 en el eamen, 6 y 8 en los controles y 0, y en las ntervencones, obtener su nota meda de la evaluacón. f a 030 ' 7 0 ' + ( 6+ 8) + ( 0 + + ) = 0+ 030 ' + 3 00 ' ' 3 0 ' 3 = 6'73 S en este msmo ejemplo hubésemos consderado todas las notas con la msma mportanca, la nota meda obtenda sería: 7 = + 6 + 8 + 0 + + = 6 I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez 633 '

Moda Se llama moda de una varable estadístca al valor de dcha varable que presenta mayor frecuenca absoluta. Se representa por M. 0 La moda no tene por qué ser únca, puede haber varos valores de la varable con la mayor frecuenca. En este caso se drá que la dstrbucón es bmodal, trmodal, etc., según que sean, 3, etc. los valores de la varable que presentan mayor frecuenca. Tambén se aplca este nombre a dstrbucones en las que destacan varos valores con frecuencas muy altas, práctcamente guales, aunque no todas sean mámas. S los datos están agrupados hablaremos del ntervalo que más se repte o ntervalo modal. S los ntervalos son de ampltud varable, tenemos que susttur la frecuenca de cada ntervalo por su correspondente densdad de frecuenca, que como sabemos es el cocente entre la frecuenca y la ampltud del ntervalo. Aquí, la clase modal será la clase que tenga mayor densdad de frecuenca. Ejemplo: Consderemos la sguente dstrbucón: Intervalos f 0 4 0 4 0 00 0 0 80 0 40 60 40 70 40 Construmos la tabla con las densdades de frecuenca, ya que la ampltud de los ntervalos no es constante. La moda está en el ntervalo 0 0 por ser el que presenta, mayor densdad de frecuenca. Al ntervalo que contene la moda se le llama clase modal o ntervalo modal. La Moda es, apromadamente, la marca de clase correspondente a dcho ntervalo, es decr: M o = Intervalos 0 4 0 4 0 7 00 6 6 0 0 80 8 0 40 30 60 3 40 70 40 8 n = 800 = 30 σ n = 7 98 f d Medana S los datos de la muestra estudada se ordenan sguendo un crtero de crecmento o decrecmento, se denomna medana al valor del dato que ocupa el lugar central, o dcho de otro modo, la I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

medana es el valor que dvde a la sere de datos en dos partes eactamente guales. Se representa con el símbolo M. e La Medana es el prmer parámetro de centralzacón que depende del orden de los datos y no de sus valores. Como consecuenca de la defncón, se tene que el 0% de los datos son menores o guales a la Medana y el 0% restante son mayores o guales. Cálculo de la Medana a través del polígono de porcentajes acumulados Los polígonos de porcentajes acumulados son útles para calcular parámetros estadístcos como la Medana y los Percentles. Los porcentajes acumulados se obtenen al multplcar la frecuenca absoluta acumulada por 00 y dvdr el resultado por la suma de todas las frecuencas absolutas. Representamos el polígono de porcentajes acumulados, stuando en el eje los valores de la varable (s es dscreta) o de los ntervalos (s es contnua) y en el eje y la frecuenca absoluta acumulada en porcentaje. Para obtener la Medana se traza desde el punto ( 0,0), correspondente al 0 %, una paralela al eje "". Ésta corta al polígono de frecuencas absolutas acumuladas en un punto; por éste se traza una paralela al eje "y", que corta al eje "" en el punto buscado. Ejemplo: Calcular la Medana en el ejemplo sobre el test de satsfaccón en el trabajo que se ha aplcado a 88 empleados de una fábrca. F 00 f 8' 4 6 9 ' = = 336 ' Por lo tanto la medana será: M e = 6 + 3' 36 = 9'36 I.E.S. Hstorador Chabás -3- Juan Bragado Rodríguez

Rango o recorrdo Se llama rango o recorrdo de una dstrbucón a la dferenca entre el mayor y el menor valor de la varable estadístca. Bajo el supuesto de que los valores de la varable estén ordenados en sentdo crecente, su epresón matemátca sería: R = n Varanza y Desvacón típca de una poblacón Se llama varanza de una varable a la meda artmétca de los cuadrados de las desvacones respecto a la meda y se representa con el símbolo σ. La fórmula que nos da la varanza de una po- blacón es: σ = n f = n = La meda artmétca es el centro de gravedad de la dstrbucón estadístca. S nos magnamos el dagrama de barras o el hstograma de frecuencas apoyado en un punto del eje horzontal de forma que quedase en equlbro, el valor de este punto en dcho eje sería el valor de la meda. No es sufcente con un parámetro de centralzacón, es necesaro un parámetro de dspersón que nos ndque s los datos estudados están más concentrados o más dspersos. El parámetro que mde la mayor o menor dspersón de los datos respecto de la meda se llama la Desvacón típca y corresponde a la raíz cuadrada de la varanza. Lógcamente s los datos están más concentrados en torno a la meda artmétca la desvacón típca será menor, y s los datos están más dspersos la desvacón típca será mayor. σ = n f = f = n En la calculadora la desvacón típca vene representada por el símbolo σ ó σn y representa la desvacón típca de la poblacón que estamos estudando. Ejemplo: El número de horas que dedca al estudo un alumno de º de Bachllerato durante la semana es el sguente: 3',, 4, 6, ', 3. Calcular el rango, la varanza y la desvacón típca. Rango: 6 3= 3 Desvacón típca: σ = ' 6 = ' 08 I.E.S. Hstorador Chabás -4- Juan Bragado Rodríguez f f 8' Varanza: σ = = 4' = ' 6 f 6 f 7 Meda: = = = f 6 4 '

Ejemplo: Se ha aplcado un test sobre satsfaccón en el trabajo a 88 empleados de una fábrca, obtenéndose los resultados de la tabla adjunta. Calcular el rango, la varanza y la desvacón típca. Rango: 80 38 = 4 04 Meda: = = 88 9' 4 Varanza: σ = 88' 73 Desvacón típca: σ = 88 '73 = 9'4 Muestra. Desvacón típca de una muestra Para conocer la ntencón de voto de los cudadanos ante unas eleccones no se puede preguntar a todos los electores porque la poblacón es muy grande. S queremos comprobar s funconan todas las bombllas que fabrca una determnada empresa es absurdo probarlas todas para realzar el epermento. En stuacones en las que no se pueden observar todos los ndvduos de una poblacón, se hace necesaro elegr una muestra, para conocer las característcas de la poblacón. Una muestra es una parte de la poblacón que srve para representarla. Los métodos más empleados para elegr muestras son los métodos aleatoros que dependen del azar. Para determnar el tamaño de una muestra esten procedmentos estadístcos basados en la dspersón de los datos: cuanto mayor nos parezca la desvacón típca de una poblacón, más grande debe ser la muestra que se elja. s σ n En la calculadora la desvacón típca de una muestra vene representada por el símbolo ó. I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

El coefcente de varacón La dspersón de los datos en una poblacón no puede determnarse eclusvamente a partr de la desvacón típca, pues no sempre una desvacón típca mayor ndca mayor dspersón. Por ejemplo, la desvacón típca del peso de un grupo de caballos suele ser mayor que la desvacón típca del peso de un grupo de conejos. Parece evdente que habrá que tener en cuenta las medas de los pesos de ambos grupos de anmales, para establecer algún tpo de comparacón relatva o proporconal. Una medda de la dspersón relatva de dos conjuntos de datos es el coefcente de varacón, que se defne como: σ CV = El coefcente de varacón se usa para comparar la dspersón de dstrbucones que tenen dferentes medas y dstntas desvacones. Dados dos conjuntos, aquel que tenga un coefcente de varacón mayor es el más dsperso, el más heterogéneo. Su valor no depende de la undad de medda utlzada. σ El coefcente de varacón suele darse en porcentajes: CV = 00. Un porcentaje del 30% ndca que la meda es poco representatva como medda del promedo, debéndose optar por la Medana o la Moda. Ejemplo: Se han meddo los pesos y las alturas de 6 personas, obtenéndose los datos de la tabla adjunta. Qué están más dspersos, los pesos o las alturas? Calculamos la meda y la desvacón típca de cada varable: Pesos (kg) 6 60 63 63 68 68 Alturas (m) 7 7 7 7 8 P = 64 kg σ P = 87 kg A = 69 m σ A = 0 093 m Para comparar la dspersón, hallamos el coefcente de varacón: CV P σ = P P = 87 64 = 0 044 4 4 % CV A σ = A A 0 093 = = 0 0 69 % Se observa que las alturas están más dspersas que los pesos, y sn embargo, la desvacón típca de los pesos es mayor que la de las alturas. Agrupacón de datos en torna a la meda artmétca S una dstrbucón tene una sola moda y es smétrca, es decr, cuando el hstograma tene forma de campana, llamada Campana de Gauss, se dce que la varable aleatora se dstrbuye normalmente (altura de los ndvduos de una poblacón, peso, coefcente ntelectual, etc.). En una dstrbucón normal se puede hacer una clasfcacón de la poblacón utlzando estos ntervalos: I.E.S. Hstorador Chabás -6- Juan Bragado Rodríguez

3σ σ σ + σ + σ + 3σ Valores muy bajos Valores bajos Valores normales 68% Valores altos Valores muy altos 9% 98% Meddas de poscón. Cuantles Al estudar la Medana hemos vsto que, una vez ordenados de menor a mayor los datos de una dstrbucón, la medana dvde a éstos en partes guales. Análogamente, tene nterés estudar otros parámetros que dvdan a los datos de la dstrbucón en funcón de otras cuantías. Recben genércamente la denomnacón de cuantles aquellos valores que dvden la dstrbucón en ntervalos, de forma que cada uno de ellos tenga la msma frecuenca. Los cuantles toman denomnacones específcas según sea el número de ntervalos en que se dvde la dstrbucón. así: Cuartles Se llama cuartles a tres valores que dvden a la sere de datos en cuatro partes guales, contenendo cada una de ellas el % de la poblacón. Se representan por Q,Q yq3 y se desgnan cuartl prmero, segundo y tercero respectvamente. Los cuartles Q, Q, y Q3 son los valores que superan, eactamente, al %, 0% y 7% de los valores de la dstrbucón respectvamente. El cuartl Q concde con la medana de la dstrbucón. Hay dos valores, uno que separa a la poblacón en un % por debajo y un 7% por encma, y el otro que deja por debajo al 7% y por encma al % de la poblacón. Se llaman cuartl nferor (CI) y cuartl superor (CS), y corresponden a Q y Q3 respectvamente. S el problema que estudamos son las notas en una determnada asgnatura "Estar por encma del cuartl superor" sgnfca estar entre el % de los mejores. Decles Percentles Se llama decles a nueve valores que dvden a la sere de datos en dez partes guales, contenendo cada una de ellas la décma parte de la poblacón. Se representan por D,D, LLL,D9 y se desgnan decl prmero, segundo, tercero,cuarto,..., y noveno respectvamente. Hablar del decl 4 sgnfca dejar por debajo del valor que representa al 40% de la poblacón. Se llaman centles o percentles a 99 valores que dvden a la sere de datos en cen partes guales. Se representan por P,P, LLL,P9 9 y se desgnan percentl prmero, segundo, tercero, cuarto,..., y nonagésmo noveno respectvamente. Hablar del centl 38 sgnfca dejar por debajo del valor que representa al 38% de la poblacón. Cuando se dce "Según su ntelgenca abstracta este chco está en el centl 8" sgnfca que su ntelgenca abstracta, es superor a la del 8% de la poblacón e nferor al % restante. Los centles son muy utlzados por los pscólogos para dar los resultados de los tests En una tabla de frecuencas con datos agrupados en ntervalos, suponemos que los datos de cada ntervalo se reparten unformemente en él. Así, s en un ntervalo de ampltud L hay n elementos, supondremos que la dstanca entre cada uno es L/n. Según esto, los valores de las frecuencas acu- I.E.S. Hstorador Chabás -7- Juan Bragado Rodríguez

muladas deben asgnarse a los etremos superores de los ntervalos, pues es al fnal de cada ntervalo cuando se han contablzado todos los ndvduos. A contnuacón se representa un gráfco donde se muestran las relacones entre los dstntos cuantles. Obsérvese que la Medana concde con el cuartl segundo ( ) de orden cncuenta ( P 0 ), es decr: M Q D P e = = = 0 Q, el decl qunto ( y el percentl D ) Ejemplo Las calfcacones en Matemátcas de 3 4 los 40 alumnos de una clase venen f 4 8 dadas por la tabla adjunta. a) Calcular los cuartles º y 3º y los percentles de orden 30 y 70. b) Cuál es el valor de la Medana? 6 9 7 3 8 4 9 3 a) Calculamos las columnas correspondentes a la frecuencas absolutas acumuladas y al porcentaje de frecuencas absolutas acumuladas. Cuartl º El cuartl prmero corresponde al percentl y es Q = P = 4 por ser éste el prmer valor de la varable cuyo porcentaje de frecuenca absoluta acumulada ecede al %. Cuartl 3º El cuartl tercero corresponde al percentl 7 que concde con un valor del porcentaje de frecuencas absoluta acumuladas para = 6. El cuartl es la semsuma del valor de la varable correspondente a dcha frecuenca y el sguente. Percentl 30 El percentl 30 es: P 30 = 4 por ser éste el prmer valor de la varable cuyo porcentaje de frecuenca absoluta acumulada ecede al 30%. Percentl 70 I.E.S. Hstorador Chabás -8- Juan Bragado Rodríguez

El percentl 70 es: P 30 = 6 por ser éste el prmer valor de la varable cuyo porcentaje de frecuenca absoluta acumulada ecede al 70%. b) La Medana corresponde al percentl 0, es decr, M e = P0. El prmer valor de la varable cuyo porcentaje de frecuenca absoluta acumulada ecede al 0% es el por tanto M e =. Cálculo gráfco de los Percentles Debdo a que los Percentles son parámetros del tpo de la Medana, su cálculo se realza de forma análoga. Representamos el polígono de porcentajes acumulados, stuando en el eje los valores de la varable (s es dscreta) o de los ntervalos (s es contnua) y en el eje y la frecuenca absoluta acumulada en porcentaje. Para calcular un percentl pk, se señala el porcentaje correspondente k, en el eje vertcal, que está graduado de 0 a 00. Por este punto, se traza una paralela al eje X que corta al polígono de frecuencas absolutas acumuladas en un punto; por este punto se traza una paralela al eje "Y", que corta al eje "X" en el punto buscado p k. Para calcular numércamente, de forma eacta, el valor de p k, no hay más que razonar adecuadamente con los valores del ntervalo correspondente y aplcar una semejanza de trángulos. Ejemplo: Se ha aplcado un test sobre satsfaccón en el trabajo a 88 empleados de una fábrca, obtenéndose los sguentes resultados: Puntuacones Nº de [ 38 44) 7 [ 44 0) 8 [ 0 6) [ 6 6) [ 6 68) [ 68 74) 9 [ 74 80) 6 trabajadores 8 a) Calcular el cuartl nferor, el decl 7 y el percentl de orden 90. b) Qué centl corresponde a 4 puntos? Cuartl nferor El cuartl nferor corresponde al percentl. 7' 0 6 796 ' = = ' 80 Q = 0 + ' 80= ' 80 I.E.S. Hstorador Chabás -9- Juan Bragado Rodríguez

Decl 7 El decl 7 corresponde al percentl 70. 0' 4 6 7 ' = = 0 ' D 7 = 6 + ' = 64' Percentl 90 0' 3 6 70 ' = = 43 ' P 90 = 68 + 43 ' = 73 ' Qué centl corresponde a 4 puntos? 909 ' = = ' 6 79 ' + ' = 946 ' Corresponde apromadamente al centl 9. I.E.S. Hstorador Chabás -0- Juan Bragado Rodríguez

Dagramas de caja y bgotes Un gráfco de caja y bgote es una representacón gráfca que permte estudar la smetría o asmetría de una dstrbucón así como la dspersón de los datos. Por su facldad de construccón e nterpretacón, permte comparar a la vez varos grupos de datos, sn saturarse de ellos. La sguente gráfca corresponde a la dstrbucón de notas de un eamen de matemátcas. En la parte superor fgura la escala sobre la que se mueve la varable y en la parte nferor está el dagrama de caja y bgotes. La poblacón total se parte en 4 trozos, cada uno de ellos con el % de los ndvduos, prevamente ordenados de menor a mayor. El 0% de los valores centrales se destacan medante un rectángulo (caja), donde el lado más largo del rectángulo muestra el recorrdo ntercuartílco (desde Q a Q3 ). Este rectángulo está dvddo por un segmento vertcal que ndca la poscón de la Medana y por lo tanto su relacón con los cuartles prmero y tercero. S la Medana está relatvamente en el centro de la caja se dce que la dstrbucón es Smétrca. S la medana está consderablemente más cerca del prmer cuartl ndca que los datos son postvamente asmétrcos (la meda suele ser mayor que la medana en estos casos). S la medana está consderablemente más cerca del tercer cuartl ndca que los datos son negatvamente asmétrcos (la meda suele ser menor que la medana en estos casos). Los valores etremos (el % de los menores y el % de los mayores) se representan medante sendos segmentos llamado bgotes. Los bgotes se trazan hasta abarcar la totaldad de los ndvduos, con la condcón de que cada lado no se alargue más de una vez y meda la longtud de la caja. Tukey (997) sugere una regla senclla para determnar los límtes de los bgotes. Esten límtes nterores y límtes eterores. Los límtes nterores son barreras hasta las cuales se permten datos de la muestra por estar muy cerca del resto y son los que defnen los etremos de los bgotes. Los límtes se construyen de la sguente manera: Límte nteror nferor = Límte del bgote nferor = Q (Q3 Q) Límte nteror superor = Límte del bgote superor = Q3 + (Q3 Q) Límte eteror nferor = Q 3 (Q3 Q) Límte eteror superor = Q3 + 3 (Q3 Q) S esten valores de la varable comprenddos entre los límtes nterores y eterores se consderan valores atípcos y se ndcan con un astersco (*). S esten valores fuera de los límtes eterores se consderan valores todavía más atípcos y se ndcan con un punto (o ). La caja y los bgotes se colocan paralelos a un eje rotulado a una escala determnada. I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

Ejemplo: La varable () de la tabla adjunta representa el número de hjos de una famla y la frecuenca (f) el número de famlas que tenen esa cantdad de hjos. Representar la dstrbucón medante un dagrama de caja. f 0 0 0 4 3 9 4 4 6 Completamos la tabla con las frecuencas absolutas acumuladas y con el porcentaje de frecuencas absolutas acumuladas. Calculamos los valores mínmo, mámo y los cuartles correspondentes a las estaturas. = 0 Q = M = Q Q = 3 6 mn = La longtud de la caja es: 3 má = 0 3 4 6 f 0 0 4 9 4 F 0 30 7 00 4 9 0 00 F 0 8 33 9 6 83 33 9 99 6 00 Q = 3 = (Q Q ) = = Q 3 Para calcular los etremos de los bgotes tenemos: 3 = 0 7 < 0 y 3 + = < 6 El valor mínmo de la dstrbucón es 0, que es mayor que el límte nferor 0 7, por lo tanto 0 se tomará como valor etremo del bgote de la zquerda. El valor mámo de la dstrbucón es 6, que es mayor que el límte superor, por lo tanto se tomará como etremo del bgote de la derecha. Por tanto, los etremos de los bgotes son: 0 y La famla que tene 6 hjos se encuentra fuera del etremo superor del bgote y la representamos medante un astersco (*). El astersco señala la stuacón del ndvduo atípco de la poblacón correspondente al número de hjos. De la observacón del dagrama se puede conclur que: El bgote de la derecha es más largo que el de la zquerda, lo que ndca que hay más famlas que tenen menos hjos. Las pulsacones que se hallan entre el 0% y el 7% de los datos (parte derecha de la caja) están más dspersas que entre el % y el 0% (parte zquerda de la caja). Al estar la medana más cerca del prmer cuartl ndca que los datos son postvamente asmétrcos. I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

Ejemplo: Representa la sguente dstrbucón de las estaturas de los 40 alumnos de una clase medante un dagrama de caja: 49 0 4 6 7 8 9 60 60 60 6 6 6 63 63 63 63 64 6 66 66 66 67 67 67 68 68 68 69 69 70 70 70 7 7 73 74 7 7 89 Completamos la tabla con las frecuencas absolutas acumuladas y con el porcentaje de frecuencas absolutas acumuladas. 49 0 f F % Calculamos los valores mínmo, mámo y los cuartles correspondentes a las estaturas. 4 6 3 4 7 0 = 49 Q = 60 M = Q mn = 66 7 8 6 Q = 69 La longtud de la caja es: 3 má = 89 9 60 6 3 7 0 7 7 Q Q = 69 60 3 = 9 6 63 4 3 7 3 4 (Q3 Q) = 9 = 3 Para calcular los etremos de los bgotes tenemos: 64 6 66 3 8 9 4 47 60 3 = 47 < 49 67 68 3 3 8 6 70 69 + 3 = 83 < 89 69 30 7 El valor mínmo de la dstrbucón es 49, que es mayor que el límte nferor 47, por lo tanto 49 se tomará como valor etremo del bgote de la zquerda. El valor mámo de la dstrbucón es 89, que es mayor que el límte superor 83, por lo tanto 83 se tomará como etremo del bgote de la derecha. Por tanto, los etremos de los bgotes son: 49 y 83. 70 7 7 73 74 7 3 33 34 3 36 37 39 8 8 87 90 9 97 89 40 00 El estudante que mde 89 cm queda fuera del etremo superor del bgote. Este valor se representa en el dagrama de caja medante un astersco (*), que señala la stuacón de los ndvduos atípcos de la poblacón de estudantes. I.E.S. Hstorador Chabás -3- Juan Bragado Rodríguez

Los dagramas de caja son especalmente útles para efectuar comparacones entre dos o más conjuntos de datos. Ejemplo: Comparar medante dagramas de cajas la edad de dos colectvos de 0 personas. Dstrbucón 3 38 3 8 30 9 7 9 48 40 39 4 4 34 6 4 9 48 8 Dstrbucón 36 37 4 39 0 36 4 3 3 39 4 9 3 4 40 33 4 34 40 Dstrbucón Hacendo la tabla correspondente obtenemos como resultados: mn = 9 Q = 6 M = Q = 9 Q3 = 38 má = 48 La longtud de la caja es: Q = 38 6 = (Q Q ) = = 8 7 Q 3 Para calcular los etremos de los bgotes tenemos: 3 6 8 7 = 7 7 < 9 38 + 8 7 = 7 > 48 El valor mínmo de la dstrbucón es 9, que es mayor que el límte nferor, por lo tanto 9 se tomará como valor etremo del bgote nferor. El valor mámo de la dstrbucón es 48, que es menor que el límte superor, por lo tanto 48 se tomará como etremo del bgote superor. Dstrbucón Hacendo la tabla correspondente obtenemos como resultados: mn = 0 Q = 4 M = Q = 33 Q3 = 39 má = 4 La longtud de la caja es: Q = 39 4 = 4 (Q Q ) = 4 = 6 7 Q 3 Para calcular los etremos de los bgotes tenemos: 3 4 6 7 = 7 7 < 0 39 + 6 7 = 4 7 > 4 El valor mínmo de la dstrbucón es 0, que es mayor que el límte nferor, por lo tanto 0 se tomará como etremo del bgote nferor. El valor mámo de la dstrbucón es I.E.S. Hstorador Chabás -4- Juan Bragado Rodríguez

4, que es menor que el límte superor, por lo tanto 4 se tomará como etremo del bgote superor. S observamos la caja de la D, la parte nferor de la caja es menor que la superor, lo que quere decr que las edades comprenddas entre el % y el 0% de la poblacón están más agrupadas que entre el 0% y el 7%. S observamos la caja de la D, la parte nferor de la caja es mayor que la superor, lo que quere decr que las edades comprenddas entre el % y el 0% de la poblacón están más dspersas que entre el 0% y el 7%. S observamos la caja de la D, el bgote nferor es más corto que el superor, por ello el % de los más jóvenes están más concentrados que el % de los mayores. S observamos la caja de la D, el bgote nferor es más corto que el superor, por ello el % de los más jóvenes están más concentrados que el % de los mayores. S observamos la caja de la D, el rango ntercuartílco es Q3 Q = lo que sgnfca que el 0% de la poblacón está comprendda en años. S observamos la caja de la D, el rango ntercuartílco es Q3 Q = 4 lo que sgnfca que el 0% de la poblacón está comprendda en 4 años. I.E.S. Hstorador Chabás -- Juan Bragado Rodríguez

Es necesaro destacar que, a veces, las meddas de centralzacón no sempre son una descrpcón adecuada de todos los datos de una dstrbucón. Para ello veamos a contnuacón, con alguna varante, un anecdótco ejemplo epuesto por J. C. Stanley en Measurement n Today's Schools. En certa ocasón se sentaron cnco hombres en un banco de un parque. Dos de ellos eran vagabundos y todos sus benes ascendían a 0 cada uno. El tercero era un obrero que no tenía más propedades que una cuenta bancara con 000. El cuarto era un admnstratvo que entre su vvenda y su cuenta bancara tenía unos benes valorados en 0000. El qunto era un agracado de la Prmtva que tenía un captal gual a 400000. Calcular las meddas de centralzacón. La sere estadístca es la sguente: 0; 0; 000; 0000; 400000 S calculamos las meddas de centralzacón de esta sere estadístca se obtene: 0 + 0 + 000 + 0000 + 400000 = = 49004 M 0 = 0 M e = 000 Vemos que la meda no da una dea de cómo es la dstrbucón; tampoco la moda permte asegurar nada, pues s ben 0 son los benes del 40% de la dstrbucón (los dos vagabundos), este valor se encuentra muy lejos y es práctcamente nsgnfcante para el multmllonaro de la Prmtva. Por últmo, con el conocmento de la medana, que descrbe muy ben el captal del obrero, nada permte afrmar de los captales de los otros cuatro señores. Con el fn de evtar contradccones como la presente en la anécdota, se deben evtar grandes dferencas numércas entre los datos de una dstrbucón. Por otra parte, los parámetros estadístcos de una dstrbucón nforman mejor de ésta cuanto mayor es el número de datos. I.E.S. Hstorador Chabás -6- Juan Bragado Rodríguez

Calculadora centífca Para vsualzar o bajarte de Internet los manuales de los dstntos modelos de las calculadoras CA- SIO r a la págna web: http://world.caso.com/calc/download/es/manual/ Modelo MS (f 8, f 83, f 8, f 70, f 300 y f 30) Ejemplo Calcular σ, σ,, n, y para los datos sguentes: n n, 4,,, 3, 3, 4, Solucón Ponemos la calculadora en modo estadístco: SD Borramos todos los datos anterores: SHIFT CLR (Scl) = (Stat clear) Introducmos los datos como se ndca en el apartado c). DT 4 DT DT DT 3 DT 3 DT 4 DT DT Para realzar los cálculos que nos pde el problema pulsamos en la calculadora las teclas tal como se ndca en los apartados e), f) y g). I.E.S. Hstorador Chabás -7- Juan Bragado Rodríguez

Modelo ES (f 8, f 83, f 8, f 300 y f 30) I.E.S. Hstorador Chabás -8- Juan Bragado Rodríguez

Ejemplo de tabla estadístca para una varable estadístca dscreta Un profesor tene anotadas en su cuaderno las notas de los 30 alumnos de una clase. 3 4 8 9 8 7 6 6 7 8 9 7 7 0 9 9 8 0 8 8 8 9 7 a) Completa la tabla sguente. b) Haz un dagrama de barras y dbuja un dagrama de sectores. c) Calcula la meda, la medana, la moda, la desvacón típca y el coefcente de varacón. d) Calcula los cuartles, el decl 4, el percentl 80 y el percentl 60. f f r % F F r Grados 00 F f r 360º 30 30 00 30 00 360º Solucones c) f = 7 f = 77 = 8333 σ = 9 M = 8 M 7 o e = σ CV = 9 = = 0 009 8333 n 7 + 8 d) Q = P = 4 Q = M e = 7 Q3 = P7 = 8 D 4 = P40 = 6 P80 = 8 P60 = = 7 I.E.S. Hstorador Chabás -9- Juan Bragado Rodríguez

Ejemplo de tabla estadístca para una varable estadístca contnua Las edades de las personas que acuden a un logopeda a lo largo de un mes son las de la tabla adjunta. 3 3 4 3 4 6 7 3 4 3 6 7 4 4 3 6 9 3 6 7 6 3 6 6 a) Completa la tabla sguente. b) Representa los datos medante un hstograma y dbuja un dagrama de sectores. c) Calcula la meda, la medana, la moda, la desvacón típca y el coefcente de varacón. d) Calcula el cuartl superor, los decles 3 y 7 y los percentles 0, 40 y 90. Hay 36 datos, por tanto el número de ntervalos que debemos formar es 36 = 6. El valor menor de la dstrbucón es y el mayor es 9 la dferenca es 7. El número entero más prómo a 7 por eceso que es dvsble entre 6 es 30 por tanto los ntervalos deben tener de ampltud 30 6 =. S comenzamos el prmer ntervalo en el número que es el menor de la dstrbucón, el últmo ntervalo acaba en 3 (3 más que el mayor de la dstrbucón que es 9). S comenzamos el prmer ntervalo en el número, el últmo ntervalo acaba en 3 ( más que el mayor de la dstrbucón). Cualquera de las dos opcones son gualmente váldas Intervalos Marcas f f r % F F r Grados 00 F f r 360º 36-6 36 00 36 00 360º Solucones c) f = 34 f = 3 = 9 47 σ = 7 6 M = 3 M = 6 7 σ CV = 7 6 = = 0 804 9 47 n d) = P = 3 43 D = P = 4 76 D = P = 8 P = 3 P = 3 P 3 Q3 7 3 30 7 70 0 40 90 = I.E.S. Hstorador Chabás -30- Juan Bragado Rodríguez o e

Estadístca Inferencal. Muestra Salvo en el caso de poblacones pequeñas, pocas veces en una nvestgacón se cuenta con el tempo, los recursos y los medos para estudar una poblacón completa. A veces n squera podemos delmtar eactamente una poblacón, otras veces la poblacón total aún no este como sucede en los estudos sobre predccón. Estos motvos de tempo, coste, accesbldad a los ndvduos y complejdad de las operacones de recogda, clasfcacón y análss de los datos hacen que la gran mayoría de los proyectos de nvestgacón no estuden más que una parte representatva de la poblacón, denomnada muestra. Esto se puede hacer así porque, s se seleccona correctamente la muestra, ésta puede aportarnos nformacón representatva y eacta de toda la poblacón. Una muestra es una parte de la poblacón que srve para representarla. La estadístca nferencal o nductva plantea y resuelve el problema de establecer prevsones y conclusones váldas generales sobre una poblacón a partr de los resultados obtendos de una muestra. Utlza resultados obtendos medante la estadístca descrptva y se apoya fuertemente en el cálculo de probabldades. Los métodos más empleados para elegr muestras son los métodos aleatoros que dependen del azar. Para determnar el tamaño de una muestra esten procedmentos estadístcos basados en la dspersón de los datos: cuanto mayor nos parezca la desvacón típca de una poblacón, más grande debe ser la muestra que se elja. Ejemplo: En un centro escolar se desea conocer el nº de horas que estudan por térmno medo los 000 alumnos y alumnas del centro. Como resulta práctcamente mposble encuestarlos a todos se etrae una muestra de 00 alumnos y alumnas. Nos plantean tres métodos para etraer la muestra y debemos encontrar el más objetvo: a) El drector elge la muestra procurando que haya alumnos de todo tpo. b) Se elgen los 00 prmeros que llegan por la mañana al centro un día cualquera. c) Se numeran del al 000 y se elgen, al azar, 00 de ellos. El método a) tene el nconvenente de que depende de la subjetvdad del drector, lo que nunca debe ocurrr al elegr una muestra, ya que las deas de quen la elja nflurán en las conclusones que se etragan. El método b) tampoco es bueno ya que es posble que los 00 prmeros alumnos que lleguen a clase sean los más responsables y esto nfluya sobre sus métodos de estudo. El c) es el únco método váldo Se dce que un muestreo es aleatoro cuando los ndvduos de la muestra se elgen al azar, de modo que todos los ndvduos de la poblacón tenen la msma probabldad de ser elegdos. El muestreo aleatoro es el únco que garantza la fabldad de las conclusones que se obtengan. s σ n En la calculadora la desvacón típca de una muestra vene representada por el símbolo ó. I.E.S. Hstorador Chabás -3- Juan Bragado Rodríguez

Problemas resueltos de Estadístca Descrptva Problema Las calfcacones de un grupo de alumnos son: 0, 8, 3,,,, 4, 4, 6,, 7,, 0, 9,, 4,, 3, 7, 8,, 4,, 3, 8 ) Calcula la meda, la medana, la moda, la desvacón típca y el coefcente de varacón. ) Representa un dagrama de frecuencas y el dagrama de sectores. 3) Calcula los cuartles, el decl 7º y los percentles 30 y 80. Solucón f f r F F r 00 F 0 0,04 0,04 4 0,04 0,08 8 0,0 3 0,8 3 3 0, 0 0,40 40 4 4 0,6 4 0,6 6 3 0, 7 0,68 68 6 0,04 8 0,7 7 7 0,08 0 0,80 80 8 3 0, 3 0,9 9 9 0,04 4 0,96 96 0 0,04 00 σ CV = 6393 = = 0 787 4 6 n N Meda 4,6 Medana 4,00 Moda Desvacón típca,6393 Varanza 6,9664 Rango 0 Mínmo 0 Mámo 0 Percentles,00 30 3,00 0 4,00 70 6,00 7 7,00 80 7,0 4 Frecuenca 3 0 0 3 4 6 Calfcacones 7 8 9 0 I.E.S. Hstorador Chabás -3- Juan Bragado Rodríguez

Problema Realzada una encuesta en una cudad, se han agrupado los establecmentos hoteleros por el número de plazas que permten, obtenéndose la sguente tabla: ) Calcula la meda artmétca, la medana, la moda, la desvacón típca y el coefcente de varacón. ) Representa un hstograma de frecuencas y el dagrama de sectores correspondente. 3) Calcula los cuartles, los decles y 8 y los percentles 4 y 7. 4) Qué centl corresponde a 3 plazas? Solucón Plazas < 00 00 00 00 300 300 00 00 600 600 700 700 800 800 000 nº de hoteles 37 3 3 Intervalos f d f r F Fr 00 F 38 0-00 0 0, 0,8 0,8 8, 00-00 0 37 0,37 0,68 6 0,449 44,9 00-300 0 0, 0,087 74 0,36 3,6 300-00 400 0, 0,9 96 0,69 69,6 00-600 0 0, 0, 7 0,847 84,78 600-700 60 3 0,3 0,094 30 0,94 94,0 700-800 70 0,0 0,036 3 0,977 97,8 800-000 900 3 0,0 0,0 38 00 38 Los valores de los percentles deben ser números enteros, por ser la varable dscreta. A 3 plazas le corresponde el percentl 6. N 38 Meda 36,44 Medana 8,39 Moda 0 Desvacón típca 33,84 Varanza 4680,8 Rango 80 Mínmo 0 Mámo 900 Percentles 0 04 6 4 8 0 8 7 6 7 36 80 69 σ CV = 33 84 = = 0 763 36 44 n Problema 3 Las tallas de los 40 alumnos de una clase se encuentran en la tabla adjunta. ) Calcula la meda artmétca, la medana, la moda, la desvacón típca y el coefcente de varacón, sn datos agrupados y con ellos. ) Haz la representacón gráfca del dagrama de frecuencas, hstograma y dagrama de sectores 3) Calcula los cuartles, el decl 9º y los centles 30 y 70. 4) Qué centl corresponde a 6 6 cm? 49 6 68 7 6 4 6 68 73 63 6 6 68 7 63 8 66 8 7 63 8 67 69 78 63 9 68 70 60 64 60 68 70 6 6 60 68 7 6 6 I.E.S. Hstorador Chabás -33- Juan Bragado Rodríguez

Solucón con datos agrupados Intervalos f f r F Fr 00 F 38 46 48, 0,0 0,0,0 6 3, 0,0 0,00,00 6 6 8, 8 0,00 0 0,0,00 6 66 63, 3 0,3 3 0,7 7,0 66 7 68, 0,7 34 0,80 8,00 7 76 73, 0, 39 0,97 97,0 76-8 78, 0,0 40 00 40 A 6 6 cm. le corresponde el percentl 36. σ CV = 6 094 = = 0 036 64 87 n N 40 Meda 64,87 Medana 64,846 Moda 63, Desv. típ. 6,094 Varanza 36,343 Rango 30,0 Mínmo 48, Mámo 78, Percentles 8,0 30 6,76 0 64,84 70 68,7 7 69,8 90 73,00 Solucón sn datos agrupados f f r F F r 00 F 40 49 0,0 0,0, 4 0,0 0,00,0 6 0,0 3 0,07 7, 8 3 0,07 6 0,0,0 9 0,0 7 0,7 7, 60 3 0,07 0 0,0,0 6 0,0 0,7 7, 6 0,00 3 0,3 3, 63 4 0,00 7 0,4 4, 64 0,0 8 0,40 4,0 6 0, 3 0,7 7, 66 0,0 4 0,600 60,0 67 0,0 0,6 6, 68 6 0,0 3 0,77 77, 69 0,0 3 0,800 80,0 70 0,00 34 0,80 8,0 7 0,0 3 0,87 87, 7 0,0 36 0,900 90,0 73 0,0 37 0,9 9, 7 0,00 39 0,97 97, 78 0,0 40 00 40 N 40 Meda 64,80 Medana 6,00 Moda 68 Desv. típ.,9338 Varanza 3, Rango 9 Mínmo 49 Mámo 78 Percentles 60,0 30 6,00 0 6,00 70 68,00 7 68,00 90 7,0 A 6 6 cm. le corresponde el percentl 38. σ CV = 9338 = = 0 036 64 80 n I.E.S. Hstorador Chabás -34- Juan Bragado Rodríguez

Problemas sobre Estadístca Descrptva ) Construr un dagrama de sectores y de barras para la dstrbucón de enfermos mentales ngresados en un hosptal psquátrco durante un año. Enfermedades Esquzofrena Pscoss manacodepresva Neuross Demenca Alcohólcos Otros Casos 0 60 33 70 0 ) En los países europeos se está cuestonando la posbldad de reducr la jornada laboral a 3 horas. En una empresa automovlístca se ha confecconado la sguente tabla de la dstrbucón estadístca del salaro/hora en euros de los obreros. Salarohora % obreros 6 7' 0 7' 9 0 9 0' 38 0' 3' 7 a) Calcula la meda, la medana, la moda y la desvacón típca. b) Dbuja el hstograma correspondente y el dagrama de sectores. c) Calcula los cuartles y el percentl 60. 3) Cuando el hstograma tene forma de campana, llamada Campana de Gauss, se dce que la varable aleatora se dstrbuye normalmente (altura de los ndvduos de una poblacón, peso, coefcente ntelectual, etc.). En una dstrbucón normal se puede hacer una clasfcacón de la poblacón utlzando estos ntervalos: 3σ σ σ + σ + σ + 3σ Valores muy bajos Valores bajos Valores normales 68% Valores altos Valores muy altos 9% 98% En un grupo de Matemátcas se han obtendo las sguentes puntuacones en un test de habldad mental: 0, 3, 4, 36, 6, 34, 6, 67, 4, 34, 3, 4, 3, 67, 4,, 34, 43,, 78, 36, 49, 3, 7, 66, 3, 4,, 33, 44, 48, 3, 7, 77, 3, 3, 47,, 33, 37, 64,. a) Comprobar s en el ntervalo σ, + σ se encuentra apromadamente el 68% de los datos. I.E.S. Hstorador Chabás -3- Juan Bragado Rodríguez

b) Comprobar s en el ntervalo σ, + σ se encuentra apromadamente el 9% de los datos. c) Comprobar s en el ntervalo 3σ, + 3σ se encuentra apromadamente el 98% de los datos. 4) En un estudo estadístco sobre la altura de los españoles y los alemanes se han obtendo los sguentes resultados: Españoles Alemanes Meda 7 cm. 7 4 cm. Desvacón típca 4 4 cm. 6 cm. Quén es más alto, un español que mde 77cm o un alemán que mde 8cm? ) La dstrbucón de estaturas de una muestra de 40 ndvduos nacdos en el msmo año y en el msmo mes vene dada por la tabla sguente: Estatura(cm) Nº de ndvduos 6 4 6 66 4 7 76 4 Clasfca los 40 ndvduos de una forma razonada en altos, normales y bajos. 6) Se realza una estadístca en dos centros de enseñanza, uno públco y otro prvado, referente a la nota global del bachllerato de cada uno de los alumnos que van a acudr a los eámenes de selectvdad. Las dstrbucones de frecuencas son las sguentes: Nota global de cada alumno. Centro prvado Frecuencas, 0 6. 7. 0 8. 30 9. Nota global de cada alumno. Centro públco Frecuencas [, 6] 0 (6, 7] 0 (7, 9] 00 (9, 0] 0 a) Cuál es el motvo de que los datos se presenten en dos tablas de dferente tpo? b) Calcula la meda y la desvacón típca de las dos dstrbucones. c) Representa gráfcamente los dagramas que mejor se ajusten a cada dstrbucón. d) Un alumno del centro prvado tene una nota global de un 8 y otro del centro públco una nota de un 7. Cuál de los dos es mejor alumno comparatvamente? I.E.S. Hstorador Chabás -36- Juan Bragado Rodríguez

7) A la fnalzacón del curso "Informátca e Internet" se realzó un eamen tpo test a los 300 alumnos obtenéndose la sguente tabla relatva al número de preguntas acertadas: a) Representa gráfcamente la dstrbucón de frecuencas anteror. b) Hallar la meda, la medana, la moda y la desvacón típca. c) Calcula los cuartles, los decles 3 y 8 y los percentles 30, 0 y 80. Nº preguntas acertadas Nº de alumnos 0-0 0 0-0 -0 60 0-3 00 3-70 -30 30 30-40 0 Para la realzacón de la segunda parte del curso se convocan sesenta plazas. Una vez fnalzado este segundo curso, se realza un eamen a los alumnos obtenéndose las sguentes notas: a) Por qué no se agrupan los datos en ntervalos, como anterormente? b) Calcular la meda, la medana, moda y la desvacón típca. c) Qué resulta más mertoro, obtener 8 preguntas acertadas en el prmer eamen u obtener un 6. en el segundo? Notas Nº Alumnos 4 8. 6 4 6. 6 8 8) El volumen de ventas de una empresa de telefonía en el año 00 se reparte de la sguente manera: dentro de la telefonía móvl fue de 7 mllones de euros, mentras que la meda en el sector fue de 6 6 mllones de euros y la varanza de 86. en el caso de la empresa de telefonía fja, las ventas fueron de 8 4 mllones de euros, sendo la meda en su sector de 7 mllones de euros y la varanza de 7 79. Cuál de estas dos empresas está mejor stuada en cuanto a su volumen de ventas? Razone la respuesta. 9) Una alumna de prmer curso de Economía, tras los eámenes de Febrero, quere saber en qué asgnatura de las cursadas en el prmer cuatrmestre ocupa una mejor poscón relatva según la nota obtenda. Para satsfacer su curosdad dspone de la sguente nformacón: Asgnaturas Estadístca Matemátcas Tª Económca Contabldad Derecho Cvl Nota obtenda por la alumna 7,0 6, 6,0 7, 8, Nota meda de la asgnatura Desvacón típca de las Notas de la asgnatura Hstora Económca 9,0 8,0,3 I.E.S. Hstorador Chabás -37- Juan Bragado Rodríguez 6,0 6,0,0 7,0 7,,,7,0,4,

Determnar en qué asgnatura está stuada en una mejor poscón relatva. 0) El gasto de dos grupos de famlas durante un perodo de tempo ha sdo el sguente: GRUPO A GRUPO B Gasto Nª de famlas Gasto Nº de famlas 0 4 8 0 6 0 0 4 0 6 3 0 8 8 0 0 7 8 0 0 Determnar cuál de los dos grupos es más homogéneo respecto a su gasto, con eplcacón de los pasos aplcados y de los resultados obtendos. ) Los sguentes dagramas de caja corresponden a las varables A, B y C. Interpreta en cada uno de ellos todo lo relatvo a concentracón de datos, dspersón y smetría. ) Interpreta el sguente dagrama de caja, relatvo a marcas de saltadores de longtud. 3) En la tabla adjunta se dan los datos de los alumnos matrculados en los centros de la cudad de Dena en Infantl, Prmara y Secundara para el curso 008/009. a) Elabora un dagrama de barras y un dagrama de sectores donde se reflejen los alumnos matrculados en Educacón Infantl por centros. b) Elabora un dagrama de barras y un dagrama de sectores donde se reflejen los alumnos matrculados en Educacón Prmara por centros. c) Elabora un dagrama de barras y un dagrama de sectores donde se reflejen los alumnos matrculados en la ESO según los dstntos cursos, y aparte elabora otro dagrama de barras y uno de sectores con el total de alumnos de la ESO por centros. I.E.S. Hstorador Chabás -38- Juan Bragado Rodríguez