Tema 8: Estadística en una variable (unidimensional)

Documentos relacionados
INTRODUCCIÓN. Técnicas estadísticas

Descripción de una variable

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

Tema 4: Variables aleatorias

Medidas de centralización

TEMA 10: ESTADÍSTICA

EJERCICIOS RESUELTOS TEMA 2

3. VARIABLES ALEATORIAS.

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Cálculo y EstadísTICa. Primer Semestre.

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Problemas donde intervienen dos o más variables numéricas

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL.

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Estadística Descriptiva Análisis de Datos

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

Medidas de Tendencia Central y de Variabilidad

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

Organización y resumen de datos cuantitativos

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Relaciones entre variables

EXPERIMENTACIÓN COMERCIAL(I)

ESTADÍSTICA (GRUPO 12)

4 E.M. Curso: NOMBRE: 4º. Colegio SSCC Concepción - Depto. de Matemáticas. Guía N. Unidad de Aprendizaje: Estadísticas

Modelos triangular y parabólico

Tema 1.3_A La media y la desviación estándar

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO ESCUELA NACIONAL COLEGIO DE CIENCIAS Y HUMANIDADES PLANTEL SUR ACADEMIA DE MATEMÁTICAS

Cuaderno de actividades 4º ESO

Capítulo III Medidas de posición y de dispersión

ANÁLISIS EXPLORATORIO DE DATOS

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

Regresión Lineal Simple y Correlación

Matemáticas aplicadas a las ciencias sociales Estadística y Probabilidad 1º de bachillerato

Correlación y regresión lineal simple

Estadística Empresarial I

Ejercicio nº 1. a) Elabora una tabla de frecuencias. b) Representa gráficamente la distribución.

UNIVERSIDAD DE SONORA

-.GEOMETRÍA.- a) 37 cm y 45 cm. b) 16 cm y 30 cm. En estos dos, se dan la hipotenusa y un cateto, y se pide el otro cateto:

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad

CESMA BUSINESS SCHOOL

4. REPRESENTACIONES GRÁFICAS PARA DATOS CATEGÓRICOS.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

REGRESION LINEAL SIMPLE

1. Lección 7 - Rentas - Valoración (Continuación)

Métodos específicos de generación de diversas distribuciones discretas

Efectos fijos o aleatorios: test de especificación

TÉCNICAS AUXILIARES DE LABORATORIO

PARÁMETROS DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA Media aritmética: μ = x

T. 9 El modelo de regresión lineal

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

Análisis de error y tratamiento de datos obtenidos en el laboratorio

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales:

Facultad de Ingeniería División de Ciencias Básicas Coordinación de Ciencias Aplicadas Departamento de Probabilidad y Estadística

a) Qué población (la de hombres o la de mujeres) presenta un salario medio mayor? b) Qué porcentaje de varones gana más de 900?

Variable aleatoria: definiciones básicas

PREGUNTAS TIPO TEST Y EJERCICIOS PRÁCTICOS PROPUESTOS EN EXÁMENES DE LOS CAPÍTULOS 2, 3 Y 4 (DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES )

Capítulo 12 CONTRASTES NO PARAMÉTRICOS

XII. Uso de la Estimación de la Distribución de Probabilidad para Muestras Pequeñas y de la Simulación en la Inferencia de Carteras de Seguros.

PROBABILIDAD Y ESTADÍSTICA

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Es el movimiento periódico de un punto material a un lado y a otro de su posición en equilibrio.

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

Tratamiento de datos experimentales. Teoría de errores

INSTITUTO DE FÍSICA FACULTAD DE INGENIERÍA

1.- Objetivo Alcance Metodología...3

PRUEBAS DE ACCESO A LAS UNIVERSIDADES DE ANDALUCÍA PARA MAYORES DE 25 AÑOS MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES

CAPITULO 4 MEDIDAS DE TENDENCIA CENTRAL

ESTADÍSTICA poblaciones

Modelos unifactoriales de efectos aleatorizados

Economía de la Empresa: Financiación

12-16 de Noviembre de Francisco Javier Burgos Fernández

TEMA 8: PRÉSTAMOS ÍNDICE

TEMA 4 Variables aleatorias discretas Esperanza y varianza

Capitalización y descuento simple

REGRESION Y CORRELACION

Materiales Industriales, Ingeniería Técnica Industrial Mecánica Profesor: Dr. María Jesús Ariza, Departamento de Física Aplicada, CITE II-A, 2.

Rentas o Anualidades

Pruebas Estadísticas de Números Pseudoaleatorios

FUNDAMENTOS QUIMICOS DE LA INGENIERIA

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

Matemáticas A 4º E.S.O. pág. 1

MODELOS DE ELECCIÓN BINARIA

INTRODUCCIÓN A LA PROBABILIDAD

Guía de Electrodinámica

E-Book ISBN Fecha de catalogación: 04/04/2014. INTRODUCCION

Transcripción:

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Tema 8: Estadístca en una varable (undmensonal) 1. Introduccón Se desconocen con exacttud los orígenes de la Estadístca. Parece que fueron los chnos, en el 00 a. C., los prmeros en efectuar recuentos de su poblacón. Tanto los egpcos como los gregos y los romanos preveían sus cosechas por medos que podríamos llamar estadístcos y efectuaban censos de poblacón. En los sglos XVI y XVII la Estadístca pasa a tener como prncpal objetvo el estudo de los asuntos de Estado, de donde derva el sentdo etmológco de la palabra. Desde entonces expermenta una evolucón que pasa por varas fases. Incalmente, la preocupacón fundamental era la recogda, clasfcacón y representacón de los datos; más tarde se pasó a la fase de análss e nterpretacón de los msmos. En una prmera aproxmacón, usamos la palabra estadístca para desgnar coleccones de datos numércos de la msma naturaleza, relatvos a un determnado fenómeno: estadístca de los automóvles venddos, estadístca de las mportacones, estadístca de los dvorcos, etc. En un sentdo más rguroso, la Estadístca es un método centífco que, a partr del conocmento de dversos hechos recogdos, hace nferencas que permten la prevsón de nuevos acontecmentos. Para hablar del objeto de la Estadístca, hemos de comenzar por dstngur fenómenos determnstas y aleatoros. Fenómenos determnstas (o causales) son los que al repetrlos en déntcas condcones producen el msmo resultado. Por ejemplo, el tempo que tarda un móvl, a velocdad constante, en recorrer una dstanca dada. Fenómenos aleatoros (de azar o estadístcos) son los que al repetrlos un gran número de veces, en déntcas condcones, presentan resultados dferentes, sendo mposble predecr el resultado de cada prueba partcular. Por ejemplo, los resultados del lanzamento de un dado. El método de trabajo de la Estadístca tene tres vertentes: Descrpcón de los datos observados (Estadístca Descrptva). Modelzacón del comportamento (Cálculo de Probabldades). Estmacón de lo desconocdo y generalzacón (Teoría de Muestras e Inferenca Estadístca). Tenendo en cuenta los métodos de trabajo de la Estadístca encontramos sus aplcacones: Descrpcón. Análss. Predccón. Una clasfcacón más general presenta las técncas estadístcas en dos grupos con funcones dstntas: Estadístca Descrptva. o Reduccón y descrpcón de nformacones volumnosas. 13

Ejemplos Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable o Recuento, ordenacón y clasfcacón de datos observados. o Presentacón de datos en forma resumda y manejable: Tablas. Gráfcas. Cálculo de parámetros estadístcos que caracterzan la dstrbucón de los datos: medas, medanas, cuartles, percentles, varanza, desvacón típca,... o o utlza el Cálculo de Probabldades. Estadístca Inferencal. o Se apoya en el Cálculo de Probabldades. o Maneja resultados de la Estadístca Descrptva. o Plantea y resuelve el problema de establecer prevsones y conclusones generales sobre una poblacón o colectvo. Tanto en esta tema como en el sguente se trabajará la Estadístca Descrptva en una varable (undmensonal) y en dos varables (bdmensonal).. Prmeras defncones.1. Poblacón y muestra La poblacón o unverso estadístco es el conjunto de elementos que poseen al menos una característca común y sobre los cuales va a ncdr el análss estadístco. El número de elementos de una poblacón es su tamaño (que puede ser fnto o no). S la poblacón es fnta lo representaremos por. o sempre es posble efectuar el estudo de todos los elementos de una poblacón. En este caso, el estudo se puede lmtar a una parte de ese todo: a una muestra. Así, una muestra es un subconjunto de la poblacón. Los elementos de la poblacón se llaman ndvduos o undades estadístcas. Estudando muestras fntas representatvas se obtenen conclusones que se pueden aplcar a toda la poblacón. Para que una muestra sea representatva de la poblacón es precso que el muestreo sea aleatoro, es decr, que cualquer ndvduo de la poblacón tenga la msma probabldad de pertenecer a la muestra, en cuyo caso se habla de muestra aleatora. a) En un sondeo de opnón realzado por una empresa para conocer la ntencón de voto de los habtantes de una cudad, la poblacón está formada por el conjunto de todos los ndvduos con derecho a voto. De ella se extraerá un conjunto de personas a las que se entrevstará: éstas forman la muestra. b) Para estudar la proporcón de tornllos defectuosos que produce una fábrca en una semana, se elgen al azar 1000 tornllos. La poblacón la consttuyen todos los tornllos fabrcados en la semana. La muestra la forman los 1000 tornllos selecconados. 14

Ejemplo Ejemplo Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable.. Caracteres y modaldades En relacón con cada undad estadístca pueden ser observadas dstntas propedades que permten clasfcar a los ndvduos de la poblacón: estas propedades se llaman caracteres o característcas estadístcas. Consderemos una poblacón formada por estudantes. Cada estudante es un ndvduo de la poblacón que puede ser estudado atendendo a dstntos caracteres: sexo, edad, estatura, lugar de nacmento, nota obtenda en el últmo examen, color del pelo,... Para cada característca, deben estar defndas todas las stuacones posbles en que se puede encontrar una undad estadístca: éstas son las modaldades. En cuanto a las modaldades, hemos de cudarnos no sólo de enumerarlas sno que han de estar ben defndas, de modo que cada ndvduo pueda pertenecer a una y sólo una de ellas: las modaldades han de ser ncompatbles (mutuamente excluyentes) y exhaustvas (cubrr toda la poblacón). Es posble clasfcar los caracteres en cuanttatvos (o varables estadístcas), s son susceptbles de representacón numérca, y cualtatvos (o atrbutos), en caso contraro. Consderemos la poblacón formada por todos los alumnos de un Insttuto y los sguentes caracteres: sexo, edad, curso y estatura: El carácter sexo tene dos modaldades: hombre y mujer. Este carácter es por tanto cualtatvo. El carácter edad tene las sguentes modaldades: {1, 13, 14, 15, 16, 17, 18} s entendemos que la edad se descrbe por años cumpldos. Este carácter es por tanto cuanttatvo y podremos hablar de la varable estadístca edad. El curso tene las modaldades 1º ESO, º ESO, 3º ESO, 4º ESO, 1º Bachllerato y º Bachllerato y por tanto es cualtatvo. Por últmo el carácter estatura se puede dvdr, por ejemplo, en las sguentes modaldades: {(, 160], (160, 170], (170, 180], (180, + )}, donde se está adoptando como undad de medda los centímetros. Se puede hablar por tanto de la varable estadístca estatura..3. Varables estadístcas dscretas y contnuas Con respecto a cada undad estadístca o ndvduo de una poblacón podemos determnar varos caracteres que pueden se cuanttatvos o cualtatvos, como se ha vsto anterormente. Cada carácter cuanttatvo es una varable estadístca; dcho de otro modo, una varable estadístca es un aspecto medble de la undad estadístca. La medcón de la varable de cada ndvduo de la poblacón permtrá clasfcar sus elementos en modaldades. Las varables suelen representarse por letras mayúsculas: X, Y,..., y los valores que toma cada una de ellas con las msmas letras que la varable, pero en mnúscula y con subíndces: x 1, x, x 3,..., x k,..., s nos refermos a la varable X; y 1, y, y 3,..., y k,..., s nos refermos a la varable Y. 15

Ejemplo Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Dremos que una varable estadístca es dscreta s su campo de varacón, esto es, el conjunto de valores que toma la varable, está formado por puntos aslados (en número fnto o nfnto numerable). Dremos que una varable estadístca es contnua s su campo de varacón es, al menos teórcamente, un ntervalo de la recta real. Dados dos valores cualesquera de los que toma la varable, sempre exste entre ellos una nfndad de valores que puede tomar. Son varables estadístcas dscretas: El número de coches fabrcados en un año. El número de pacentes atenddos certo día en un Centro de Salud. El número de ordenadores en cada Insttuto de la provnca. Son varables estadístcas contnuas: El peso de los alumnos de un Insttuto. La estatura de los msmos alumnos. Las temperaturas regstradas en un observatoro cada hora. En la práctca, aunque una varable sea contnua, cuando la medmos la estamos hacendo dscreta, dada la lmtacón de los nstrumentos de medda. o obstante, al clasfcar las varables lo que hacemos es atender a su naturaleza, y no a los resultados obtendos de la medcón. Atendendo al número de caracteres cuanttatvos que observamos en cada ndvduo, las varables pueden ser undmensonales, bdmensonales, trdmensonales,..., según se estude en cada ndvduo de la poblacón uno, dos, tres,..., caracteres, respectvamente. En este tema nos dedcaremos al estudo de las varables estadístcas undmensonales y, en el sguente, a las bdmensonales. En el sguente esquema se resumen los conceptos anterores: Caracteres Estadístcos Cuanttatvos (Varables Estadístcas) Cualtatvos (Atrbutos) Dscretas: valores aslados Contnuas: valores en un ntervalo de la recta real. 3. Frecuencas y tablas de frecuencas Consderemos una poblacón o muestra que consta de ndvduos. Sea k el número de modaldades defndas para un determnado carácter. Tendremos entonces las modaldades M 1, M,..., M k. Se llama frecuenca absoluta, n, de la modaldad M, al número de ndvduos de la poblacón que pertenecen a dcha modaldad (el número de veces que se repte). Como las modaldades son ncompatbles y exhaustvas, se tene que n 1 n = 16

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Se llama frecuenca relatva, f, de la modaldad M, a la proporcón de ndvduos de la poblacón que presentan dcha modaldad. Es decr, s el número total de ndvduos es n, entonces: f y por tanto 0 f 1 Llamaremos frecuenca absoluta acumulada,, de la modaldad M, a la suma de las frecuencas absolutas hasta la -ésma modaldad. Es decr: = n 1 + n +... + n = Llamaremos frecuenca relatva acumulada, F, de la modaldad M, a la suma de las frecuencas relatvas hasta la de la -ésma modaldad. Es decr: F = f 1 + f +... + f = Los datos observados de una poblacón se muestran clasfcados y ordenados para dar mayor clardad y ofrecer una vsón global del conjunto, que sea nterpretable. Las dos formas de representacón, que suponen los dos prmeros pasos que hay que dar en el tratamento estadístco de la nformacón, son las tablas estadístcas y las representacones gráfcas. Las tablas más smples son las que constan de una prmera columna en la que se reflejan las dstntas modaldades que presenta el carácter en estudo. Se añaden una o más columnas a su derecha en las que se anotan las respectvas frecuencas y otras más para cálculos posterores. El aspecto general de una tabla smple, para un carácter con k modaldades, es la sguente: Modaldades M Frecuencas absolutas ordnaras n Frecuencas absolutas acumuladas r1 r1 f n r r Frecuencas relatvas ordnaras f Frecuencas relatvas acumuladas F M 1 n 1 1 f 1 F 1 M n f F............... M n f F 1...... M k n k k = f k F k = 1 1 Observemos que: La suma de todas las frecuencas absolutas ordnaras ha de concdr con el número total de ndvduos de la poblacón, es decr, con el tamaño : La suma de todas las frecuencas relatvas ordnaras ha de ser 1, ya que representa la suma de todas las proporcones: f = 1 n 1 n 1 n = 17

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable La últma frecuenca absoluta acumulada ha de ser el tamaño, : k = La últma frecuenca relatva acumulada ha de ser 1: F k = 1 4. Dstrbucones de frecuencas Consderemos una poblacón de tamaño estudada según un carácter C que puede ser clasfcado en k modaldades M 1, M,..., M,..., M k Llamamos dstrbucón de frecuencas al conjunto de pares ordenados: {(M 1, n 1 ), (M, n ),..., (M, n ),..., (M k, n k )} (dstrbucón de frecuencas absolutas) o ben al conjunto : {(M 1, f 1 ), (M, f ),..., (M, f ),..., (M k, f k )} (dstrbucón de frecuencas relatvas) En el caso dscreto, las modaldades son los valores numércos aslados que toma la varable estadístca. Entonces, la dstrbucón de frecuencas es: o ben: {(x 1, n 1 ), (x, n ),..., (x, n ),..., (x k, n k )} (en el caso de frecuencas absolutas) 4.1. Ejemplo {(x 1, f 1 ), (x, f ),..., (x, f ),..., (x k, f k )} (en el caso de frecuencas relatvas) Un profesor tene anotadas las calfcacones de los 30 alumnos de un grupo: 5 3 4 1 8 9 8 7 6 6 7 9 8 7 7 1 0 1 6 9 9 8 0 8 8 8 9 5 7 Construr la tabla de frecuencas absolutas, absolutas acumuladas, relatvas y relatvas acumuladas. Se trata de una varable estadístca dscreta. x n f F 0 /30 /30 1 3 5 3/30 5/30 1 6 1/30 6/30 3 1 7 1/30 7/30 4 1 8 1/30 8/30 5 3 11 3/30 11/30 6 13 /30 13/30 7 5 18 5/30 18/30 8 7 5 7/30 5/30 9 5 30 5/30 30/30 10 0 30 0 30/30 = 1 30 1 18

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable 4.. Caso contnuo En el caso contnuo, o en el dscreto con un gran número de datos, la poblacón se partcona en clases o ntervalos. Es decr, los datos se clasfcan en ntervalos de la recta real ( El número de clases debe ser aproxmadamente gual a la raíz cuadrada del número de datos ), dando lugar a datos agrupados en ntervalos: (e 0, e 1 ] (e 1, e ]... (e 1, e ]... (e k 1, e k ] Clase 1ª Clase ª... Clase -ésma... Clase últma (k-ésma) En las clases o ntervalos tendremos en cuenta los sguentes conceptos: Extremos de clase: dada la clase -ésma (e 1, e ], a e 1 lo llamaremos límte nferor y a e límte superor. Ampltud de clase: llamaremos ampltud de la clase -ésma (e 1, e ] a la longtud del ntervalo, es decr, al número a = e e 1 Marcas de clase: son los puntos medos de las clases o ntervalos. En el caso de la e 1 e clase -ésma (e 1, e ], la marca de clase es x = Hemos de tener en cuenta las sguentes observacones: Las ampltudes de las clases no tenen por qué ser guales. o obstante, s podemos elegr, es cómodo tomar todas las clases con la msma ampltud. Esto habrá que tenerlo muy en cuenta a la hora delas representacones gráfcas: hstogramas de frecuencas. Más aún, las clases prmera y últma pueden ser ntervalos no acotados, de ampltud nfnta. Lo que se pretende con esto es recoger los casos muy extremos, raros, que se puderan dar. En resumen, en el caso de las varables estadístcas contnuas, o dscretas con datos agrupados (tratamento contnuo por ser muy grande el número de datos), la dstrbucón de frecuencas es un conjunto de la forma: o ben: donde: {(I 1, n 1 ), (I, n ),..., (I, n ),..., (I k, n k )} (en el caso de frecuencas absolutas) {(I 1, f 1 ), (I, f ),..., (I, f ),..., (I k, f k )} (en el caso de frecuencas relatvas) I = (e 1, e ] = {x / e 1 < x e } es la clase -ésma. Las clases prmera y últma pueden ser de la forma: o I 1 = (, e 1 ] = {x / x e 1 } o I k = (e k 1, +) = {x / e k 1 < x} 19

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable 4.3. Ejemplo Las edades de las personas que acuden a un médco a lo largo de un mes son: 3 11 13 4 3 4 5 6 7 3 4 5 3 5 6 7 15 4 1 14 4 3 6 9 13 6 17 6 13 6 5 1 6 Construr la correspondente tabla de frecuencas agrupando los datos en clases o ntervalos de ampltud 5. Clases I Marcas de clase n f F x (0, 5],5 17 17 17/36 17/36 (5, 10] 7,5 7 4 7/36 4/36 (10, 15] 1,5 7 31 7/36 31/36 (15, 0] 17,5 1 3 1/36 3/36 (0, 5],5 1 33 1/36 33/36 (5, 30] 7,5 3 36 3/36 36/36=1 = 36 Observemos que se trata de una varable estadístca dscreta a la que, por haber un número grande de datos, se trata como contnua agrupando los datos en ntervalos. 5. Representacones gráfcas Aunque las tablas de frecuencas contenen nformacón sufcente para permtr el análss de los datos, comúnmente se recurre a su representacón gráfca con el objetvo de obtener una mejor dea del comportamento de los datos. Según sea el carácter estudado, se emplean dstntos tpos de representacones gráfcas o dagramas: Carácter cualtatvo (atrbuto) Carácter cuanttatvo (varable estadístca) Dagrama rectangular. Dagrama de sectores. Pctogramas. Cartogramas. Prámdes de poblacón. Varable dscreta Varable contnua Dagrama de barras. Funcón de dstrbucón. Hstograma. Funcón de dstrbucón. En este tema veremos los dagramas rectangulares y de sectores para caracteres cualtatvos y los dagramas de barras e hstogramas para los cuanttatvos. 130

Frecuencas absolutas Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable 5.1. Dagrama rectangular (carácter cualtatvo) Están consttudos por varos rectángulos de base constante, una por cada modaldad, y con altura proporconal a la frecuenca absoluta (sn más que cambar la escala del eje de ordenadas se tendría la msma gráfca para las frecuencas relatvas. Por ejemplo, consderemos que las calfcacones obtendas por los 3 alumnos de una clase en la asgnatura de matemátcas venen dadas en la sguente tabla: M n f F Muy Defcente 0 0 0/3 0/3 Insufcente 5 5 5/3 5/3 Sufcente 6 11 6/3 11/3 Ben 4 15 4/3 15/3 otable 1 7 1/3 7/3 Sobresalente 5 3 5/3 3/3 = 1 = 3 3/3 = 1 Un dagrama rectangular sería el sguente: DIAGRAMA RECTAGULAR (Carácter cualtatvo-ordnal) 14 1 10 8 6 4 0 MDF IS SUF BIE OT SOB Calfcacón 5.. Dagrama de sectores (carácter cualtatvo) Consste en hacer corresponder un círculo a la frecuenca total (preferentemente relatva, expresada en térmnos porcentuales) y hacer corresponder a cada modaldad M un sector crcular de ampltud proporconal a la frecuenca correspondente. Para ello se recurre a cualquera de las reglas de tres smples que tenes a contnuacón: De donde: 360º 1 360º n f 360º 1 360º n f 100 360º p (100 f ) 100 360º p n p 360º f 360º 360º 100 Para el ejemplo anteror se tendría: 131

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable M n f p (%) (º) Muy Defcente 0 0/3 = 0,0000 0,00 0,00 Insufcente 5 5/3 = 0,1565 15,65 56,5 Sufcente 6 6/3 = 0,1875 18,75 67,50 Ben 4 4/3 = 0,150 1,50 45,00 otable 1 1/3 = 0,3750 37,50 135,00 Sobresalente 5 5/3 = 0,1565 15,65 56,5 = 3 3/3 = 1 100,00 360,00 DIAGRAMA DE SECTORES (Carácter cualtatvo-ordnal) SOB 16% MDF 0% IS 16% SUF 19% OT 37% BIE 1% 5.3. Dagrama de barras (varable estadístca dscreta) Se llama así la representacón gráfca de frecuencas de una varable estadístca dscreta (carácter cuanttatvo dscreto) obtenda de la forma sguente: Sobre el eje de abscsas se marca cada uno de los valores de la varable en una escala artmétca (dvsones guales). Sobre el eje de ordenadas se lleva a cabo una graduacón artmétca que permta representar las frecuencas absolutas o relatvas (s se van a hacer comparacones mejor relatvas). Sobre cada punto del eje de abscsas, correspondente a un valor de la varable, se levanta una barra de altura proporconal a la frecuenca de dcho valor. Es un dagrama smlar al dagrama rectangular para caracteres cualtatvos. Por ejemplo, consderemos una poblacón formada por 1000 lotes de certas pezas mecáncas. El carácter (cuanttatvo) que se observa en cada undad estadístca es el número de pezas defectuosas que contene: 0, 1,, 3, 4, 5 ó 6 (estas son las modaldades, los valores de la varable dscreta en cuestón). 13

: frecuencas absolutas acumuladas n: frecuencas absolutas Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Las frecuencas venen dadas en la sguente tabla: úmero de pezas defectuosas por lote úmero de lotes con x pezas defectuosas Frecuencas acumuladas x 0 1 3 4 5 6 n 300 365 14 83 3 7 8 1000 300 665 879 96 985 99 1000 DIAGRAMA DE BARRAS (Varable estadístca dscreta) 400 350 300 50 00 150 100 50 0 1 3 4 5 6 7 x: número de pezas defectuosas Cambando frecuencas absolutas ordnaras, n, por frecuencas absolutas acumuladas, tendríamos el dagrama de barras acumulatvo. DIAGRAMA DE BARRAS ACUMULATIVO (Varable estadístca dscreta) 100 1000 800 600 400 00 0 1 3 4 5 6 7 x: número de pezas defectuosas 133

Frecuencas absolutas (n) Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable 5.4. Hstograma de frecuencas (varable contnua) Se llama hstograma a la representacón gráfca de las frecuencas de una dstrbucón estadístca de una varable contnua cuyas observacones están agrupadas en clases. Se construye de la forma sguentes: Sobre el eje de abscsas, graduado según una escala artmétca, se marcan los extremos de las clases sucesvas. Sobre el eje de ordenadas se marcarán las frecuencas. Sobre cada ntervalo o clase se dbuja un rectángulo de modo que las áreas de loas rectángulos sean proporconales a las frecuencas. Por ejemplo, consderemos un parque automovlístco de 478 coches clasfcados según el número de klómetros recorrdos en un año: Klometraje anual (en mles de úmero de vehículos klómetros) (e 1, e ] n (0, 4] 8 (4, 8] 634 (8, 1] 81 (1, 16] 475 (16, 0] 33 (0, 4] 87 = 478 HISTOGRAMA DE FRECUECIAS ABSOLUTAS Varable contnua (ampltudes guales) 900 800 700 600 500 400 300 00 100 0 (0, 4] (4, 8] (8, 1] (1, 16] (16, 0] (0, 4] Recorrdo anual (en mles de Km) Observemos que todos los ntervalos tenen la msma ampltud. Entonces, para la construccón del hstograma, podemos asgnar como altura de cada rectángulo la frecuenca absoluta del ntervalo correspondente. 134

Frecuencas absolutas (n) Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Unendo el vértce superor zquerdo o los puntos medos de los techos de los rectángulos, se obtene una línea polgonal que encerra sobre el eje X un área gual a la que encerran los rectángulos. Tal línea es el polígono de frecuencas. POLÍGOO DE FRECUECIAS Varable contnua (ampltudes guales) 900 800 700 600 500 400 300 00 100 0 (0, 4] (4, 8] (8, 1] (1, 16] (16, 0] (0, 4] Recorrdo anual (en mles de Km) 6. Reduccón numérca de los datos Hasta ahora hemos tratado y representado gráfcamente las dstrbucones de frecuencas según un carácter. Con ello tenemos una prmera aproxmacón al conocmento de las msmas. Ahora daremos un conjunto de meddas descrptvas que resuman cuanttatvamente, de modo sucnto y sgnfcatvo, las característcas más mportantes de una dstrbucón. Esto nos permtrá comparar dstntas dstrbucones. Por ejemplo, s se desea comparar las temperaturas de Granada y Cudad Real a lo largo de un año, sería mejor dsponer de unos pocos números que representaran de forma resumda a cada una de las provncas que comparar las temperaturas de todos y cada uno de los días del año. Lo únco que hay que hacer es tomar esos números de modo que sean representatvos de todo el grupo; es decr, unos valores que representen o resuman a toda la poblacón. Estos números se llaman parámetros estadístcos o, smplemente, estadístcos. En nuestro ejemplo se suele recurrr a la temperatura meda de las máxmas y a la temperatura meda de las mínmas. 6.1. Meddas de centralzacón Las meddas o estadístcos de centralzacón, o de tendenca central, nos ndcan los punto en torno a los cuales se encuentran los valores de la varable estadístca en estudo; es decr, nos ndcan los puntos centrales de una dstrbucón. Representan el conjunto de los datos medante un solo valor numérco, tratando de resumr y sntetzar la dstrbucón de frecuencas. Las meddas de poscón central más utlzadas son la medana, la moda y la meda artmétca. 135

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Medana Sea X una varable estadístca (carácter cuanttatvo) de una poblacón o muestra con ndvduos. Se llama medana a un valor, representado por Me, tal que, ordenados los valores de X en orden crecente, el 50% de ellos son menores o guales que Me y el 50% restante son mayores o guales que Me. Para determnar la medana los haremos en el caso dscreto y contnuo. Caso dscreto Consderaremos la sguente dstrbucón de frecuencas que nos servrá de ejemplo: x n f F 3 1 1 1/9 1/9 4 3 /9 3/9 5 1 4 1/9 4/9 6 1 5 1/9 5/9 7 3 8 3/9 8/9 8 0 8 0 8/9 9 0 8 0 8/9 10 1 9 1/9 9/9 = 1 = 9 1 Podemos proceder de dos formas: Drectamente sobre los datos: ordenamos los datos sn agrupar; es decr, reptendo cada uno tantas veces como ndque su frecuencas absoluta. 3 4 4 5 6 7 7 7 10 Me En este caso, = 9 es mpar y la medana es el valor central: Me = 6 deja a la mtad de ndvduos por encma y a la otra mtad por debajo. A partr de la tabla de frecuencas: observamos en la columna de las frecuencas absolutas acumuladas donde se encuentra el valor /. Este dejará por encma la frecuenca absoluta acumulada y por debajo la frecuenca absoluta acumulada +1. La medana es el valor de la varable que se encuentra nmedatamente por debajo de esta poscón, es decr, x +1. En nuestro ejemplo / = 4,5 y por tanto Me = 6. Observa la tabla: Me = x +1 / x n f F 3 1 1 1/9 1/9 4 3 /9 3/9 5 = x 1 4 = 1/9 4/9 4,5 6 1 5 = +1 1/9 5/9 7 3 8 3/9 8/9 8 0 8 0 8/9 9 0 8 0 8/9 10 1 9 1/9 9/9 = 1 = 9 1 136

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Puede ocurrr que / concda con algún valor de. Entonces la medana es el x x 1 valor medo entre x y x +1 : Me = Por ejemplo, consderemos ahora la sguente dstrbucón de frecuencas. En este x x 1 caso / = 5, que concde con uno de los valores de. Por tanto Me = = 6 7 = 6,5. / Me = 6 7 = 6,5 x n f F 3 1 1 1/10 1/10 4 3 /10 3/10 5 1 4 1/10 4/10 6 1 5 1/10 5/10 7 3 8 3/10 8/10 8 0 8 0 8/10 9 0 8 0 8/10 10 10 /10 10/10 = 1 = 10 1 Observa que s calculamos la medana drectamente sobre los datos, al ser ahora par, quedan dos valores centrales. La medana es el valor medo de estos: 3 4 4 5 6 7 7 7 10 10 Me = 6 7 = 6,5 Caso contnuo Para este caso tomaremos el ejemplo de clases de gual ampltud de la págna 134: consderemos un parque automovlístco de 478 coches clasfcados según el número de klómetros recorrdos en un año: / Intervalo medano Klometraje anual (en mles de klómetros) úmero de vehículos Frecuencas absolutas acumuladas (e 1, e ] n (0, 4] 8 8 (4, 8] 634 86 139 (8, 1] 81 1683 (1, 16] 475 158 (16, 0] 33 391 (0, 4] 87 478 = 478 En este caso, la prmera clase cuya frecuenca absoluta acumulada es mayor o gual que / es el ntervalo medano o clase medana de la dstrbucón: que los llamaremos I = (e 1, e ] En nuestro ejemplo I = (8, 1]. Para obtener la medana se recurre a la sguente fórmula: 137

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Me = e 1 1 1 donde e 1 es el límte nferor del ntervalo medano, a es la ampltud del ntervalo medano, 1 es la frecuenca absoluta acumulada que se encuentra nmedatamente por encma del ntervalo medano, es la frecuenca absoluta acumulada correspondente al ntervalo medano y es el número de ndvduos de la poblacón. En nuestro ejemplo: Me = Moda Caso dscreto e 1 1 1 a = 8 + a 478 86 4 = 9,84 1683 86 Dada una varable estadístca dscreta X con dstrbucón de frecuencas {(x 1, n 1 ), (x, n ),..., (x, n ),..., (x k, n k )} se llama moda, y se representa por Mo, a la modaldad que presenta una frecuenca máxma. En el dagrama de barras es la modaldad a la que corresponde la barra más alta. Una dstrbucón puede tener, pues, más de una moda, en el caso de que la frecuenca más alta corresponda a más de una modaldad. S consderamos el ejemplo de las págnas 13 y 133: úmero de pezas defectuosas por lote úmero de lotes con x pezas defectuosas x 0 1 3 4 5 6 n 300 365 14 83 3 7 8 1000 El valor que se presenta con más frecuenca es el 1 (365 veces). Por tanto Mo = 1. Caso contnuo Dada una varable estadístca contnua X con dstrbucón de frecuencas {(I 1, n 1 ), (I, n ),..., (I, n ),..., (I k, n k )} se llama clase o ntervalo modal al ntervalo que presenta una mayor densdad de frecuenca. En el hstograma es al que le corresponde el rectángulo de mayor altura. En el ejemplo de la págna 134: Klometraje anual (en mles de úmero de vehículos klómetros) (e 1, e ] n (0, 4] 8 (4, 8] 634 (8, 1] 81 (1, 16] 475 (16, 0] 33 (0, 4] 87 = 478 138

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable La clase o ntervalo modal es, en este caso, (8, 1] pues es la que se presenta en un mayor número de ocasones (81). S queremos especfcar más concretamente a que valor de la varable le atrbumos el papel de moda, aplcaremos la sguente fórmula: n n1 Mo = e1 a (n n ) (n n ) 1 1 donde e 1 es el límte nferor de la clase modal, n es la frecuenca absoluta correspondente al ntervalo modal, n 1 es la frecuenca absoluta nmedatamente anteror a n, n +1 es la frecuenca absoluta nmedatamente posteror a n y a es la ampltud de la clase modal. 81 634 En nuestro ejemplo Mo = 8 + 4 = 9,04 (81 634) (81 475) S llamamos 1 = n n 1 (exceso de la clase modal sobre la clase contgua anteror) y = n n +1 (exceso de la clase modal sobre la clase contgua posteror), la fórmula anteror se converte en: 1 Mo = e 1 1 En el ejemplo 1 = 81 634 = 187 y = 81 475 = 346, y entonces se tene que 187 Mo = 8 + 187 346 4 = 9,04 Observacones: Cuando una dstrbucón presenta varos máxmos locales, ben en el dagrama de barras (caso dscreto) o ben en el hstograma (caso contnuo), se habla de una dstrbucón multmodal. Cuando la clase modal sea una clase extrema, la prmera o la últma, se supone que la clase anteror o la posteror, respectvamente, es de frecuenca nula. Meda artmétca Caso dscreto Sea X una varable estadístca dscreta de una poblacón fnta de tamaño y sean x 1, x,..., x los valores observados de X. La meda artmétca, o smplemente meda, de esos valores es: x = x x... x a 1 1 S de esos valores sólo hay k dstntos x 1, x,..., x k, que se repten, respectvamente, n 1, n,..., n k veces (sus frecuencas absolutas), entonces podemos escrbr: x 139

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable x = n x n x... n x o ben, s empleamos frecuencas relatvas: x = 1 1 k k 1 k k f x f x... f x f x nx 1 1 k k 1 Usemos uno de los ejemplos anterores para ver cómo se ordenan los cálculos: x n n x f f x 3 1 3 1/10 3/10 4 8 /10 8/10 5 1 5 1/10 5/10 6 1 6 1/10 6/10 7 3 1 3/10 1/10 8 0 0 0 0 9 0 0 0 0 10 0 /10 0/10 n = = 10 n x = 63 f = 1 f x = 63/10 x = 8 1 nx = 63 10 = 6,3 o ben, s prefermos trabajar con frecuencas relatvas: Caso contnuo x = 8 fx = 63 1 10 = 6,3 En este caso, reemplazamos las clases por sus marcas x (lo que equvale a suponer que todos los puntos del ntervalo están concentrados en su punto medo). Se trata de una espece de dscretzacón de la varable. Las fórmulas para el calculo de la meda son las msmas de antes. Por ejemplo: Clase Marca de clase Frecuencas absolutas (e 1, e ] x n x n (0, 150] 75 10 9000 (150, 300] 5 159 35775 (300, 350] 35 89 895 (350, 400] 375 78 950 (400, 500] 450 66 9700 (500, ) 550 5 8600 = 564 16150 140

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Para la clase extrema (500, ) se podrían adoptar dversos convenos. Hemos adoptado el de asgnarle la msma ampltud que a la anteror. La meda es, por tanto: x = 6 1 nx = 16150 564 = 85,9 6.. Meddas de poscón Son una generalzacón de la medana. En general, srven para determnar en qué poscón de la dstrbucón se encuentra un ndvduo, supuestos ordenas en orden crecente. Sea X una varable estadístca (dscreta o contnua) sobre una poblacón fnta de tamaño, y sea t un número real tal que 0 < t < 1. Se llama cuantl de orden t al valor C t tal que t ndvduos de la poblacón son tales que X C t y los (1 t) ndvduos restantes son tales que X C t. Dcho de otro modo, el 100t % de los ndvduos se encuentra por debajo del cuantl C t y el 100(1 t) % de ndvduos restante se encuentra por encma del cuantl C t. S t = 0,5, entonces C 0,5 = Me (la medana). S para un ndvduo ocurre que X Me, tal ndvduo está en la prmera mtad de la poblacón ordenada. La nterpretacón de los cuantles y las crcunstancas que se pueden dar en su determnacón, según los casos, son exactamente las msmas que para la medana. En el caso dscreto, ben a partr de los datos sn agrupar o ben a partr de la dstrbucón de frecuencas absolutas tomando como referenca el valor t para mrar en la columna de frecuencas absolutas acumuladas. En el ejemplo de varable dscreta al fnal de este apartado se verá con toda clardad. Para el caso contnuo, con los datos agrupados en ntervalos, exste una fórmula análoga a la de la medana para el cuantl de orden t: t 1 C t = e1 a 1 Los cuantles se estudan en grupos que dvden a la poblacón en un certo número de partes guales, ordenados los ndvduos por el valor de la varable en orden crecente. Según el número de partes en que dvden a la poblacón recben dstntos nombre: Cuartles Dvden a la poblacón en cuatro partes, cada una de las cuales contene al 5% de las observacones. Los cuartles son: Prmer cuartl: Q 1 = C 1/4 (t = 1/4 = 0,5) Segundo cuartl: Q = C 1/ = Me (t = 1/ = 0,5) Tercer cuartl: Q 3 = C 3/4 (t = 3/4 = 0,75) En el caso contnuo, una vez determnado el ntervalo (e 1, e ] que contene a Q k, de frecuenca absoluta acumulada k, las fórmulas para los tres cuartles son: 141

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Q 1 = e 1 1 4 1 1 a Q = e 1 1 1 1 a = Me Q 3 = e 1 3 4 1 1 Es convenente observar que los cuartles no tenen por qué estar unos a la msma dstanca de otros: lo que han de verfcar es que entre cada dos consecutvos esté el 5% de la poblacón: 5 % 5 % 5 % 5 % e 0 Q 1 Q = Me Q 3 e k Decles Dvden a la poblacón en dez partes, cada una de las cuales contene al 10% de las observacones. Los decles son: a Prmer decl: D 1 = C 1/10 (t = 0,10) Segundo decl: D = C /10 (t = 0,0) Qunto decl: D 5 = C 5/10 = Q = Me (t = 0,50) oveno decl: D 9 = C 9/10 (t = 0,90) La forma de calcularlos es la msma de antes: Centles o percentles D = e 1 10 1 1 Dvden a la poblacón en cen partes, cada una de las cuales contene al 1% de ella. Los percentles son: a P 1 = C 1/100 (t = 0,01).. P 5 = C 5/100 = Q 1 (t = 0,5).. P 50 = C 50/100 = Q = Me (t = 0,50).. P 75 = C 75/100 = Q 3 (t = 0,75).. P 99 = C 99/100 (t = 0,99) 14

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Veamos dos ejemplos (uno de varable dscreta y otro de varable contnua) en los que se aprece el cálculo de los dstntos parámetros: Ejemplo 1: consderemos el ejemplo de las págnas 13 y 133: una poblacón formada por 1000 lotes de certas pezas mecáncas. El carácter que se observa es el número de pezas defectuosas que contene: 0, 1,, 3, 4, 5 ó 6. Las frecuencas venen dadas en la sguente tabla: x 0 1 3 4 5 6 n 300 365 14 83 3 7 8 1000 300 665 879 96 985 99 1000 n x 0 365 48 49 9 35 48 117 Calcular la meda, la moda, la medana, los tres cuartles, los decles sexto y séptmo, y los percentles P 40 y P 95 Es claro que x = 117 = 1,17 y que Mo = 1. Para determnar los demás parámetros 1000 mraremos en la fla de frecuencas absolutas acumuladas. Medana: la prmera frecuenca absoluta acumulada que es mayor que / = 500 es = 665. Por tanto Me = 1 Cuartles: la prmera frecuenca absoluta acumulada que es mayor o gual que /4 = 50 es 1 = 300. Entonces Q 1 = 0 (el prmer 5% de los lotes observados, ordenados por orden crecente de pezas defectuosas, tene 0 pezas defectuosas). Por otro lado Q = Me = 1 (el segundo 5% de los lotes observados tenen 0 ó 1 peza defectuosas). Por últmo, la prmera frecuenca absoluta acumulada que es mayor que 3/4 = 750 es 3 = 879. Entonces Q 3 = (el tercer 5% de la poblacón tene 0, 1 ó pezas defectuosas). Sexto y séptmo decles: la prmera frecuenca absoluta acumulada que es mayor que 6/10 = 600 es = 665. Por tanto D 6 = 1 (es decr, el prmer 60% de los lotes observados tenen 0 ó 1 pezas defectuosas). De forma smlar, como 7/10 = 700, la prmera frecuenca acumulada que es mayor que tal valor es 3 = 879 y entonces D 7 = (lo que quere decr que el 70% de los lotes tenen 0, 1 ó pezas defectuosas). Percentles P 40 y P 95 : la prmera frecuenca absoluta acumulada que es mayor que 40/100 = 400 es = 665. Entonces P 40 = 1 (el 40% de los lotes tene 0 ó 1 peza defectuosa). Fnalmente, como la prmera frecuenca absoluta acumulada que es mayor que 95/100 = 950 es 4 = 96, tenemos que P 95 = 3 (el 95% de los lotes tenen 0,,1, ó 3 pezas defectuosas). Ejemplo : los pesos en kg. de 100 alumnos de un colego venen dados por la tabla I n x n x (40, 48] 8 44 8 35 (48, 56] 5 30 1144 (56, 64] 9 60 59 1740 (64, 7] 1 68 80 148 (7, 80] 0 76 100 150 100 6184 Calcular la meda, la moda, la medana, los el tercer cuartl y el percentl P 35 143

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Meda: x = 6184 100 = 61,84 1 Moda: el ntervalo modal es (56, 64], y entonces Mo = e 1 1 a = = 56 + 7 8 7 8 = 59,73 Medana: el prmer ntervalo cuya frecuenca absoluta acumulada es mayor que 1 / = 50 es (56, 64]. Por tanto Me = e 1 a = 56 + 50 30 8 = 61,5 59 30 1 Q 3 : el prmer ntervalo cuya frecuenca absoluta acumulada es mayor que 3/4 = 75 3 1 es (64, 7]. Por tanto Q 3 = e 4 1 a = 64 + 75 59 8 = 70,095. Esto 1 80 59 quere decr que el 75% de los alumnos tenen un peso nferor a 70,095 kg. P 35 : el prmer ntervalo cuya frecuenca absoluta acumulada es mayor que 35 1 35/100 = 35 es (56, 64]. Entonces P 35 = e 100 1 a = 56 + 35 30 8 = 1 59 30 = 57,38. Es decr, el 35% de los alumnos tenen un peso nferor a 57,38 kg. 6.3. Meddas de dspersón Las meddas de centralzacón sntetzan la nformacón: representan la totaldad del conjunto de datos medante unos valores centrales. Sn embargo, un promedo no es sufcente. Es precso añadr tambén una medda de cómo de representatvo es dcho promedo. Consderemos las sguentes dstrbucones: A: 0 4 6 8 B: 10 10 0 35 45 que podrían representar los pesos de dos grupos de nños. Observamos que los dos grupos tenen el msmo peso medo: x = 4, sendo, no obstante, muy dferentes en cuanto a concentracón-dspersón de sus valores. En el grupo A los valores se encuentran próxmos a la meda, luego tenen poca dspersón. En el grupo B, los valores están alejados de la meda, estando formado por valores más dspersos. Al grado en que los datos numércos tenden a extenderse alrededor de un valor promedo (estadístco de centralzacón como la meda o medana, por ejemplo) se le llama varacón o dspersón de los datos. Se utlzan dstntas meddas de dspersón. Las más empleadas son: rango o recorrdo, recorrdo ntercuartílco, desvacón absoluta meda, varanza, desvacón típca y coefcente de varacón. osotros nos ceñremos a las más mportantes: varanza, desvacón típca y coefcente de varacón. 144

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Varanza y desvacón típca La más empleada de las meddas de dspersón es la varanza, que se defne como la meda de los cuadrados de las desvacones respecto a la meda; esto es, la meda de la varable : X X : k n (x x) Var(X) = k 1 = X X f (x x) Puesto que la varanza de X no vene dada en las msmas undades de X (s, por ejemplo, la varable vene dada en metros, la varanza resulta en metros cuadrados), en su lugar se emplea la desvacón típca,, defnda como 1 = + Var(X) = + En la medda en que la varanza o la desvacón típca tomen valores más o menos grandes, esto ndcará el grado de dspersón o alejamento de los datos respecto de la meda. En el caso trval de que todos los valores de la varable estén concentrados en un punto (que concdrá con la meda), estos estadístcos de dspersón se anularán. Hay una fórmula que se obtene del desarrollo de la expresón de la varanza que permte calcular ésta de manera smplfcada. Es la sguente: Var(X) = = k 1 nx x Coefcente de varacón Las meddas de dspersón estudadas hasta ahora se expresan en la msma undad de medda que la varable estadístca, desgnando meddas de dspersón absoluta. Esto presenta algunos problemas técncos: Cómo hacer comparacones entre dos dstrbucones de naturaleza dferente (alturas y pesos) o, aun sendo de la msma naturaleza, expresadas en undades dferentes (metros y pulgadas)? Por otro lado, una varacón de 100 en una sere de compras cuyo preco medo es de 1000 tene una repercusón muy dferente que la msma varacón de 100 en una sere de compras cuyo preco medo es de 1000000. Para resolver estos problemas recurrmos a una medda de dspersón relatva, que recbe el nombre de coefcente de dspersón o de varacón de Pearson: CV = x Esta es una medda abstracta que no tene dmensones. Tene las sguentes propedades: Suele expresarse en %: CV = x 100 145

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Cuanto menor es el coefcente de varacón más homogénea respecto a la meda es la dstrbucón. Cuanto más cerca de 0 esté, más representatva de la dstrbucón es la meda. A medda que se aleja de 0, la meda es menos representatva. Al ser una medda relatva, permte comparar dstrbucones del msmo tpo aunque tengan dstnto tamaño. Tene el nconvenente de que deja de ser útl cuando x está próxma a 0. Es ndependente de las undades utlzadas. Ejemplo: volvamos sobre el ejemplo de la págna 143 en el que se daban los pesos en kg. de 100 alumnos de un colego. Calculemos la varanza, la desvacón típca y el coefcente de varacón. Para ello vamos a dseñar la tabla de manera que nos sea útl para realzar los cálculos I n x x n x n x (40, 48] 8 44 1936 35 15488 (48, 56] 5 704 1144 59488 (56, 64] 9 60 3600 1740 104400 (64, 7] 1 68 464 148 97104 (7, 80] 0 76 5776 150 11550 100 6184 39000 Recordemos que x = smplfcada: = típca será: = + k 1 nx 6184 100 x = 61,84. Calcularemos la varanza con la fórmula = = + 95,8144 9,788. 39000 61,84 = 95,8144. Por tanto la desvacón 100 9,788 El coefcente de varacón es pues: CV = = 0,158, es decr la desvacón x 61,84 típca es el 16, % de la meda; por tanto, la meda es muy representatva de la poblacón. 146

n Pedro Castro Ortega Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Ejerccos y problemas 1. Completar los datos que faltan en la sguente tabla estadístca, donde (como se debe saber) n,, f y F son las frecuencas absolutas, absolutas acumuladas, relatvas y relatvas acumuladas. x n f F n x x 1 4 0,08 4 3 16 0,16 4 7 0,14 5 5 8 6 38 7 7 45 0,14 8 = n x Calcular la moda, meda, varanza y desvacón típca. Calcular el coefcente de varacón e nterpretarlo. Calcular la medana y los cuartles.. Las puntuacones obtendas por 0 personas en una prueba quedan reflejadas en el sguente hstograma de frecuencas absolutas. Calcular la moda, meda, varanza y desvacón típca. Calcular el coefcente de varacón e nterpretarlo. 9 8 7 6 5 4 3 1 0 (0, ] (, 4] (4, 6] (6, 8] (8, 10] x 3. Las calfcacones de dos grupos de dez alumnos en la Prmera Evaluacón en una certa asgnatura se recogen en la sguente tabla: Grupo A 0 1 1 3 5 5 6 8 8 9 Grupo B 4 4 4 5 5 6 6 8 Contestar razonadamente a las sguentes cuestones: a) Cuál de los dos grupos obtuvo mejores resultados? b) Qué grupo es más homogéneo? 147

Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable 4. La sguente tabla recoge los mnutos de retraso en la ncorporacón al trabajo de los empleados de una empresa: Retraso en mnutos (0, 4] (4, 8] (8, 1] (1, 16] (16, 0] úmero de empleados 5 15 18 10 4 a) Representar los datos medante un hstograma. b) Calcular el retraso medo y la desvacón típca. c) Calcular la medana y los cuartles y explcar qué mden estos parámetros. 5. En un estudo sobre el sueldo en euros de 50 personas se han obtendo los sguentes datos: Sueldo (500, 700] (700, 900] (900, 1300] (1300, 1500] (1500, 100] º de personas 10 10 0 9 1 a) Construr el hstograma (nótese que las clases tenen ampltudes desguales). b) Calcular la meda, la varanza, la desvacón típca y el coefcente de varacón y explcar el sgnfcado de estos parámetros. 6. Los pesos en klogramos de 50 personas venen dados por la tabla: Peso (50, 60] (60, 70] (70, 80] (80, 90] (90, 100] úmero de empleados 10 15 0 4 1 Calcular el peso medo, los cuartles y la desvacón típca. Interpreta los resultados. Se puede decr que es un grupo homogéneo? 7. La tabla de frecuencas que se da a contnuacón corresponde a la varable estadístca X = Poscón en la lga de un certo equpo, medda durante qunce años consecutvos: X 1º º 3º 4º 5º o peor úmero de veces 1 4 6 a) Indcar de qué tpo de varable se trata. b) Representar gráfcamente la dstrbucón en dagramas rectangular y en otro de sectores. c) Dar una medda de poscón central y otra de dspersón adecuadas al expermento. Explcar por qué lo son, así como su sgnfcado. 8. Hacer un estudo estadístco completo (dagramas, meddas de centralzacón, de poscón, de dspersón e nterpretacón de los resultados) del ejemplo 4.1 de la págna 18 y del ejemplo 4.3 de la págna 130. 148