Estadística Descriptiva

Documentos relacionados
Tema 1: Estadística Descriptiva Unidimensional

INTRODUCCIÓN. Técnicas estadísticas

Prueba de Evaluación Continua

Descripción de una variable

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Cálculo y EstadísTICa. Primer Semestre.

16/02/2015. Ángel Serrano Sánchez de León

1. Notación y tabulación

Tema 1: Análisis de datos unidimensionales

Medidas de Variabilidad

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

MEDIDAS DESCRIPTIVAS

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

ESTADÍSTICA. Definiciones

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

Estadística Unidimensional: SOLUCIONES

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Medidas de centralización

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Tema 6. Estadística descriptiva bivariable con variables numéricas

SEMANA 13. CLASE 14. MARTES 20/09/16

Variables Aleatorias

ESTADÍSTICA. x es el cociente entre la frecuencia absoluta del valor

Variables Aleatorias

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

17/02/2015. Ángel Serrano Sánchez de León

Tema 4: Variables aleatorias

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

ESTADÍSTICA (GRUPO 12)

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

2 Dos tipos de parámetros estadísticos

Estadísticos muéstrales

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos:

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

TEMA 1.- CONCEPTOS BÁSICOS

5ª Parte: Estadística y Probabilidad

Probabilidad Grupo 23 Semestre Segundo examen parcial

ESTADÍSTICA DESCRIPTIVA

Variable Estadística

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

3. VARIABLES ALEATORIAS.

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

EJERCICIOS PROPUESTOS TEMAS 1 Y 2

ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana.

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

9Soluciones a los ejercicios y problemas

ESTADÍSTICA (GRUPO 12)

Problemas donde intervienen dos o más variables numéricas

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

DEPARTAMENTO DE MATEMÁTICAS

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

CAPÍTULO 4 MARCO TEÓRICO

Variable Estadística

el blog de mate de aida CSI: Estadística unidimensional pág. 1

GUÍA DE APOYO AL APRENDIZAJE N 2

3 - VARIABLES ALEATORIAS

14 EJERCICIOS RESUELTOS ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

TEMA 10: ESTADÍSTICA

Medidas de Tendencia Central y de Variabilidad

Modelos lineales Regresión simple y múl3ple

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

LECTURA 03: DISTRIBUCIONES DE FRECUENCIAS (PARTE II)

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

ESTADÍSTICA UNIDIMENSIONAL

4) Ahora elaboremos la tabla de distribución de frecuencias: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE LOS PESOS DE LOS ESTUDIANTES MERU CALIDAD.

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

LECTURA 03: DISTRIBUCIONES DE FRECUENCIAS (PARTE II)

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

EJERCICIOS RESUELTOS TEMA 2

Tema 8: Estadística en una variable (unidimensional)

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

3º ESO ESTADÍSTICA DEPARTAMENTO DE MATEMÁTICAS. SAGRADO CORAZÓN COPIRRAI_Julio César Abad Martínez-Losa ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA

INTRODUCCIÓN AL ANÁLISIS DE DATOS SEPTIEMBRE 2014 Código asignatura: EXAMEN TIPO TEST MODELO B DURACION: 2 HORAS.

Introducción a la Física. Medidas y Errores

ESTADÍSTICA DESCRIPTIVA

1. ESTADÍSTICA DESCRIPTIVA.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objetos de nuestro estudio.

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA

, x es un suceso de S. Es decir, si :

ESTADÍSTICA DESCRIPTIVA

Transcripción:

Estadístca Descrptva ÍDICE ESTADÍSTICA DESCRIPTIVA. Poblacón y Muestra 4. Varables estadístcas 4 3. Frecuencas 5 4. Dstrbucones 7 5. Representacón gráfca 5. De caracteres cuanttatvos 5.. De varables estadístcas dscretas sn agrupar 5... Dagrama de barras 5... Polígono de frecuencas 5...3 Dagrama de frecuencas acumuladas 5.. De varables estadístcas dscretas con valores 4 agrupados en ntervalos 5... Hstograma 4 5... Polígono de frecuencas 4 5...3 Polígono de frecuencas acumuladas 5 5. De caracteres cualtatvos 7 5.. Dagramas de sectores 7 5.. Pctogramas 8 5..3 Cartogramas 8 6. Meddas de poscón o centralzacón 8 6. Meda artmétca 9 6. Moda 6.3 Medana 6.4 Cuantles 5 7. Meddas de dspersón. 9 7. Rango o recorrdo 9 Undad Docente de Matemátcas de la E.T.S.I.T.G.C.

Estadístca Descrptva 7. Recorrdo ntercuartílco 9 7.3 Varanza 9 7.4 Varanza muestral o cuasvaranza 3 7.5 Desvacón típca 3 7.6 Desvacón típca muestral 3 7.7 Coefcente de Varacón de Pearson 3 7.8 Momentos 33 8. Característcas de forma: 34 8. Sesgo o Coefcente de asmetría de Fsher 35 8. Curtoss o Coefcente de apuntamento 36 9. Dagrama de Caja 37 Undad Docente de Matemátcas de la E.T.S.I.T.G.C.

Estadístca Descrptva Es un hecho reconocdo que la Estadístca es necesara en todos los campos donde se avance en nvestgacón. Los prncpos estadístcos son ndependentes de la matera en la que se aplquen; los prncpos son generales aunque las técncas pueden ser dstntas. Se hace cenca cuando el estudo se ocupa de la observacón y clasfcacón de los hechos. Estadístca es la cenca de los datos. Los datos o hechos numércos son esencales para tomar decsones en cas todas las áreas de nuestra vda. Por ejemplo, llevar paraguas depende de la probabldad de lluva. S observamos que las meddas de una mujer son 90-60-90, esto sgnfca que esa persona tene unas proporcones que se consderan perfectas. En una empresa se manejan muchos datos sobre ventas, nventaros, personal, gastos, clentes, equpos, etc. Todos estos datos han de ser nterpretados de alguna forma, tarea que requere presentar los números de manera que su mensaje aparezca claramente. Para poder usar los datos con fnes concretos debemos resumrlos y descrbrlos; esta tarea corresponde a la estadístca descrptva. El análss de los datos combna resúmenes numércos con representacones gráfcas. Imagnemos que asstmos a una partda de dados: prmeramente observamos el desarrollo de la partda y anotamos los resultados (estadístca descrptva), como sabemos que con dos dados el resultado más probable es 7 (estadístca matemátca) y tomaremos la decsón de jugar o no dependendo de la comparacón de los resultados (nferenca estadístca). En la estadístca descrptva se ven cosas pero no se pueden probar de una manera formal. La estadístca descrptva y la estadístca matemátca son complementaras. El análss de datos requere una colaboracón dnámca entre el especalsta en el asunto (el que posee los datos) y estadístco (el que los analza). Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 3

Estadístca Descrptva El prmer paso en un análss de datos es su nspeccón, famlarzarse con los datos y encontrar característcas extraordnaras. El sguente paso es la comparacón: comparar datos y comparar modelos. Por últmo, la nterpretacón. Muy a menudo el cclo entero comenza de nuevo.. POBLACIÓ y MUESTRA Poblacón es un conjunto de elementos de los cuales nos nteresa estudar alguna característca común. El estudo que se haga servrá para conocer y descrbr a esa poblacón. Muestra es una parte de la poblacón. Los resultados que se obtenen de su estudo se tratan de extrapolar para toda la poblacón. La característca que queremos estudar de la poblacón presentará dversas modaldades que son los posbles valores que puede tomar. Los caracteres pueden ser: cualtatvos: las dversas modaldades no son valores numércos. Ejemplo: "el color del pelo de un grupo de personas". cuanttatvos: las dversas modaldades son números reales. Ejemplo: "el número de membros de las famlas que vven en Madrd". Estos números son los dferentes valores que toma una varable estadístca.. VARIABLES ESTADÍSTICAS Varable estadístca cuanttatva es una aplcacón que asgna a cada elemento de la poblacón un número real, que es el valor de la característca cuanttatva que estamos estudando. E = poblacón R Una varable estadístca es dscreta s sus valores posbles pertenecen a un conjunto numerable. El caso más frecuente de varables dscretas es aquel en que los valores posbles son números enteros. Así: Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 4

Estadístca Descrptva - El número de hjos en una famla. - El número (o la proporcón) de pezas defectuosas de un lote de 000 pezas. Una varable estadístca es contnua s sus valores posbles pertenecen a un conjunto no numerable, en general valores de R o de un ntervalo de R. - El dámetro de una peza. - La temperatura de un cuerpo. En general, todas las magntudes, relaconadas con el espaco, con el tempo, con la masa o ben las combnacones de estos elementos son varables estadístcas contnuas. Rango o recorrdo de la varable es la dferenca entre el valor máxmo y el valor mínmo de la varable. 3. FRECUECIAS Sea una poblacón de elementos, de la cual estudamos el carácter X que presenta las modaldades x, x,..., x. Para cada modaldad x se defne: Frecuenca absoluta, n, es el número de elementos que poseen la modaldad x. Se tene que n =. = Frecuenca relatva, f, es el cocente entre la frecuenca absoluta n y el número total de elementos, es decr, f n =. Se tene que f =. = Frecuenca absoluta acumulada,, es el número de elementos que poseen la modaldad x. o alguna de las anterores (para lo cual tenen que estar ordenadas prevamente), es decr, = j= n j. Se tene que =. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 5

Estadístca Descrptva Frecuenca relatva acumulada, F, es el cocente entre la frecuenca absoluta acumulada y el número total de elementos, es decr, F =. Se tene que F =. El estudo de las dstrbucones de frecuenca tene como objeto construr tablas vertcales u horzontales que se utlzarán para una mejor presentacón e nterpretacón de los datos obtendos en la muestra. En la prmera columna (fla) se escrben los valores de la varable y en la segunda el número de veces que se repte el valor de la varable. n X X f La tabla () formada por la varable junto con sus respectvas x n x f frecuencas absolutas se denomna dstrbucón de frecuencas x n x f absolutas......... n+ n +... + n = n = x f x n = Tabla Tabla La tabla (), formada por los valores de la varable junto con sus respectvas frecuencas relatvas, se denomna dstrbucón de frecuencas relatvas. X F X n f = = f +... + f = x F x = = n x F x.. x.. Tabla 3 = acumuladas. nj =, y se verfca j= = La tabla (3) es la dstrbucón de frecuencas absolutas F =, y se verfca F =... x.. F = Tabla 4 La tabla (4) es la dstrbucón de frecuencas relatvas acumuladas. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 6

Estadístca Descrptva Tambén es frecuente usar una tabla llamada sumaro estadístco, en la que aparecen los valores de la varable junto con los valores de los dstntos tpos de frecuenca. EJEMPLO 3: El número de hectáreas radadas por día, en un total de 90 días han sdo: 0,,, 0,,,,, 0,, 3,, 0,,, 0,,, 4, 0,,, 0, 3, 0, 0,, 3,, 0,,,,, 3,,, 0, 0,,, 3, 0, 0,,, 0,,, 3, 0,,,,, 0,,,, 4,, 0, 4, 5, 0,,, 0, 0,,, 0,,, 0, 0,,, 0,,, 0,,,,,,,,. Obtener la dstrbucón de frecuencas absolutas y la de frecuencas absolutas acumuladas. Solucón: Dstrbucón de frecuencas: Absolutas Absolutas acumuladas º de hectáreas º de días º de hectáreas º de días x n x 0 6 0 6 40 66 4 80 3 6 3 86 4 3 4 89 5 5 90 Total 90 Total 90 4. DISTRIBUCIOES Dstrbucón de frecuencas: es conjunto de modaldades con sus respectvas frecuencas. Según sean éstas (absolutas, relatvas,...) así lo será la dstrbucón correspondente. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 7

Estadístca Descrptva Las dstrbucones de frecuencas se representan medante tablas estadístcas. Se clasfcan en dos tpos: - Sn agrupar: aparecen los datos ndvdualzados con sus respectvas frecuencas. Se utlza cuando la varable toma pocos valores dferentes. - Agrupados en ntervalos se dvde el campo de la varable en ntervalos llamados de clase, que tendrán como frecuenca el número de elementos que estén en el ntervalo. Se utlza cuando la varable toma muchos valores dstntos entre sí. e0 < e < e <... < e La agrupacón en ntervalos tene la ventaja de la smplcdad de los cálculos, y el nconvenente de la pérdda de nformacón. Los ntervalos serán todos de la msma ampltud procurando que los datos se dstrbuyan más o menos homogéneamente a lo largo de todo el recorrdo, de forma que no haya nnguna clase con muchos elementos (más del 30%) n varas clases con pocos o nngún elemento (menos del 5%). Es mportante que no exstan ntervalos con frecuenca cero. El nº de ntervalos que se toma dependerá del número de datos y de la dspersón de los msmos. Algunos crteros a segur es tomar como el entero más próxmo a: a) +3.3log 0 () ; b) A los extremos del ntervalo se les llama límtes de clase (superor e nferor). Estos se deben tomar de forma que se solapen los ntervalos, es decr, que el extremo superor de uno sea el nferor del sguente. Para evtar la ambgüedad que suponen los valores de la varable que concdan con algún extremo, se pueden segur dos crteros: Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 8

Estadístca Descrptva - Inclur sempre el extremo superor, pero no el nferor de cada clase, salvo en la prmera que se ncluyen los dos. Es decr, tomar ntervalos de la forma (a,b]. - Tomar los extremos de los ntervalos con un decmal más que los dados, de forma que no pueda concdr con nnguno de ellos. Se llama marca de clase (x ) al punto medo del ntervalo de clase e - - e. En todos los cálculos se opera como s la marca de clase tuvera la frecuenca absoluta de todo su ntervalo. La marca de clase se obtene sumando los límtes superor e nferor de clase y ( e + e ) dvdendo por, es decr, x =. Tamaño de clase o ampltud de clase "a" es la dferenca entre los límtes de clase. e a = e 0 La dstrbucón de frecuencas quedaría así: Intervalo Marca de clase x Frecuenca absoluta Frecuenca relatva Frecuenca relatva acumulada Frecuenca absoluta acumulada [ e 0, e ] x n f F ( e, e ] x n f F.................. ( e, e ] x n f F.................. ( e, e ] x n f Desgnamos por (n ) al número de observacones que quedan dentro del ntervalo [ e, e ). EJEMPLO 4: Los precos de 95 ordenadores en dcembre de 04, dados en euros, son los sguentes: Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 9

Estadístca Descrptva 3000 00 740 750 3409 580 840 700 300 75 390 545 380 85 565 3000 890 580 800 3650 40 975 745 3030 350 3700 735 990 800 930 95 00 80 63 40 050 3600 60 600 735 460 500 000 000 600 900 50 495 300 850 540 900 4500 3600 035 50 495 357 750 75 775 540 470 395 3900 995 00 900 500 500 995 650 335 885 360 00 400 00 335 330 600 755 500 990 765 00 630 555 640 950 630 500 300 3500 85 Obtener una dstrbucón de frecuencas agrupadas. Solucón: El más caro es 4500 y el más barato 360, luego el recorrdo es 4500-360 = 440. Elegmos ntervalos de la msma ampltud de modo que, los datos se dstrbuyan de forma relatvamente homogénea a lo largo del recorrdo. Con el crtero, gual al entero próxmo a: + 3.3 log 0(95) 7.6, elegmos 7 ntervalos de ampltud 600 y semabertos (a,b]. DISTRIBUCIÓ DE FRECUECIAS ITERVALO MARCA DE CLASE ABSOLUTA ABSOLUTA ACUMULADA RELATIVA RELATIVA ACUMULADA e e x n f F 300-900 600 7 7 0.84 0.84 900-500 00 6 53 0.737 0.558 500-00 800 4 67 0.474 0.705 00-700 400 78 0.58 0.8 700-3300 3000 6 84 0.063 0.884 3300-3900 3600 8 9 0.084 0.968 3900-4500 400 3 95 0.036.000 Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 0

Estadístca Descrptva 5. REPRESETACIÓ GRÁFICA Una buena representacón gráfca, junto con las tablas de frecuencas anterormente ctadas, permten captar rápdamente las característcas de la muestra así como resumr y analzar los datos. Según sean los datos, las gráfcas se pueden clasfcar en: De Caracteres Cuanttatvos. Varable estadístca dscreta sn agrupar. Dagrama de barras. Polígonos de frecuencas. Dagrama de frecuencas acumuladas. Varable estadístca dscreta con frecuencas agrupadas en ntervalos. Hstograma. Polígonos de frecuencas. Polígonos de frecuencas acumuladas. De Caracteres Cualtatvos. Dagrama de barras. Dagrama de sectores. Pctogramas. Cartogramas 5. De caracteres cuanttatvos 5.. Para varables dscretas (sn agrupar): DIAGRAMA DE BARRAS Esta representacón es válda para las frecuencas de una varable dscreta, sn agrupar. Se colocan sobre el eje de las abscsas los dstntos valores de la varable y sobre cada uno de ellos se levanta una línea o barra perpendcular, cuya altura es la frecuenca (absoluta, relatva) de dcho valor. Undad Docente de Matemátcas de la E.T.S.I.T.G.C.

Estadístca Descrptva En caso de utlzarse para comparar muestras dstntas de una msma varable, se debe tener precaucón, ya que, en este caso, debemos usar frecuencas relatvas para elmnar la nfluenca vsual que ejerce el tamaño de cada una de las muestras. POLÍGOO DE FRECUECIAS Es una línea que se obtene unendo los extremos superores de las barras en el dagrama de barras. 6 4 0 8 6 4 0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 frecuenca (absoluta o relatva) DIAGRAMA DE FRECUECIAS ACUMULADAS Dagrama de frecuencas acumuladas o dagrama de barras acumulatvo. Representamos en el eje de abscsas los dstntos valores de la varable estadístca. Levantamos sobre cada uno de ellos un perpendcular cuya longtud será la frecuenca (absoluta o relatva) acumulada correspondente a ese valor. De esta forma aparece un dagrama de barras crecente. Trazando segmentos horzontales de cada extremo de barra a cortar la barra stuada a su derecha se obtene el dagrama de frecuencas acumuladas. 40 35 30 5 0 5 0 5 0 x Se trata de poder observar la acumulacón de frecuencas hasta un valor determnado de la varable; por ello, es muy útl para calcular percentles de una forma gráfca. Undad Docente de Matemátcas de la E.T.S.I.T.G.C.

Estadístca Descrptva EJEMPLO 5.: El número de hectáreas radadas por día, en un total de 90 días han sdo: 0,,, 0,,,,, 0,, 3,, 0,,, 0,,, 4, 0,,, 0, 3, 0, 0,, 3,, 0,,,,, 3,,, 0, 0,,, 3, 0, 0,,, 0,,, 3, 0,,,,, 0,,,, 4,, 0, 4, 5, 0,,, 0, 0,,, 0,,, 0, 0,,, 0,,, 0,,,,,,,,. Se pde: a) Dagrama de barras. b) Polígono de frecuencas. c) Construr el dagrama de frecuencas acumuladas. Solucón: a) Dagrama de barras de frecuencas absolutas b) Polígono de frecuencas absolutas: 40 35 30 5 0 5 0 5 0 0 3 4 5 Polígono de frecuencas absolutas c) Dagrama de frecuencas absolutas acumuladas Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 3

Estadístca Descrptva 5.. Representacón gráfca de varables estadístcas dscretas con valores agrupados en ntervalos HISTOGRAMA Es la representacón gráfca más frecuente para datos agrupados. En un hstograma se representan las frecuencas medante áreas. De tal forma que un hstograma es un conjunto de rectángulos que tenen como base los ntervalos de clase y cuya superfce son las frecuencas (absolutas o relatvas). Por tanto, los rectángulos tenen que solaparse (varable agrupada en ntervalos) y el área de cada rectángulo será proporconal a la frecuenca (n o f ) del ntervalo. En cuyo caso las alturas son proporconales a las frecuencas, y será el cocente entre la frecuenca y la ampltud del ntervalo. S algún ntervalo es de dstnta ampltud, el cálculo de su altura (h ) se efectuará hallando el n f cocente h = o h =, donde a representa la ampltud del ntervalo. a a n a f a n f e - e e - e POLÍGOO DE FRECUECIAS El polígono de frecuencas es una línea que se obtene unendo los puntos medos de las bases superores (los techos) de cada rectángulo en el hstograma. De forma que empece y Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 4

Estadístca Descrptva acabe sobre el eje de abscsas, en el punto medo del que sería el ntervalo anteror al prmero y posteror al últmo respectvamente. POLÍGOO DE FRECUECIAS ACUMULADAS En el eje de abscsas representamos los dstntos ntervalos de clase que han de estar naturalmente solapados. Sobre el extremo superor de cada ntervalo se levanta una línea vertcal de longtud equvalente a la frecuenca (absoluta o relatva) acumulada del msmo. Se obtene así un dagrama de barras crecente, que unendo sus extremos da lugar al polígono de frecuencas acumuladas. Alcanzará su máxma altura en el últmo ntervalo, que tendrá de frecuenca o según se trate de frecuencas acumuladas absolutas o relatvas. e e e e e 0 + Es muy útl para calcular percentles de una forma gráfca. El gráfco se obtene al unr medante una polgonal los puntos (e, ) o (e, F ). Al ser un gráfco de datos agrupados en ntervalos, el polígono sempre empeza en (e 0, 0) y acaba en (e, ) o (e, ). Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 5

Estadístca Descrptva EJEMPLO 5.: Los precos de 95 ordenadores en dcembre de 04, dados en euros, son los sguentes: 3000 00 740 750 3409 580 840 700 300 75 390 545 380 85 565 3000 890 580 800 3650 40 975 745 3030 350 3700 735 990 800 930 95 00 80 63 40 050 3600 60 600 735 460 500 000 000 600 900 50 495 300 850 540 900 4500 3600 035 50 495 357 750 75 775 540 470 395 3900 995 00 900 500 500 995 650 335 885 360 00 400 00 335 330 600 755 500 990 765 00 630 555 640 950 630 500 300 3500 85 a) Dbujar el hstograma b) Polígono de frecuencas. c) Polígono de frecuencas acumuladas. Solucón: a) Hstograma 30 5 frecuencas absolutas 0 5 0 5 0 0 3 4 5 Preco (X 000) b) Pol gono de frecuencas 30 5 Frecuenca absoluta 0 5 0 5 0 0 3 4 5 Preco (X 000) Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 6

c) Estadístca Descrptva Pol gono de frecuencas acumuladas 00 80 Frecuencas acumuladas 60 40 0 0 0 3 4 5 Preco (X 000) 5. Representacones gráfcas de varables estadístcas cualtatvas. Exste una gran multtud de gráfcos para representar los datos de una muestra o poblacón de una varable estadístca cualtatva. osotros solo mostramos algunos de ellos. DIAGRAMAS DE BARRAS Se representan en el eje de abscsas los dstntos caracteres cualtatvos y se levantan sobre ellos rectángulos de bases guales que no tenen que estar solapados y cuyas alturas serán las correspondentes a la frecuenca absoluta de cada carácter. 5000 4000 3000 000 000 0 36 3870 830 438 060 Matemátcas Flosofa Derecho Económcas Químcas DIAGRAMA DE SECTORES En un círculo se asgna un sector crcular a cada uno de los caracteres cualtatvos, sendo la ampltud del sector proporconal a la frecuenca del carácter. Económcas 30% Químcas 5% Matemát. 5% Derecho 3% Flosofía 7% Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 7

Estadístca Descrptva PICTOGRAMAS Cada modaldad se representa por un dbujo de tamaño proporconal a la frecuenca de la msma. Tambén es frecuente tomar un dbujo estándar y repetrlo un número de veces proporconal a la frecuenca. CARTOGRAMA Es la representacón sobre mapas del carácter estudado. Usualmente las dstntas modaldades que adopta este carácter se representan con colores de dstnta ntensdad o dstntas tramas; como ejemplo podemos observar el cartograma elaborado por el Insttuto de Estadístca de la Comundad de Madrd. Consejería de Economía y Consumo sobre la renta per cápta del año 004 en la Comundad de Madrd. Los parámetros estadístcos son certos valores representatvos de un conjunto de datos, en el sentdo de condensar en ellos la nformacón contenda en dcho conjunto. Estos parámetros estadístcos nos proporconarán nformacón acerca de la stuacón, dspersón y forma de los datos. En este curso estudamos las sguentes meddas o parámetros: 6. MEDIDAS DE POSICIÓ Y CETRALIZACIÓ Tenen por objeto dar una dea del valor o valores de la varable, alrededor de los cuales se agrupa una cantdad de datos. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 8

Estadístca Descrptva 6.. Meda artmétca. La meda, meda artmétca o promedo de una varable estadístca es la suma ponderada de los valores posbles por sus respectvas frecuencas. n x + n x +... + n x X = = nx = = fx = x = valores que toma la varable o marca de clase. f = frecuencas relatvas. n = frecuencas absolutas. = número total de la poblacón o muestra. PROPIEDADES: ) La meda de las dferencas a la meda es nula, es decr, la suma de las desvacones de los valores de la varable estadístca respecto de su meda es cero. (x X) f = x f X f = X X f = X X= 0 = = = = ) La suma de los cuadrados de las desvacones de los valores de la varable respecto de cualquer número α es mínma para α = X Γ( α) = ( x α) f = Γ ( α) = ( x α) ( ) f = 0 x f α f = 0 x f = α = = = = α=x Y en efecto, es mínmo: Γ ( α) = = > 0 = f 3) S se suma una constante a a los valores de la varable, la meda queda aumentada en dcho valor a. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 9

Estadístca Descrptva a X a x f a xf a X 4) S se multplcan todos los valores de la varable estadístca X por una constante a, la meda queda multplcada por la constante b. bx bx f b x f bx Podemos conclur que para una nueva varable Y=a+bX se cumple que Y a bx. 5) La meda artmétca está comprendda entre el valor máxmo y el valor mínmo del conjunto de datos. Solo es aplcable para varables estadístcas cuanttatvas. o depende del orden en el que estén colocados los datos. Es más representatva cuanto mayor sea la concentracón de los valores alrededor suyo y más smétrca sea la dstrbucón. Es muy sensble a la presenca de datos extremos. ota: Cuando no todos los datos tenen la msma mportanca con respecto del resto, se le asgna los llamados pesos o ponderacones, se le llama meda artmétca ponderada. x w x w... x w X w w... w x = valores que toma la varable o datos. w = pesos. xw w Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 0

Estadístca Descrptva 6. Moda, M 0, es el valor de la varable que se presenta con más frecuenca dentro de la dstrbucón. En las dstrbucones sn agrupar se observa drectamente el valor de mayor frecuenca. En las agrupadas, defnmos la clase o ntervalo modal como la que tene mayor frecuenca. OTA: Algunas dstrbucones pueden presentar varas modas. Cada moda corresponde a un máxmo absoluto del dagrama de barras o hstograma. La moda tene la ventaja de ser fácl su cálculo, pero tene el nconvenente de que dos muestras con datos muy parecdos pueden tener modas muy dstntas. Es mportante observar que al agrupar en ntervalos perdemos nformacón acerca del auténtco valor modal. 6.3 Medana, M, es el valor de la varable que ocupa el lugar central de los valores de la varable una vez que éstos han sdo ordenados en sentdo crecente. Por tanto, la medana M es un valor de la varable tal que el 50% de los datos son nferores y el otro 50% de los datos son superores. La medana es un valor M tal que F(M)=/, se defne así como raíz de una ecuacón. Cálculo de la medana. En prmer lugar ordenamos los datos de menor a mayor. a) S los datos no están agrupados en ntervalos, en general, no tene solucón, puesto que la funcón F(x) varía por saltos: ) S nngún valor posble x corresponde a F(x )=/ se convene en consderar como medana el valor x tal que: F( x ) < < F( x ) Undad Docente de Matemátcas de la E.T.S.I.T.G.C.

o lo que es gual: y con frecuencas absolutas: Estadístca Descrptva f + f +... + f < < f + f +... + f + f n + n +... + n < < n + n +... + n + n F(x) / / M x EJEMPLO: Sea la varable estadístca X={5,, 5,, 4,, 3, 6, 5}, entonces X={,,, 3, 4, 5, 5, 5, 6,},resultando el térmno central M=4. ) S uno de los valores x corresponde a F( x ) = (lo que ocurre solamente s el total de la poblacón es par) la medana está ndetermnada entre los valores x y x +. El ntervalo (x, x + ) se denomna medano, o ben llamamos medana al punto medo de dcho ntervalo. F(x) / M x x + x Undad Docente de Matemátcas de la E.T.S.I.T.G.C.

Estadístca Descrptva EJEMPLO: Sea la varable estadístca X={4,, 5,,, 3, 4, 5,}, entonces X={,,, 3, 4, 4, 5, 5}, resultando el ntervalo medano [3, 4], o ben M=3.5. En la tabla estadístca, la medana se determna a partr de la columna que da las frecuencas relatvas (o las frecuencas absolutas) acumuladas. Otra forma de calcular la medana es: x x... x x + s es mpar M = x + x s es par + b) S los datos están agrupados en ntervalos: ITERVALO x n e 0 --- e x n e --- e x n............ e - --- e x n............ e - --- e x n ) concde con uno de los recogdos en la columna de frecuencas acumuladas, por ejemplo, en este caso la medana es e. ) está entre - y. La medana se encontrará en el ntervalo ( e -,e ). La medana será M = e - + h y por nterpolacón lneal se obtene h. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 3

/ - EJEMPLO: Estadístca Descrptva Se tene: n e -e = a - - - h M = e - + h La nterpolacón lneal anteror puede resumrse en la fórmula: a M = e + n Consderemos los salaros de los empleados en una fábrca, el drector gana 48000 /mes, el subdrector 0000 /mes, ses jefes 5000 /mes cada uno, los cnco capataces 4000 y los dez operaros 000 cada uno Cuál es el salaro medo? Cuál el salaro medano? y Cuál el salaro modal? Solucón: e - h Gráfco 6.3 Medana x 000 4000 5000 0000 48000 totales n 0 5 6 e 0 5 3 3 n X nx 38000 6000 meda artmétca. 3 = = = = 3 = =.5 = 0 <.5 < 5 = luego la medana es x 4 =4000 y la moda corresponde a n =0 que es 000. Cuál de los tres valores anterores descrbe mejor los sueldos percbdos por los empleados de ésta fábrca? La generalzacón del concepto de la medana da lugar a nuevas meddas de poscón que llamaremos cuantles. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 4

Estadístca Descrptva 6.4. Cuantles Cuantl de orden α es un valor de la varable estadístca que deja a su zquerda una parte α de la poblacón y a la derecha una parte - α de la poblacón. El Cuantl de orden α (0 α ) es x α F(x α )=α. Los más utlzados son los cuartles Q, Q y Q 3 que dejan a su zquerda /4, / y 3/4 de la poblacón respectvamente. Obsérvese que Q = M (Medana). Los decles D, D,..., D 9 dejan a su zquerda /0, /0,..., 9/0 de la poblacón respectvamente. Los percentles P, P,..., P 99 dejan a su zquerda /00, /00,... 99/00 de la poblacón respectvamente. El cálculo de los msmos es smlar al cálculo de la medana. Cálculo de cuantl de orden α x x... x x [ a ] + s a no es un número natural xa = ( x a+ x a + ) s a es un número natural Donde [ ], los corchetes sgnfcan la parte entera del producto, es decr, el menor entero mayor o gual que α. Observen que en todos los casos depende de que α sea entero o no lo sea. En el caso de que los datos estén agrupados en ntervalos, el cálculo se realza de forma semejante a como se realza para la medana, pero todo referdo al ntervalo que contenga el valor de la frecuenca α, según sea el cuantl a calcular. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 5

α - h e - P α Gráfco 6.4 Estadístca Descrptva e n S α está en el ntervalo [e -, e ); n e e = a a h α P = e + h por tanto, la nterpolacón lneal anteror se puede resumr en la fórmula: P ( a ) a a = e +. n EJEMPLO 6.4: Los precos de 95 ordenadores en dcembre de 04, dados en euros, son los sguentes: 3000 00 740 750 3409 580 840 700 300 75 390 545 380 85 565 3000 890 580 800 3650 40 975 745 3030 350 3700 735 990 800 930 95 00 80 63 40 050 3600 60 600 735 460 500 000 000 600 900 50 495 300 850 540 900 4500 3600 035 50 495 357 750 75 775 540 470 395 3900 995 00 900 500 500 995 650 335 885 360 00 400 00 335 330 600 755 500 990 765 00 630 555 640 950 630 500 300 3500 85 Se pde: a) Cuartles. b) Segundo decl. c) Percentl ochenta y ses. d) Para un preco de 3000 que poscón ocupa en la dstrbucón? Solucón: Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 6

Estadístca Descrptva e e x n 300-900 600 7 7 900-500 00 6 53 500-00 800 4 67 00-700 400 78 700-3300 3000 6 84 3300-3900 3600 8 9 3900-4500 400 3 95 Sumas = 95 Medana: La medana es el valor de la varable cuya frecuenca acumulada es /. 95 = = 47 5 900,500 ( ) Observando la tabla de frecuencas acumuladas, vemos que la medana está en el ntervalo 900-500 El valor exacto lo calculamos por nterpolacón, suponendo que los elementos de un ntervalo se dstrbuyen unformemente a lo largo del msmo. La frecuenca acumulada al fnal del ntervalo anteror (300, 900) es 7. Por tanto, faltan 0.5 de los 6 elementos que consttuyen el ntervalo (900, 500) de ampltud 600. Gráfcamente 53 47.5 7 47.5 7 = 0.5 h 53 7 = 6 600 900 M 500 M = 900 + h = 900 + 473.077 = 373.077 Por tanto el preco medano es 373.077. Los cuartles los obtenemos de forma smlar a la medana. Al prmer cuartl le corresponde frecuenca acumulada Al tercer cuartl le corresponde frecuenca acumulada (47.5 7) 600 h = = 473.077 6 95 = = 3.75 4 4 3 95 = = 7.5 4 4 Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 7

Estadístca Descrptva 7 Gráfcamente 78 Gráfcamente 3.75 7.5 0 67 900 300 MQ 500 900 00 Q 3 700 3.75 0 = 3.75 h 7 0 = 7 600 3.75 h = 600 = 57.777 7 7.5 67 = 4.5 h 78 67 = 600 4.5 h = 600 = 3.88 Q = 300 + h = 300 + 57.777 = 87.777 Q3 = 00 + h = 00 + 3.88 = 33.88 El segundo cuartl es la medana = 373.077. b) Al segundo decl le corresponde frecuenca 95 = = 9 0 5 9 0 = 9 h 7 0 = 7 600 acumulada 9 0 7 h 300 900 D 7 9 600 D = 300 + h = 300 + = 7. 7 c) Al percentl ochenta y ses le corresponde frecuenca acumulada 86 86 95 = = 8.7 00 00 (8.7 78) 600 P86 = 700 + h = 700 + = 3070 6 d) Se plantea el problema recproco del anteror (3000 700) 6 = 78 + = 78 + = 8 600 Sobre el total representa aproxmadamente el percentl 85. http://asgnaturas.topografa.upm.es/ma tematcas/vdeos/percentl.wmv 8.7 84 78 84 78 h 700 3300 P 86 700 3000 3300 6 6 Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 8

Estadístca Descrptva 7. MEDIDAS DE DISPERSIÓ Las meddas de dspersón nos dan una dea de la mayor o menor concentracón de los valores de la varable alrededor de algún valor. EJEMPLO: S consderamos 8 alumnos con calfcacón de 0 y 8 alumnos con un cero; la meda artmétca será 5. S los 6 alumnos tenen un 5, la meda tambén será cnco, sn embargo, las dos stuacones son claramente dstntas y la meda es más representatva en el segundo caso, al estar los valores concentrados en un únco valor. La dferenca entre uno y otro caso se pone de manfesto con las meddas de dspersón. 7.. Rango o recorrdo Es la dferenca entre el mayor y el menor valor de la varable estadístca. EJEMPLO: S las observacones son: 8, 3, 5, 7,,, 8, el recorrdo es 8-=7. Es una medda muy senclla de calcular, pero, poco robusta, pues solo tene en cuenta los valores extremos. Para evtar la nfluenca en el rango de los datos con valores extremos, suele ser frecuente utlzar el rango o recorrdo ntercuartílco. 7.. Rango o recorrdo ntercuartílco El rango o recorrdo ntercuartílco o desvacón cuartílca es la dferenca entre los cuartles Q y Q 3 y se representa por IQR. IQR = Q3 Q Su cálculo es muy sencllo, y es una medda muy robusta en el sentdo de no estar nfluencada por la presenca de valores extremos. Del ejemplo 6.4, sabemos que Q3 = 33.88 y Q = 87.777, por tanto, IQR=54.04. Es fácl observar que el recorrdo ntercuartílco contene el 50% de las observacones centrales. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 9

7.3. Varanza Estadístca Descrptva Es la meda de los cuadrados de las desvacones a la meda. ( ) ( ) σ = x X n = x X f = = x = valores que toma la varable o marca de clase. f = frecuencas relatvas. n = frecuencas absolutas. = número total de elementos de la poblacón o muestra. Propedades de la varanza ) La varanza es sempre postva o nula. ) S se multplcan todos los valores de la varable por una constante a, la varanza queda multplcada por la constante a. S y = ax entonces: ( ) ( ) y y Y f a x X f a x = = σ = = = σ 3) S sumamos una constante b a los valores de la varable, la varanza no camba. S y= b+ x entonces: ( ) ( ) ( ) y y Y f (b x ) (b X) f x X f x = = = σ = = + + = =σ Podemos conclur que para una nueva varable Y=aX+b se cumple que σ = a σ. y x 4) La varanza es la meda de los cuadrados de la varable, menos el cuadrado de la meda de la varable. ( x X) f ( x f x Xf X ) f x = = σ = = + = xn = X xf X = σ = = = xf X Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 30

Estadístca Descrptva 5) Cuanto mayor sea la varanza, menos representatva es la meda. 7.4. Varanza muestral o cuasvaranza. S los datos que estamos analzando son todos los elementos de la poblacón la varanza nos es útl para analzar la dspersón de dchos datos respecto de la meda. Por el contraro, s los datos son una muestra de la poblacón, la varanza nos srve para analzar la dspersón de dcha muestra, pero, nos srve para analzar la dspersón de la poblacón? S tomamos ahora otra muestra de la msma poblacón, obtendremos una varanza de esta segunda muestra, etc. Para cada muestra tendremos el valor de su varanza correspondente. Sería deseable que la meda de todo este conjunto de varanza muéstrales fuese la varanza de la poblacón. Pero esto no es así (como se demuestra en Inferenca Estadístca). Sn embargo, sí hay una medda de dspersón, la varanza muestral que cumple esta condcón, es decr tal que la meda de las cuasvaranzas muéstrales es la varanza de la poblacón. Es por esto por lo que a veces se calcula la cuasvaranza (varanza muestral) en lugar de la varanza. La varanza muestral vene dada por: S = σ, es decr: S (x X) n (x X) n = σ = = = = ótese que para sufcentemente grande la dferenca entre σ y S es muy pequeña. 7.5 Desvacón típca La desvacón típca o desvacón cuadrátca meda es la raíz cuadrada postva de la varanza. σ = + ( σ ) = + ( x X) f = o ben, σ = + x f X Tene la ventaja sobre la varanza de que está medda en las msmas undades que la varable. = 7.6 Desvacón típca muestral. La desvacón típca muestral es la raíz cuadrada postva de la varanza muestral. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 3

Estadístca Descrptva (x X) n S = = σ = 7.7 Coefcente de varacón de Pearson Es el cocente de la desvacón típca y la meda. CV = X σ Es frecuente expresarlo en tanto por cento. Es ndependente de la undad que se utlce, pues no tene undades y por tanto nos permte comparar la dspersón de dos dstrbucones que tengan undades dferentes, o que tengan medas muy dstntas. Tene el nconvenente de no estar defndo para dstrbucones con meda cero. Además, cuando la meda se aproxma a cero el coefcente de varacón tende a nfnto. EJEMPLO 7: Con los datos del ejemplo 5., calcular: a) Varanza y desvacón típca. b) Varanza y desvacón típca muestral. c) Coefcente de varacón de Pearson. Solucón: x n x n x x n 0 6 0 6 0 0 40 40 66 40 4 8 80 4 56 3 6 8 86 9 54 4 3 89 6 48 5 5 90 5 5 Sumas 90 03 3 5 a) Meda: x = x n = 03 = 4. 90 = 0 Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 3

Estadístca Descrptva 5 Varanza: σ 90 3 03 = = 680 x n X =. 90 = 0 Desvacón típca; σ = ( σ ) =. 680 =. 0807 b) Varanza muestral; S = 90 σ =. 680 =. 8 89 90 Desvacón típca muestral; S = = = σ 0807 0867 89.. c) Coefcente de varacón; σ.0807 CV = = = 0.9443 X.444 7.8. Momentos Se llama momento de orden r respecto al valor "c", a la cantdad: r ( x c) f = ( x c) = = r n, donde r es un entero postvo. Según los valores de "c", se defnen varas clases de momentos: Momentos no centrales o respecto al orgen, c = 0 m = x r f x r n r = = = Los prmeros momentos no centrales son guales a: m 0 = ; m = X Momentos centrales o respecto a la meda c X x X f x X n r r = µ r = ( ) = ( ) = = Los prmeros momentos centrales son guales a: µ 0 = ; µ = 0; µ = σ = µ µ Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 33

Estadístca Descrptva Relacón entre los momentos centrales y no centrales. Desarrollando por la fórmula del bnomo de ewton las relacones de defncón: r r µ r ( x X) f ( x µ ) f = = = = = r r r r r r r r r = xf x fm+ x fm +... + ( ) m f = 0 r r r r r r = m m m + m m +... + ( ) m = ( ) m m 0 r j r r r j j r r r r j j= 0 r m = r j j r ( ) m r jm j= 0 j En partcular: m = m mm + m = m m 0,resultado ya conocdo. 3 µ 3 = µ 3 3µ µ + µ = µ 4µ µ + 6µ µ 3µ µ 4 4 3 4 8. CARACTERÍSTICAS DE FORMA Además de la tendenca central y de la dspersón, se puede tratar de caracterzar la forma de una dstrbucón medante índces que determnen la asmetría y el apuntamento de la dstrbucón. Asmetría. Una dstrbucón de frecuencas es smétrca s su correspondente gráfco es smétrco respecto a un eje vertcal. S la dstrbucón es smétrca, la medana y la meda concden. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 34

Estadístca Descrptva Me = X S la dstrbucón es smétrca y unmodal, la medana, meda y moda concden. M = X = M e o Una dstrbucón con asmetría por la derecha o postva, quere decr que la gráfca de frecuencas descende más lentamente por la derecha que por la zquerda. En este caso se verfc a que Mo Me X. Una dstrbucón asmétrca por la zquerda o negatva, quere decr que la gráfca de frecuencas descende más lentamente por la zquerda que por la derecha. En este caso se verfca que: X M M. e o 8. Coefcente de Asmetría de Fsher o sesgo. El coefcente de asmetría de Fsher, se defne como el cocente µ σ ( ) 3 3 = g = = 3 3 x X f σ 3 S la muestra es smétrca respecto de la meda, entonces ( x X) = 0; mentras que esta suma será mayor en valor absoluto cuanto más asmétrcos son los datos. = Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 35

Estadístca Descrptva Es un coefcente admensonal y mde la asmetría respecto de la meda. S g =0 la dstrbucón es smétrca o no sesgada. S g <0 la dstrbucón es asmétrca o sesgada a la zquerda y X Me Mo. S g >0 la dstrbucón es asmétrca o sesgada a la derecha y Mo Me X. 8. Coefcente de apuntamento o curtoss El coefcente de apuntamento de Fsher se defne e nterpreta como sgue: ( ) 4 x X f µ 4 = g = 3= 3. 4 4 σ σ Se mde en relacón a la dstrbucón ormal, de la msma meda y desvacón típca. De forma que es nulo para la dstrbucón normal. S el coefcente es postvo la dstrbucón está más apuntada que la dstrbucón ormal (de la msma meda y desvacón típca), y se dce leptocúrtca. S es menos apuntada el coefcente es negatvo y se dce platcúrtca. Mesocúrtca es cuando el coefcente es nulo. S la dstrbucón estudada tene por meda X y desvacón típca σ, entonces: S g >0, la dstrbucón es más apuntada que la normal ( X,σ ). S g <0, la dstrbucón es menos apuntada que la normal ( X,σ ). El apuntamento como medda de forma es relatva. Su defncón se hace por comparacón con la dstrbucón normal de la msma meda y varanza. Es mayor cuanto mayor sea la concentracón de los valores alrededor de la meda. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 36

Estadístca Descrptva EJEMPLO: 8 Con los datos del ejemplo 5., calcular: a) Coefcente de asmetría. b) Coefcente de curtoss. Solucón: a) Las operacones para el cálculo de μ 3 y μ 4 las dsponemos en la sguente tabla: e e x n n x 3 n x 4 n x 300 900 600 7 600 583.0 6 3499.0 8 900 500 00 6 300 4498.0 6 53936.0 8 500 00 800 4 500 8648.0 6 469664.0 8 00 700 400 6400 5064.0 6 3649536.0 8 700 3300 3000 6 8000 6000.0 6 4860000.0 8 3300 3900 3600 8 8800 37348.0 6 343698.0 8 3900 4500 400 3 600 64.0 6 9335088.0 8 = 95 58400 04984.0 6 3335344.0 8 Según vmos en el ejemplo 5.: 7 nx = m = X = 667.368, m = = 3857684., y ahora, 7 7 3 4 nx nx = = 3 4 m = = 09685630 y m = = 3507930947.0 4 Utlzando las fórmulas del 7.8, tenemos: m = m 3m m + m = 94669.0 3 8 3 3 µ 3 y como σ = 038.06 el coefcente de asmetría es: g = 3 = 0.84755 σ b) =75595.0 8 µ 4 resulta g = 3= 4 σ 6.04 Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 37

Estadístca Descrptva 9. DIAGRAMA DE CAJA Uno de los objetvos prncpales de la Estadístca es el de obtener nformacones útles a partr de los datos dsponbles. Por ello, es muy mportante que los datos que utlcemos sean fables (no contengan errores) y, por tanto, en todo tratamento estadístco es convenente efectuar un proceso de depuracón y estudo de los datos. Los valores atípcos o erróneos, por ser nusualmente grandes o pequeños, en general son atrbubles a una de las sguentes causas: El valor se observa y se regstra o ntroduce en el ordenador ncorrectamente. El valor provene de una poblacón dstnta. El valor es correcto, pero representa un suceso poco común. El problema que se nos presenta es decdr s un determnado dato, con un valor poco común, puede ser utlzado, o por el contraro lo hemos de rechazar. La respuesta no es fácl, ya que s rechazamos datos de forma nadecuada, podemos perder nformacón valosa y, por el contraro, s los aceptamos, puede varar los resultados de forma que nuestras conclusones sean erróneas. En la actualdad exste gran multtud de procedmentos que nos facltan el tomar una decsón sobre la depuracón de datos. Los hstogramas y los polígonos de frecuenca proporconan mpresones vsuales acerca de un conjunto de datos. Las cantdades numércas, tales como la meda o varanza, proporconan nformacón acerca de alguna característca partcular de los datos. Los dagramas de caja son unas representacones gráfcas que descrben smultáneamente varas característcas mportantes de un conjunto de datos, como son el centro, la dspersón y la asmetría, pero tambén permten dentfcar observacones que caen nusualmente lejos del grueso de los datos, los puntos atípcos, (Outlers). Es un gráfco representatvo de las dstrbucones de un conjunto de datos en cuya construccón se usan cnco meddas descrptvas de los msmos, a saber: medana, prmer cuartl, tercer cuartl, valor máxmo y valor mínmo. Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 38

Estadístca Descrptva Una vez calculados los valores anterores, procedemos de la sguente forma. Dbujamos una caja cuyos lados vertcales corresponden a los valores de Q y Q 3, trazamos una línea vertcal en el valor de la medana, y dos pequeñas líneas vertcales (barreras) para los valores de LI y LS. A contnuacón, trazamos un segmento a cada lado de la caja hasta las barreras y por últmo colocamos el valor de la meda y de los posbles puntos atípcos. LI=máx(x mín, Q -.5(Q 3 Q )) LS=mín (x máx, Q 3 +.5(Q 3 - Q )). Donde x mín y x máx son los valores mínmo y máxmo del conjunto de datos. Opconalmente se puede representar la meda con una cruz. Todo dato que esté fuera del ntervalo [LI, LS] será consderado como posble dato atípco, anómalo o Outler y corresponde a un dato que debería ser estudado. EJEMPLO 9: En el conjunto de datos, 3.39, 3.45, 3.47, 3.47, 3.50, 3.50, 3.58, el valor de la medana es M=3.47, la meda 3.48, el prmer cuartl Q =3.45, el tercer cuartl Q 3 =3.50 y los valores de los datos máxmo y mínmo son respectvamente 3.39 y 3.58. Los valores de las barreras son: por tanto LI=x mn =3.39. Q -.5(Q 3 -Q )=3.375, por tanto LS=3.575. Q 3 +.5(Q 3 -Q )=3.575, Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 39

Estadístca Descrptva,5 0,5 0 3,35 3,4 3,45 3,5 3,55 3,6 En consecuenca, el dato 3.58 es un valor atípco y se representa como el gráfco. En este gráfco hemos de observar que LS es menor que algunas observacones; estas observacones corresponden a puntos atípcos. La meda es mayor que la medana y, por tanto, es asmétrca haca la derecha. http://asgnaturas.topografa.upm.es/matematcas/vdeos/varable_estadstca.wmv http://asgnaturas.topografa.upm.es/matematcas/vdeos/varable_estadstca.mp4 Undad Docente de Matemátcas de la E.T.S.I.T.G.C. 40