Tema 1: Análisis de datos unidimensionales

Documentos relacionados
Tema 1: Estadística Descriptiva Unidimensional

INTRODUCCIÓN. Técnicas estadísticas

Descripción de una variable

Estadística Unidimensional: SOLUCIONES

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

ESTADÍSTICA. Definiciones

Medidas de centralización

MEDIDAS DESCRIPTIVAS

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Medidas de Variabilidad

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

ESTADÍSTICA. x es el cociente entre la frecuencia absoluta del valor

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

Cálculo y EstadísTICa. Primer Semestre.

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Variables Aleatorias

GUÍA DE APOYO AL APRENDIZAJE N 2

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

ESTADÍSTICA UNIDIMENSIONAL

TEMA 10: ESTADÍSTICA

Tema 4: Variables aleatorias

GUÍA DE APOYO AL APRENDIZAJE N 1

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos:

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

el blog de mate de aida CSI: Estadística unidimensional pág. 1

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

DEPARTAMENTO DE MATEMÁTICAS

ESTADÍSTICA DESCRIPTIVA

2 Dos tipos de parámetros estadísticos

EJERCICIOS RESUELTOS TEMA 2

Tema 8: Estadística en una variable (unidimensional)

Tema 6. Estadística descriptiva bivariable con variables numéricas

3. VARIABLES ALEATORIAS.

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

ESTADÍSTICA (GRUPO 12)

UNIDAD 1: Tablas de frecuencias

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR FUNDAMENTOS DE MATEMÁTICAS

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

INICIACIÓN A LA ESTADÍSTICA. ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD ESTADÍSTICA. (SOLUCIONES)

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Medidas de Tendencia Central y de Variabilidad

Introducción a la Física. Medidas y Errores

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

1. ESTADÍSTICA DESCRIPTIVA.

ESTADÍSTICA DESCRIPTIVA

Capitalización y descuento simple

TEMA 3. VARIABLE ALEATORIA

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

PREGUNTAS TIPO TEST Y EJERCICIOS PRÁCTICOS PROPUESTOS EN EXÁMENES DE LOS CAPÍTULOS 2, 3 Y 4 (DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES )

ESTADÍSTICA 4º ESO A) INICIACIÓN A LA ESTADÍSTICA 1.- QUÉ ES LA ESTADÍSTICA?

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

Cuaderno de actividades 4º ESO

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Métodos Estadísticos de la Ingeniería Tema 3: Medidas Estadísticas Grupo B

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

Problemas donde intervienen dos o más variables numéricas

1. Variable aleatoria. Clasificación

Tema 1.3_A La media y la desviación estándar

Organización y resumen de datos cuantitativos

Elaboración de Tablas ó Cuadros. La elaboración de tablas o cuadros, facilita el análisis y la presentación de la información.

PROBABILIDAD Y ESTADÍSTICA

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

UNIVERSIDAD DE SONORA

Estadística. Problemas de Estadística 1º Ciclo ESO Departamento de Matemáticas Raúl González Medina

ESTADÍSTICA DESCRIPTIVA I

4 E.M. Curso: NOMBRE: 4º. Colegio SSCC Concepción - Depto. de Matemáticas. Guía N. Unidad de Aprendizaje: Estadísticas

UNIVERSIDAD DE SONORA

DISTRIBUCIONES BIDIMENSIONALES

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

Estadística Empresarial I

4. REPRESENTACIONES GRÁFICAS PARA DATOS CATEGÓRICOS.

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk

PyE_ EF1_TIPO1_

Ejercicios y problemas (páginas 131/133)

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO PLANTEL IGNACIO RAMÍREZ C. DE LA ESCUELA PREPARATORIA

SEGUNDA PARTE RENTAS FINANCIERAS

unidad 12 Estadística

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

DATOS AGRUPADOS POR INTERVALOS DE CLASE

Estadísticos muéstrales

TEMA 5. ANÁLISIS DE UNA VARIABLE (III). MEDIDAS DE ASIMETRÍA, CURTOSIS Y CONCENTRACIÓN

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Figura 1

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad.

Capitalización y descuento simple

UNIDAD 1. Estadística descriptiva.

Transcripción:

Tema : Análss de datos undmensonales. Varables estadístcas undmensonales. Representacones gráfcas.. Característcas de las dstrbucones de frecuencas undmensonales.. Varables estadístcas undmensonales. Representacones gráfcas. El objeto de la Estadístca Descrptva es recoger, clasfcar, representar, resumr y analzar un conjunto de datos que provenen de la observacón de una o más característcas de los ndvduos de una poblacón o de un subconjunto representatvo de ésta que se llama muestra. Una poblacón es cualquer conjunto de elementos o ndvduos en los que se quere nvestgar o analzar una o más característcas que, al estar lgadas a los fenómenos de azar, no se presentan de modo unforme. S la característca no es medble recbe el nombre de atrbuto o varable cualtatva y las dstntas formas en que se puede presentar se llaman modaldades. S la característca es medble recbe el nombre de varable estadístca y se dstnguen dos tpos: Varable estadístca dscreta s los valores que puede tomar son aslados en número fnto ó nfnto numerable. Varable estadístca contnua s puede tomar todos los valores de un ntervalo. Ejemplo : En la poblacón de las personas mayores de 65 años de naconaldad española se puede desear nvestgar las característcas: Sexo (atrbuto), nvel de estudos (atrbuto), número de hjos (varable estadístca dscreta), número de vajes que realzan al año (varable estadístca dscreta), peso (varable estadístca contnua), tempo semanal, en horas, que ven la televsón (varable estadístca contnua), renta anual en mles de euros ( varable estadístca contnua o dscreta?). En este tema suponemos que estamos nteresados en estudar en una poblacón de ndvduos una sola varable X que presenta modaldades o valores, según sea una varable cualtatva o una varable estadístca, y que notamos x, x, Lx. Dstrbucones de frecuencas undmensonales Al observar en cada uno de los ndvduos la modaldad o valor que presenta X, se obtenen datos. Se defne la frecuenca absoluta de x, que se nota n, como el número de veces que aparece repetdo en los datos. Por tanto nes el número de ndvduos de la poblacón que presentan la modaldad o valor x. De la defncón se deduce que n + n + K + n = n = K =

Se defne la frecuenca relatva de x, que se nota f, como la proporcón de ndvduos de la poblacón que presentan la modaldad o valor x. n De la defncón se deduce que n f = y se cumple que n n + n + + n f = + + L = L = = La tabla que presenta las modaldades o valores de la varable y sus respectvas frecuencas defne la dstrbucón de frecuencas de la varable X pues ndca cómo se dstrbuye la frecuenca total entre las modaldades o valores. Su expresón general es X Frecuenca absoluta Frecuenca relatva x n f x n f M M M x n f M M M x n f Ejemplo (Dstrbucón de frecuencas de un atrbuto): Se ha obtendo una muestra de 55 personas de una poblacón de mayores de 65 años. En ella hay 94 hombres y 33 mujeres. Las dstrbucones de frecuencas del estado cvl de los hombres y de las mujeres fguran en las sguentes tablas: Estado cvl Soltero Casado Vudo Dvorcado nº de hombres 35 44 4 94 f,6,69,3, Estado cvl Soltero Casado Vudo Dvorcado nº de mujeres 35 9 6 33 f,,3,57, Ejercco : Determna la dstrbucón de frecuencas del estado cvl de las 55 personas mayores de 65 años. Ejemplo 3 (Dstrbucón de frecuencas de una varable estadístca dscreta): Un supermercado ha observado el número de compras realzadas en la últma semana por los clentes que tenen la tarjeta del establecmento. La dstrbucón de frecuencas de la varable estadístca: número de compras realzadas en la semana, fgura en la sguente tabla: º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 f,6,4,8,6,,4,

Los valores de la varable estadístca se dsponen en la tabla en orden crecente y por esto se pueden defnr las frecuencas acumuladas. Se defne la frecuenca absoluta acumulada de x, que se nota, como el número de ndvduos de la poblacón que presentan un valor de la varable menor o gual a x. De la defncón se deduce que = n + n + L + n = n j j= Se defne la frecuenca relatva acumulada de x, que se nota F, como la proporcón de ndvduos de la poblacón que presentan un valor de la varable menor o gual a x. De la defncón se deduce que F = n + + = n Ln = f + f + L+ f = f j j= La tabla completa de la dstrbucón de frecuencas del ejemplo 3 es º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 f,6,4,8,6,,4, 6 38 64 76 9 F,6,,38,64,76,9 En el caso de estudar una varable estadístca contnua, para presentar la tabla de la dstrbucón de frecuencas, se suelen agrupar los valores de la varable en ntervalos que pueden tener la msma o dstnta ampltud y no tenen elementos comunes. Ejemplo 4 (Dstrbucón de frecuencas de una varable estadístca contnua): Un supermercado ha observado la edad de los clentes con tarjeta del establecmento que han realzado compras la últma semana. La dstrbucón de frecuencas fgura en la sguente tabla Edad [, 3] (3, 4] (4, 5] (5, 6] (6, 7] (7, 8] nº de clentes 5 3 5 5 5 f,,5,3,5,5,5 5 55 8 95 F,,5,55,8,95 Ejemplo 5 (Dstrbucón de frecuencas de una varable estadístca contnua): Un supermercado ha observado el gasto total, en euros, realzado en la últma semana por los clentes que tenen tarjeta del establecmento. La dstrbucón de frecuencas fgura en la sguente tabla Gasto semanal (, ] (, 4] (4, 8] (8, ] (, ] nº clentes 6 4 3 8 f,6,4,3,,8 6 4 7 9 F,6,4,7,9 3

. Representacones gráfcas... Gráfcos de un atrbuto o varable cualtatva Vamos a consderar dos tpos de gráfcos: el dagrama de sectores y el dagrama de rectángulos Dagrama de sectores Para construr el dagrama de sectores se dvde un círculo en tantos sectores crculares como modaldades presente el atrbuto, de modo que el área de cada sector sea proporconal a la frecuenca de la modaldad. Los dagramas de sectores que aparecen a contnuacón corresponden a las dstrbucones de frecuencas del ejemplo. E cvl hombres E.cvl mujeres % 6% % % 3% soltero casado vudo dvorcado 57% 3% soltero casado vudo dvorcado 69% Dagrama de rectángulos Para construr el dagrama de rectángulos se dbujan tantos rectángulos de la msma base como modaldades presente el atrbuto de modo que el área sea proporconal a la frecuenca de la modaldad. Para ello la altura de los rectángulos debe ser gual o proporconal a la frecuenca de la modaldad. Los dagramas de rectángulos que aparecen a contnuacón corresponden a las dstrbucones de frecuencas del ejemplo. E. cvl hombres E. cvl mujeres 4 8 6 4 8 6 8 4 6 4 Solt ero Casado Vudo Dvorcado Solt ero Casado Vudo Dvorcado 4

Cuando se tenen dos o más dstrbucones de un msmo atrbuto, como es el caso del ejemplo, y se queren comparar gráfcamente, se suelen dbujar agrupados los rectángulos de la msma modaldad. En el caso de las dstrbucones del ejemplo se pueden construr los sguentes gráfcos. E. cvl E. cvl (%) 8 6 4 8 6 4 soltero casado vudo dvorcado Mujer Hombre 7, 6, 5, 4, 3,,,, soltero casado vudo dvorcado Mujer Hombre Ejercco : Qué gráfco debes elegr para comparar las dos dstrbucones?.. Gráfcos de una varable estadístca dscreta Vamos a consderar dos tpos de gráfcos: el dagrama de barras y la curva acumulatva o curva de dstrbucón Dagrama de barras El dagrama de barras se construye sobre unos ejes de coordenadas. En el eje de abscsas, determnando un orgen y una undad de medda, se representan los valores de la varable. Se dbuja sobre cada valor de la varable una barra paralela al eje de ordenadas de longtud gual o proporconal a la frecuenca del correspondente valor de la varable. S consderamos la dstrbucón de frecuencas del ejemplo 3 º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 f,6,4,8,6,,4, se obtene el sguente dagrama de barras s se consderan las frecuencas absolutas como longtud de las barras 3 5 º clentes 5 5 3 4 5 6 7 º compras Ejercco 3: Explca la nformacón que se deduce del dagrama de barras. 5

Curva de dstrbucón o acumulatva. La curva de dstrbucón es la representacón gráfca de la funcón de dstrbucón, F (x), que se defne: x R F ( x) =proporcónde ndvduosde la poblacón con valor de la varable menorogualque x De la defncón de F (x) se deduce que los valores que puede tomar son las frecuencas relatvas acumuladas. S queremos construr la curva de dstrbucón del ejemplo 3, necestamos los datos que aparecen en la sguente tabla º compras 3 4 5 6 7 F,6,,38,64,76,9 F.9.76.64.38..6 3 4 5 6 7 º compras Ejercco 4: Determna la longtud del salto que expermenta la funcón en el valor 4 de la varable (señalado en el gráfco con una llave). Explca el sgnfcado del valor obtendo. Ejercco 5: Cuál es el número máxmo de compras que han realzado el 76% de los clentes que menos compras efectúan? Ejercco 6: Cuál es el número mínmo de compras que han realzado el 6% de los clentes que efectúan más compras?..3 Gráfcos de una varable estadístca contnua Vamos a consderar dos tpos de gráfcos: el hstograma y la curva acumulatva o curva de dstrbucón Hstograma El hstograma se construye sobre unos ejes de coordenadas. En el eje de abscsas, determnando un orgen y una undad de medda, se representan los extremos de los ntervalos de valores de la varable. Tomando como base cada uno de los ntervalos se dbujan rectángulos de altura, h, proporconal o gual a la 6

correspondente frecuenca dvddo por la ampltud del ntervalo, de este modo el área de cada rectángulo es proporconal a la frecuenca del ntervalo. Para construr el hstograma del ejemplo 4, como todos los ntervalos tenen la msma ampltud, las alturas de los rectángulos pueden ser las frecuencas (absolutas o relatvas) de los ntervalos. S elegmos las frecuencas absolutas obtenemos el hstograma Edad [, 3] (3, 4] (4, 5] (5, 6] (6, 7] (7, 8] nº de clentes 5 3 5 5 5 n 3 5 5 5 Para construr el hstograma del ejemplo 5, como los ntervalos tenen dstnta ampltud, las alturas de los rectángulos deben ser valores proporconales o guales a las frecuencas dvddo por la ampltud. En este caso hemos consderado como alturas de los rectángulos h = n a, para obtener valores fácles de representar. Gasto semanal (, ] (, 4] (4, 8] (8, ] (, ] nº clentes 6 4 3 8 a 4 4 8 h = n a 8 8 5 3 4 5 6 7 8 Edad clentes n /a 8 5 4 8 Gasto semanal (euros) Ejercco 7: Determna el valor del área de cada uno de estos hstogramas 7

Curva de dstrbucón o acumulatva. La curva de dstrbucón es la representacón gráfca de la funcón de dstrbucón, F (x), que se defne: x R F ( x) =proporcónde ndvduosde la poblacón con valor de la varable menorogualque x De la defncón de F (x) se deduce que, al estar los valores de la varable agrupados en ntervalos, sólo podemos conocer los valores que toma la funcón en los extremos de los ntervalos. Estos valores son las frecuencas relatvas acumuladas. S aceptamos que los valores que toma la varable en cada ntervalo se reparten de modo unforme, entonces la representacón gráfca de F (x) para cada ntervalo será una recta. S queremos construr la curva de dstrbucón de la dstrbucón de frecuencas del ejemplo 4, necestamos los datos de la sguente tabla Edad [, 3] (3, 4] (4, 5] (5, 6] (6, 7] (7, 8] nº de clentes 5 3 5 5 5 5 55 8 95 F,,5,55,8,95 F,95,8,55,5, 3 4 5 6 7 8 Edad del clente Ejercco 8: Cuál es la edad máxma del 5% de los clentes más jóvenes? Ejercco 9: Qué porcentaje de clentes tenen más de 6 años? Ejercco : Construye la curva de dstrbucón de la dstrbucón de frecuencas del ejemplo 5. 8

. Característcas de las dstrbucones de frecuencas undmensonales. Vamos a estudar una sere de meddas que caracterzan la dstrbucón de frecuencas de una varable estadístca. Las podemos clasfcar en tres grupos: meddas de poscón, de dspersón y de asmetría.. Meddas de poscón Son valores que ocupan el centro de la dstrbucón (meddas de poscón central) o ben valores que ocupan poscones fjas en la dstrbucón (cuantles). Moda Meddas de poscón central Medana Meddas de poscón Cuartles Meda Cuantles Decles Percentles.. Meddas de poscón central MODA Se defne la moda, que se nota M o, como el valor de la varable que se repte más veces, es por tanto el valor que presenta mayor frecuenca. Tenendo en cuenta la defncón, una dstrbucón de frecuencas puede tener varas modas. S una dstrbucón tene dos modas se llama bmodal y en el caso de que sólo tenga una moda se llama unmodal. En la dstrbucón de frecuencas del ejemplo 3 la moda es 4 ya que es el valor de la varable que presenta mayor frecuenca. º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 Ejemplo 6 : S las frecuencas obtendas en el caso del ejemplo 3 huberan sdo las de la tabla º compras 3 4 5 6 7 nº de clentes 6 5 8 5 6 entonces la dstrbucón tendría dos modas que son los valores y 5. 9

MEDIAA Se defne la medana, que se nota M e, como el valor que dvde en dos efectvos guales a los ndvduos de la poblacón cuando están ordenados de menor a mayor valor de la varable. De la defncón se deduce que: S tenemos un número mpar de datos la medana es el valor central. Es el valor que ocupa el lugar que se obtene calculando la parte entera de y sumándole. Por ejemplo, s tenemos 7 datos, 5 =3, y la parte entera más es 4, es decr la medana es el valor que ocupa el lugar 4 cuando los datos están ordenados de menor a mayor valor. S tenemos un número par de datos es un número entero y la medana es cualquer valor comprenddo entre el valor del dato que ocupa el lugar y el que ocupa el lugar +, aunque se suele consderar como medana el punto medo entre estos dos valores. Por ejemplo, s tenemos datos, 6 = y la medana es cualquer valor comprenddo entre los valores de los datos que ocupan el lugar 6 y 7 cuando los datos están ordenados de menor a mayor valor. Ejemplo 7: Para determnar la medana de la dstrbucón del ejemplo 3 º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 f,6,4,8,6,,4,, 6 38 64 76 9 F,6,,38,64,76,9, Calculamos 5 =, por tanto la medana es cualquer valor comprenddo entre los valores de los datos que ocupan el lugar 5 y 5. S observamos los valores de, los datos que ocupan los lugares 5 y 5 toman el valor 4, y por tanto M e = 4 Ejemplo 8: S las frecuencas obtendas en el caso del ejemplo 3 huberan sdo las de la tabla º compras 3 4 5 6 7 nº de clentes 6 4 3 4 6 6 3 5 8 94 entonces el dato que ocupa el lugar 5 tene valor 4 y el que ocupa el lugar 5 tene valor 5 y la medana es cualquer valor entre 4 y 5, aunque podemos consderar que M e = 4, 5

De acuerdo con los ejemplos anterores podemos establecer que para determnar la medana en una dstrbucón de frecuencas, calculamos en prmer lugar y después buscamos ese valor en la columna de las frecuencas absolutas acumuladas. Se pueden presentar dos stuacones:. < <. En este caso la medana es el valor x de la varable que corresponde a. =. En este caso se suele consderar que la medana es el punto medo entre x y x + Ejercco : En la tabla adjunta se presenta la nformacón sobre el número de televsores (varable X ) que ha venddo semanalmente una tenda de electrodoméstcos desde que se nauguró. Determna la medana de la varable X. º de televsores 3 4 Frecuenca relatva,3,5,5,, MEDIA S la dstrbucón de frecuencas de una varable estadístca X es la que fgura en la sguente tabla X x x L Frecuencas absolutas n n L Frecuencas relatvas f f L x L n L f L x n f Tabla se defne la meda de la varable X y se nota x, como el valor que se obtene al sumar todos los valores de la varable y dvdr por el número total de datos. Por tanto x n + x n + + x x = x n = L = n = x = f Ejemplo 9: S consderamos la dstrbucón del ejemplo 3, para calcular la meda podemos añadr una fla con los productos x n º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 x n 6 8 54 4 6 84 7 46 46 La meda es x = x n = = 4, 6 =

Propedades de la meda: ) La suma de las desvacones de los valores de la varable respecto a su meda es cero, es decr ( x x) n = = ) Sean X e Y dos varables estadístcas tales que Y = mx + n, sendo my n números reales. S x e y son las medas de estas varables, se verfca que y = m x + n. Ejemplo : En el supermercado MM cada semana le entregan a cada clente con tarjeta del establecmento que haya realzado compras la semana anteror, un vale de descuento cuyo valor es de un euro más el % del gasto del clente en la semana anteror. Determna razonadamente el valor medo de los vales de descuento entregados esta semana s el gasto semanal medo de la semana pasada es de 5 euros. Defnmos X : gasto semanal total en euros Y : Valor del vale descuento en euros El enuncado del ejercco nos permte afrmar que Y =, X + Aplcando esta propedad y =,x + =, 5 + = 5 + = 6 Obtenemos que el valor medo de los vales de descuento es de 6 euros 3) Sea X una varable estadístca que se ha observado en dos poblacones ( y ) de tamaños y, y sean x y xlas medas de la varable X en cada una de las poblacones. S se consdera la dstrbucón de X en la poblacón de tamaño = + formada por los ndvduos de ambas poblacones, entonces la meda de X en esta poblacón verfca x = x + x Ejemplo : Una empresa tene dos sucursales A y B. El salaro mensual medo de los empleados de la sucursal A es de 4 euros y el de la sucursal B es de euros. Determna razonadamente el salaro mensual medo de los empleados de la empresa s el 4% de los empleados pertenecen a la sucursal A. S xa es el salaro medo, en euros, de los empleados de la sucursal A y x B de los empleados de la sucursal B, aplcando esta propedad obtenemos el salaro medo, en euros, de los empleados de la empresa y de empleados de la sucursal A, de la sucursal B y de la empresa. es el salaro medo, en euros, A x = x B A + xb, sendo x,, respectvamente, el número A B, Como el 4% de los empleados de la empresa pertenecen a la sucursal A, entonces A =, 4 y por tanto B =,6. Susttuyendo x =,4 4+,6 = 56+ 6 = 6 Obtenemos que el salaro medo de los empleados de la empresa es de 6 euros

Se pueden defnr otros tpos de meda de una dstrbucón de frecuencas y entre ellos vamos a consderar: La meda geométrca que se suele utlzar para calcular promedos en los casos en los que se supone que la varable presenta varacones acumulatvas, como por ejemplo porcentajes, tasas, números índces. Se defne la meda geométrca de la dstrbucón de frecuencas de la Tabla medante la sguente expresón n n n G = x x Kx La meda armónca que se suele utlzar para promedar varables que se expresan como el cocente de dos magntudes smples, como por ejemplo velocdades, rendmentos y en algunos casos números índces. Se defne la meda armónca de la dstrbucón de frecuencas de la Tabla medante la sguente expresón H = n + n + L+ n x x x.. Cuantles Son valores de la dstrbucón que la dvden en partes guales, es decr, en ntervalos que comprenden el msmo número de datos. Se clasfcan en dstntos tpos dependendo del número de ntervalos en que dvden a la poblacón. Los cuantles de uso más frecuente son: CUARTILES Son tres valores Q, Q, Q3 que dvden a la poblacón, ordenada de menor a mayor valor de la varable, en cuatro partes guales, es decr, en cuatro ntervalos que ncluyen cada uno el 5% de los datos. Como Q concde con la medana, se consderan propamente como cuartles Q y Q 3. De la defncón se deduce que en el ntervalo determnado por Q y Q3se encuentran el 5% de las observacones centrales, ya que nferor a Q se encuentran el 5% de los valores menores de la varable y mayor que Q3se encuentra el 5% de los valores mayores de la varable. Se calculan como la medana susttuyendo el valor por para Q y por 4 Ejemplo : Para determnar los cuartles de la dstrbucón del ejemplo 3 3 para Q 3. 4 º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 f,6,4,8,6,,4, 6 38 64 76 9 3 3 Calculamos = = 5 y = = 75 4 4 4 4 Q es cualquer valor comprenddo entre los valores de los datos que ocupan los lugares 5 y 6 cuando están ordenados de menor a mayor valor. 3

S observamos en la tabla los valores de, los datos que ocupan los lugares 5 y 6 toman el valor 3, por tanto Q = 3 Q 3 es cualquer valor comprenddo entre los valores de los datos que ocupan los lugares 75 y 76 cuando están ordenados de menor a mayor valor. S observamos en la tabla los valores de, los datos que ocupan los lugares 75 y 76 toman el valor 5, por tanto Q 3 = 5 DECILES Son nueve valores D, D,..., D9 que dvden a la poblacón, ordenada de menor a mayor valor de la varable, en dez partes guales, es decr, en dez ntervalos que ncluyen cada uno el % de los datos. Se calculan de modo análogo a los cuartles. PERCETILES Son noventa y nueve valores P, P, L P99 que dvden a la poblacón, ordenada de menor a mayor valor de la varable, en cen partes guales, es decr, en cen ntervalos que ncluyen cada uno el % de los datos. Se calculan de modo análogo a los cuartles. De las defncones anterores se deduce que Q = P5; Q3 = P75; D = PL ; D9 = P9 Ejemplo 3: Para determnar los percentles 6 y 9 de la dstrbucón del ejemplo 3 º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 f,6,4,8,6,,4, 6 38 64 76 9 F,6,,38,64,76,9 6 6 9 9 Calculamos = = 6 y = = 9 P6es cualquer valor comprenddo entre los valores de los datos que ocupan los lugares 6 y 6 cuando están ordenados de menor a mayor valor. S observamos en la tabla los valores de, los datos que ocupan los lugares 6 y 6 toman el valor 4, por tanto P 6 = 4 P 9 es cualquer valor comprenddo entre los valores de los datos que ocupan los lugares 9 y 9 cuando están ordenados de menor a mayor valor. S observamos en la tabla los valores de, los datos que ocupan los lugares 9 y 9 toman respectvamente los valores 6 y 7, por tanto el percentl 9 es cualquer valor entre 6 y 7 aunque se puede consderar P 9 =6, 5 4

. Meddas de dspersón Consderamos el sguente ejemplo: Ejemplo 4: Una empresa que tene dos sucursales (A y B) ha estudado el número de días que sus empleados han estado de baja durante el año (varable X ). En cada una de las tablas fgura la dstrbucón de frecuencas del número de días de baja durante el año de los empleados de cada sucursal, así como algunas operacones que se han realzado con los datos. Además se han construdo los dagramas de barras. Sucursal A X n f n x 8 9, 9 7 9 8, 7 6 36,4 63 36 8, 8 98 9, 9 8 9 9 % de trabajadores 45 4 35 3 5 5 5 5 6 7 8 9 3 4 5 6 7 8 9 número de días de baja Sucursal B X n f n x 5,7 8 3,5 5 4 4,33 9 4 3,7 6,8 % de trabajadores 45 4 35 3 5 5 5 5 6 7 8 9 3 4 5 6 7 8 9 número de días de baja En estas dos dstrbucones Me = Mo = x =. Sn embargo, s observamos los dagramas de barras vemos que en la sucursal B los valores que toma la varable se encuentran a mayor dstanca del valor (medda de poscón central) que los de la sucursal A. Tambén se puede decr que en la sucursal A los valores de la varable están más próxmos entre sí que en la B, o que la varable en la sucursal A tene menor dspersón que en la B. Las meddas de dspersón pretenden poner de manfesto cómo se encuentran stuados los valores de la varable, s están próxmos entre sí y por tanto próxmos a las meddas de poscón central o no. Quzás sea mejor decr que las meddas de dspersón nos permten afrmar que los valores de la varable en una dstrbucón están más próxmos entre sí que en otra, ya que es dfícl decdr s una dstrbucón presenta mucha o poca dspersón. Las meddas de dspersón se pueden clasfcar en meddas absolutas, que dependen de las undades de la varable, y meddas de dspersón relatvas que no tenen undades y por lo tanto permten comparar la dspersón de dos dstrbucones. 5

Aunque se han propuesto dstntas meddas de dspersón, sólo vamos a consderar las que más se utlzan. Recorrdo Es la dferenca entre el mayor y el menor valor de la varable. Representa la mayor dstanca entre los valores de la varable Absolutas Rango ntercuartílco Es la longtud del ntervalo de extremos Q y Q 3. Representa la mayor dstanca entre el 5% de los valores centrales de la varable Meddas de dspersón Varanza y Desvacón típca La varanza es la meda de los cuadrados de las dstancas de los valores de la varable a la meda. La desvacón típca es la raíz cuadrada postva de la varanza. Relatvas Coefcente de varacón de Pearson Es el cocente entre la desvacón típca y la meda. Estudamos la varanza, la desvacón típca y el coefcente de varacón de Pearson. VARIAZA S la dstrbucón de frecuencas de una varable estadístca X es la que fgura en la sguente tabla X x x L Frecuencas absolutas n n L Frecuencas relatvas f f L se defne la varanza de la varable X y se nota S x L n L f L x n f S = ( x x) n = ( x x) = = f.de la defncón se deduce que: La varanza no puede tomar valores negatvos, porque es una suma de sumandos postvos, y sólo toma el valor cero cuando todos los sumandos son cero, es decr, s todos los valores de la varable concden con la meda. S una dstrbucón tene varanza cero es porque la varable toma el msmo valor en todos los ndvduos de la poblacón y por lo tanto la meda es ese valor. En estas dstrbucones la meda representa a toda la dstrbucón. 6

S la varanza toma valores próxmos a cero es porque todos los sumandos son valores próxmos a cero, es decr, los valores de la varable son valores próxmos a la meda y por lo tanto están próxmos entre sí. En estos casos podemos decr que la dstrbucón tene poca dspersón. S en la expresón de la varanza desarrollamos el cuadrado de esa dferenca y efectuamos las operacones correspondentes se obtene que S = = x n x = x = f x Ejemplo 5: S tenemos que determnar la varanza de la dstrbucón del ejemplo 3, utlzamos la expresón anteror y para ello tenemos que calcular x n. Las operacones se pueden realzar en la sguente tabla = º compras 3 4 5 6 7 nº de clentes 6 4 8 6 4 x n 6 8 54 4 6 84 7 46 x n 6 56 6 46 3 54 49 934 S 934 x n x = 4,6 = = = 9,34 6,4836 =,8564 DESVIACIÓ TÍPICA La desvacón típca, que se nota S, es la raíz cuadrada postva de la varanza. De la defncón se deduce que: La desvacón típca tene la msma undad de medda que la varable. La desvacón típca no puede tomar valores negatvos. S = ( x x) f = x f x = = Ejemplo 6: La desvacón típca de la dstrbucón del ejemplo 3, es S = S =,8564 =,69 COEFICIETE DE VARIACIÓ DE PEARSO Se defne el coefcente de varacón de Pearson de la varable X y se nota V, como el cocente entre la desvacón típca y la meda. Por tanto S V = x 7

S la meda de la dstrbucón es negatva se suele consderar su valor absoluto para calcular el valor del coefcente. De la defncón se deduce: El coefcente de varacón de Pearson no se puede determnar en las dstrbucones de meda cero. El coefcente de varacón de Pearson es gual a cero s S es cero. Entonces la varanza es cero y la varable toma el msmo valor en todos los ndvduos de la poblacón y por lo tanto la meda es ese valor. En estas dstrbucones la meda representa a toda la dstrbucón. El coefcente de varacón de Pearson no tene undades y por lo tanto permte comparar la dspersón de dos dstrbucones. S el coefcente de varacón de Pearson de una varable X es menor que el de otra varable Y, decmos que la dstrbucón de X tene menor dspersón que la dey. Se puede decr por tanto, que los valores de la varable X están más próxmos a su meda que los valores de la varabley a la suya o que la meda de la varable X es más representatva (representa mejor a su dstrbucón) que la meda de la varable Y. Ejemplo 7: Comparar la dspersón de las dos dstrbucones del ejemplo 4 medante el coefcente de varacón de Pearson Sucursal A X n f n x n x 8 9, 7 576 9 8, 6 458 36,4 36 36 8, 98 78 9, 8 96 9 9 98 9 x = x n = = 9 S = 98 x n x = = 9 = S = S =, =, y CV =, =, =, =, Sucursal B X n f n x n x 5,7 5 8 3,5 4 9 4,33 4 4 3,7 6 338,8 4 38 x = x n = = S = 38 = x n x = = 3,9 S = 5 = 3,9 y C = S = V = 5 = 5 =,39 Como el coefcente de varacón de Pearson es mayor en la dstrbucón de la sucursal B conclumos que la dspersón es mayor en esta sucursal y que la meda es menos representatva que en la sucursal A. 8

.3 Meddas de asmetría Se dce que una dstrbucón de frecuencas es smétrca respecto a un valor c, s la recta x = ces el eje de smetría del dagrama de barras o del hstograma según que la varable sea dscreta o contnua. Por tanto tenen que exstr el msmo número de valores de la varable a ambos lados de dcho eje de modo que dos a dos están stuados a la msma dstanca del eje y presentan las msmas frecuencas. Los dagramas de barras que aparecen a contnuacón corresponden a dstrbucones smétrcas gráfco gráfco,4,4,35,35,3,3,5,5,,,5,5,,,5,5 3 4 5 6 7 8 9 3 4 5 6 7 8 9 De la defncón se deduce que s una dstrbucón es smétrca la meda y la medana concden y en el caso de que la dstrbucón sea unmodal tambén concde la moda. S una dstrbucón no es smétrca se dce que es asmétrca Los dagramas de barras que aparecen a contnuacón corresponden a dstrbucones asmétrcas gráfco 3 gráfco 4,4,4,35,35,3,3,5,5,,,5,5,,,5,5 3 4 5 6 7 8 9 3 4 5 6 7 8 9 gráfco5 gráfco 6,4,35,3,5,,5,,5 3 4 5 6 7 8 9,4,35,3,5,,5,,5 3 4 5 6 7 8 9 Se dstngue entre dstrbucones asmétrcas a la zquerda (gráfcos 3 y 4) y dstrbucones asmétrcas a la derecha (gráfcos 5 y 6) según que presente una cola a la zquerda o a la derecha. 9

Podemos encontrar dstrbucones que no son smétrcas pero que el dagrama de barras o el hstograma no permte decr el tpo de asmetría que presenta, como es el caso del gráfco 7, por eso se han defndo dstntos coefcentes para medr la asmetría de una dstrbucón entre los que se encuentra el coefcente de asmetría de Fsher gráfco 7,4,35,3,5,,5,,5 3 4 5 6 7 8 9 COEFICIETE DE ASIMETRÍA DE FISHER S la dstrbucón de frecuencas de una varable estadístca X es la que fgura en la sguente tabla X x x L Frecuencas absolutas n n L Frecuencas relatvas f f L x L n L f L x n f se defne el coefcente de asmetría de Fsher de la varable X y se nota g g = 3 ( x x) f ( x x) = S 3 = = S 3 3 n De la defncón se deduce que: Este coefcente no tene undades y por tanto permte comparar la asmetría de dos dstrbucones. S la dstrbucón es smétrca el coefcente es gual a cero. Sn embargo exsten dstrbucones que no son smétrcas y cuyo coefcente es gual a cero. S el coefcente es mayor que cero la dstrbucón es asmétrca a la derecha. S el coefcente es menor que cero la dstrbucón es asmétrca a la zquerda.