DATOS AGRUPADOS POR INTERVALOS DE CLASE

Documentos relacionados
COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

Estadística Unidimensional: SOLUCIONES

Medidas de Variabilidad

INTRODUCCIÓN. Técnicas estadísticas

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Tema 1: Estadística Descriptiva Unidimensional

SEMANA 13. CLASE 14. MARTES 20/09/16

Descripción de una variable

16/02/2015. Ángel Serrano Sánchez de León

Medidas de centralización

Prueba de Evaluación Continua

MEDIDAS DESCRIPTIVAS

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Organización y resumen de datos cuantitativos

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Un estimado de intervalo o intervalo de confianza ( IC

Tema 11: Estadística.

EJERCICIOS RESUELTOS TEMA 2

UNIDAD 1: Tablas de frecuencias

Tema 6. Estadística descriptiva bivariable con variables numéricas

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

9Soluciones a los ejercicios y problemas

Medidas de Tendencia Central y de Variabilidad

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

ESTADÍSTICA UNIDIMENSIONAL

CLAVE - Laboratorio 1: Introducción

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO PLANTEL IGNACIO RAMÍREZ C. DE LA ESCUELA PREPARATORIA

Práctica 3. Media, mediana y moda.

GUÍA DE APOYO AL APRENDIZAJE N 2

ESTADÍSTICA. Definiciones

17/02/2015. Ángel Serrano Sánchez de León

ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana.

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

Tema 1: Análisis de datos unidimensionales

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Capítulo III Medidas de posición y de dispersión

Modelos lineales Regresión simple y múl3ple

Introducción a la Física. Medidas y Errores

2 Dos tipos de parámetros estadísticos

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

ESTADÍSTICA (GRUPO 12)

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CAPÍTULO 4 MARCO TEÓRICO

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

14 EJERCICIOS RESUELTOS ESTADÍSTICA

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Estadísticos muéstrales

Tema 1.3_A La media y la desviación estándar

SEGUNDA PARTE RENTAS FINANCIERAS

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

DEPARTAMENTO DE MATEMÁTICAS

Variables Aleatorias

5ª Parte: Estadística y Probabilidad

) para toda permutación (p p 1 p

Tema 9: Estadística Unidimensional.

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN PREPARATORIA No. 3

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

1. Notación y tabulación

TEMA 1.- CONCEPTOS BÁSICOS

LECTURA 03: DISTRIBUCIONES DE FRECUENCIAS (PARTE II)

Estadística aplicada a las ciencias sociales. Examen Febrero de 2008 primera semana

Ejercicios y Talleres. puedes enviarlos a

Figura 1

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

LISTA DE TALLERES DE ESTADÍSTICA

4) Ahora elaboremos la tabla de distribución de frecuencias: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE LOS PESOS DE LOS ESTUDIANTES MERU CALIDAD.

Variables Aleatorias

Ejercicios y Talleres. puedes enviarlos a

3. VARIABLES ALEATORIAS.

Agrupa los datos en intervalos de amplitud 8. Elabora una tabla similar a la anterior !!!""#""!!!

Probabilidad Grupo 23 Semestre Segundo examen parcial

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

EXPERIMENTACIÓN COMERCIAL(I)

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I

Erratas y modificaciones

Resolución. Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos.

Cálculo y EstadísTICa. Primer Semestre.

Problemas donde intervienen dos o más variables numéricas

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

INICIACIÓN A LA ESTADÍSTICA. ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD ESTADÍSTICA. (SOLUCIONES)

MEDIDAS DE ASOCIACIÓN: COEFICIENTES DE CORRELACIÓN Y DE REGRESIÓN I.- Introducción En el tema I estudiamos las medidas descriptivas para una

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

Transcripción:

3. Datos agrupados por ntervalo (Varable contnua) Generalmente los datos se agrupan por medo de ntervalos de clase, los cálculos son una aproxmacón a la realdad, se faclta los cálculos. En la agrupacón de datos se desarrolla una tabla, con los datos sguentes en las columnas Tabla n 1. Dstrbucón de frecuencas de Varable en estudo Varabl e en estudo Y -1 Y Númer o de veces que se repte la varable n Frecuenc a relatva h =( n/n)100= % N = Frecuenc a Absoluta acumulada H= Frecuenc a relatva acumulada Y = Marcas clase= Y 1+ Y de Calculo de cada una de las columnas: 3.1 Intervalo de Clase. Es el conjunto de números entre extremos; el menor número se llama Límte Inferor Y -1 y el mayor número se le llama límte superor Y. Varable en estudo Y -1 Y n 3. Número de ntervalos de clase (m) Para selecconar el número de ntervalos de clase, los estadístcos recomendan cualquera de los sguentes dferentes crteros, tenendo como prncpo: 5 m 0 ; debdo a que s son pocos ntervalos de clase, no se mostrarían detalles sobre los datos, y s son muchos ntervalos clases, sería tan confuso como la msma lsta orgnal de datos. 1

Aplcaremos la regla de Sturges, para calcular el número de ntervalos (m), valga la aclaracón que hay otras fórmulas, pero nosotros trabajaremos con ésta. m=1+3.3 Log n 3.3 Ampltud del ntervalo de clase ( C). C= donde: C= Ampltud del ntervalo R= Rango (mayor valor de los datos menos el menor Valor de los datos) = X mayor X menor Nota: No sempre la ampltud es gual en todos los ntervalos, depende del nterés del nvestgador. Ejemplo n 1 En certa fnca cafetera se quere hacer un estudo sobre el rendmento de las plantas de café. Los sguentes datos son una muestra de los rendmentos de 0 plantas de café, cuya undad de medda está dada en lbras. X: (Lb) 3.9 3.7 5.8 5.0 4.8 4.4 5.6 7.0 5.6 5.1 3.6 6.8 5.6 3.4 7.0 4.8.6.7 4.0 4.8 Elabore una tabla de dstrbucón de frecuencas e Interprete,, Solucón. 1) Número de ntervalos de clase (m) Se recomenda que los ntervalos estén entre m= 5 m 0 m= 1+3.3 Log 0 m=5.3 Se escoge un número entero de ntervalos de 5 ) Rango. Es la dferenca entre el mayor valor y el menor valor que toma la varable, en este ejemplo es: X Máxmo - X Mínmo es decr Rango = 7.0 -.6 = 4.4 3) Ampltud de los ntervalos (C).

Ampltud= C= Rango m = = 0.88, redondeamos a C= 0.9 al realzar un redondeo de la ampltud, se amplía tambén el rango, en este ejemplo, el rango amplado (Ra) quedo en 4.5 puesto que; Ra= C x m; R a = 0.9 x 5 = 4.5, la dferenca la llamaremos A = (amplacón de rango) Amplacón = 0.1 puesto que A = Ra- Rreal; A = 4.5-4.4 = 0.1 Ahora dvdmos la amplacón del rango entre así: A =0.1/ = 0.05, para no cambar la nformacón real, le restamos 0.05 al valor menor del conjunto de los datos en este caso es.6 0.05 =.55 y le sumamos 0.05 al valor mayor de los datos, en este ejemplo es 7 + 0.05 = 7.05, ahora sí, el rango queda de 4.5. Paso a segur, cálculo de los límtes nferores y superores cada ntervalo de clase. 4) Cálculo de los límtes nferores y superores de los ntervalos de clase Vemos que se ha corregdo la ampltud usada. C = (7.05-.55)/5 = 0.9 Entonces: Los ntervalos los calculamos así: Prmer ntervalo el límte nferor es.55 y calculamos el límte superor sumando al límte nferor la ampltud: límte superor = límte nferor + la ampltud es decr; Y -1 =.55, Y = 0.9+.55= 3.45 así sucesvamente. 5. Cálculo de las columnas correspondentes a las frecuencas n= número de veces que se repte la varable: Para contar cuantos datos entran en cada ntervalo de clase se trabaja así: ntervalo cerrado, aberto» [ ), es decr s tenemos» [a, b), entonces se escrbe a x <b cerrado se ncluye el dato a y aberto no se ncluye el dato b» ejemplo: Veamos: entre.55 y 3.45, sn nclur 3.45 encontramos 3 dato; entre 3.45 y 4.35 sn nclur 4.35 encontramos 4 datos Así sucesvamente. 4) Tabla de dstrbucón de frecuencas para datos agrupados por ntervalo Elaboramos la tabla de dstrbucón de frecuencas y calculamos cada columna as: Tabla n Ddstrbucón de frecuencas de los rendmentos de una plantacón de Cafetales. Rendmentos (Lb) Y -1 Y n (número de h N H Y Marcas de clase (Lb) plantas).55-3.45 3 0.15 3 0.15 3 3

3.45-4.35 4 0.0 7 0.35 3.9 4.35 5.5 6 0.30 13 0.65 4.8 5.5-6.15 4 0.0 17 0.85 5.7 6.15 7.05 3 0.15 0 1.0 6.6 0 1.00 5) Interpretacón de tabla. Interpretemos las sguentes frecuencas: n3 = Ses cafetales tenen un rendmento entre 4.35 y 5.5 lbras. N3 = trece cafetales tenen un rendmento entre.55 y 5.5 lbras. h3 = El trenta por cento de los cafetales tene un rendmento entre 4.35 y 5.5 lbras. H3 = El sesenta y cnco por cento de los cafetales tenen un rendmento entre.55 y 5.5 lbras. Y3 = tres cafetales tenen un rendmento promedo de 3 lbras. 6) Gráfcos para representar datos Hstogramas de frecuencas Son rectángulos que se grafcan en el prmer cuadrante de un plano cartesano. En la horzontal se ndca la varable en estudo (límtes nferor y superor) y en la vertcal las frecuencas (n, h, N, o H). Los rectángulos tenen como ampltud C las ampltudes de los ntervalos de clase (representan la base de los rectángulos). Dbujar los hstogramas a los datos de los rendmentos de la plantacón de cafetales Hstograma de Frecuenca Absoluta ; n vs Y -1 Y Tabla 3.4 columnas para grafcar n vs Varable Y -1 Y n,55-3,45 3 3,45-4,35 4 4,35-5,5 6 4

5,5-6,15 4 6,15-7,05 3 Rendmento de cafetales en Lb Análss de la gráfca - Se puede observar que la mayor frecuenca fue de 6 cafetales con un rendmento 4.35 y 5.5 Lb - Los mayores rendmentos lo tuveron 3 plantas, entre 6.15 y 7.05 Lb - Los menores rendmentos se presentaron en tres plantas entre.55 y 3.45 Lb - Ses plantas tenen entre 4.35 y 5.5 de rendmento Hstograma de Frecuencas Relatvas: h vs Y -1 Y Tabla 3.5 columnas para grafcar h vs Varable Y -1 Y h,55-3,45 0.15 0.0 3,45-4,35 4,35-5,5 0.30 5,5-6,15 0.0 6,15-7,05 0.15 5

Rendmento de cafetales en Lb Polígonos de Frecuencas Absoluta o Relatva Es un polígono dbujado en el prmer cuadrante de un plano cartesano, formado por segmentos de rectas que unen los puntos entre las marcas de clase y las frecuencas absolutas ò relatvas, en la horzontal se ndcan las marcas de clase y en la vertcal las frecuencas absolutas o las frecuencas relatvas, pues los dos gráfcos son guales. Marcas de clase: Es el punto medo del ntervalo de clase, se obtenen sumando y = Y 1+ Y lo dvdmos entre dos. límte nferor más el límte superor de cada ntervalo de clase y luego Véase el polígono de frecuencas de la tabla de frecuencas de las hortalzas. 6

Tabla 3.6 columnas para polígono de frecuenca Marcas de clase: Y varable en estudo rendmento en lb n 3,55-3,45 3 3,9 3,45-4,35 4 4,8 4,35-5,5 6 5,7 5,5-6,15 4 6,65 6,15-7,05 3 Interpretacón: El número 3 de la prmera marca de clase ndca que hay 3 hortalzas con un rendmento promedo de 3 Lb. Ojva o polígono de frecuencas acumuladas 7

Es una gráfca formada por segmentos de rectas, que unen los puntos formados por la nterseccón de los lmtes superores (eje horzontal) y frecuencas acumuladas (eje vertcal), s se desea se puede ncar la ojva con el prmer límte nferor del prmer ntervalo para la frecuenca cero y contnuar con los lmtes superores Elaboracón de polígono de Frecuencas Y -1 Y N,55-3,45 3 3,45-4,35 7 4,35-5,5 13 5,5-6,15 17 6,15-7,05 0 Nota: Profundzar los conceptos, use la bblografía anotada. 8

III. MEDIDAS DE TENDENCIA CENTRAL Son métodos utlzados para descrbr un conjunto de datos, medante un únco valor. Estas meddas nos ndcan báscamente los valores alrededor de los cuales están la mayoría de los datos. Trabajaremos con la meda artmétca, la medana y la moda, la meda geométrca y la meda ponderada. NOTA Con el fn de lustrar la técnca usaremos el ejemplo de la muestra de los cafetales para casos de datos agrupados por ntervalo; luego lustraremos con problemas de dferentes áreas de formacón tales como ngenería, admnstracón, scología, medcna humano o veternara. 1. MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS Llamada tambén promedo, se denota (cuando es poblaconal) y por x (cuando es muestral) La meda es una medda muy útl para comparar dos o más poblacones. Meda poblaconal ( ) s hay N observacones en el conjunto de datos de la poblacón, la meda se calcula así: Meda poblaconal N 1 X X 1 X... X N = N N Donde =N =1 es el sgno de sumatora que ndca que se suman todas las observacones desde =1 hasta =N Meda muestral ( x ) x = x x1 x... x n n n En donde: 9

X = son los datos observados de la poblacón x 1 = son los datos observados de la muestra N = tamaño de la poblacón n = tamaño de la muestra = Letra grega que ndca suma Ejemplo1: Suponga que en el ejercco de los cafetales muestreados, queremos hallar la meda artmétca, prmero calcularemos suponendo que los datos no se agruparon, entonces tomaríamos todos los datos y los sumamos, el resultado lo dvdmos entre el número de datos o tamaño de la muestra. x = 3.9+3.7+5.8+5.0+4.8+4.4+5.6+7+7+5.6+4.8+5.1+.6+3.6+.7+6.8+4.0+5.6+4.8+3.4 0 = 96. 0 = 4.81 Lb Interpretacón: El rendmento promedo de los cafetales muestreados es de 4.81lbras PARA DATOS AGRUPADOS Para evaluar la meda artmétca de datos agrupados por ntervalo se consdera que las observacones de cada clase están representadas por el punto medo de cada clase (marca de clase). La meda de un conjunto de datos agrupados por ntervalos se calcula así: X n y n Muestral ny = Poblaconal N Ejemplo: Usaremos nuevamente el ejemplo de los cafetales, pero ahora consderaremos que los datos se agruparan. Tomando la tabla de frecuenca nº XX y observando que los datos corresponden a una muestra, usaremos la formula correspondente. X n y Muestral ; ny n n =.8+4 3.6+ 4.4+5 5.+4 6.0+3 6.8 = 0 10

= 5.6+14.4+8.8+6+4+0.4 0 = 4.96 Lb Interpretacón: El rendmento promedo de las hortalzas muestreadas es de 4.96 lbras Observamos una dferenca entre los dos promedos puesto que en datos agrupados trabajamos con, (y) promedos y por tanto este es un valor aproxmado LA MEDIA PONDERADA La meda ponderada toma en cuenta la mportanca relatva de las observacones, es decr: Hay ocasones en que se quere expresar en una sola cfra, los resultados de varos grupos, por ejemplo de personas. En tales casos, el promedo general para los dferentes grupos no se obtene medante los promedos parcales, sno que es necesaro tener en cuenta en cuantas observacones o frecuenca se basa cada uno. La fórmula será: S tenemos los promedos, x1, x x3, x Calculados respectvamente con las frecuencas n1, n, n3, n el promedo correcto será: Promedo ponderado= n1x1 +nx +n3x3 nx = xn n1+n+n3+ n n Ejemplo 3 Supongamos un grupo de 4 mujeres y cuatro hombres, cuyos pesos fueron los sguentes: Mujeres: 46, 48, 5, 54 y su promedo fue : 46+48+5+54 4 = 50 Klos Hombres: 55, 58, 59, 60, 61, 67 y su promedo fue : 55+58+59+60+61+57 6 Hallar la meda ponderada o el promedo general entre hombres y mujeres. =60 Klos Promedo de peso entre hombres y mujeres o meda ponderada entre hombres y mujeres = n1x1 +nx = 4 50+6 60 = 56 Klos n1+n 10 Ejemplo 4. S el profesor de estadístca, dce que el examen fnal valdrá el doble de los otros exámenes para determnar la nota fnal, entonces al puntaje que se obtenga en el examen fnal debe dársele el doble de peso. Es decr, que debe contarse doble al calcular la nota. Esto es exactamente lo que hace la meda ponderada al utlzar la fórmula 11

Nota: Se asume que se tuvo un puntaje de 89,9 y 79 en los exámenes parcales y 94 en el examen fnal. Estos puntajes y sus respectvas ponderacones están reflejados en la tabla nºxxxx: Cálculo de la meda ponderada Tabla nº xxx Nota(x) Peso(n) X*n 49 1 89 9 1 9 79 1 79 94 188 x 5 448 Este método es gual que sumar la nota del examen fnal veces al calcular la meda X = 89+9+79+ 94 = 89,6 w 5. LA MEDIANA: (Me) Tambén llamada meda posconal, porque queda exactamente en la mtad del conjunto de datos, después de que las observacones se han colocado en sere ordenada de menor a mayor o lo contraro. La mtad de las observacones estará por encma de la medana y la otra mtad estará por debajo de ella. Tene como ventaja sobre la meda artmétca que los valores muy grandes o muy pequeños con relacón al conjunto de datos no tene nnguna nfluenca sobre ella. MEDIANA PARA DATOS NO AGRUPADOS. 1

C = ampltud de la clase modal DIDÁCTICA N 3 - S el conjunto de datos tene un número mpar de observacones la poscón de la medana es (después de organzar los datos de menor a mayor o lo contraro): Poscón de la M e = n+1 ; o smplemente el valor del centro, en caso de numero de observacones sea pequeño - S el conjunto de datos es par, es necesaro promedar los dos valores medos, tambén podemos utlzar la fórmula : M e = n+1 - Ejemplo 5 Suponga que se toma una muestra de los ngresos mensuales en una empresa en mles de dólares (5 meses) US$ 56, 57, 5, 45, y 67. (Número mpar de datos) - Hallar la medana. Ordenamos de menor a mayor: US $ 45, 5, 56, 57,67 La poscón del valor de la medana será: poscón de M e = 5+1 = 3 ósea será el dato de la tercera poscón, es decr: US $56 = M e Interpretacón: La mtad de los ngresos estuveron por debajo de US $56.000 - Ejemplo 6 S en el msmo ejemplo el número de ngresos de ventas es Par: US $35, 45, 5, 56, 57,67 (ya ordenados) el valor de la medana será: 1) Poscón de la medana Poscón= 6+1 = 3.5 ) Valor de la medana M e = 5+56 = 108 = 54, Interpretacón: La mtad de los ngresos estuveron por debajo de US $54.000 3) MEDIANA PARA DATOS AGRUPADOS POR INTERVALOS. Partmos de que los datos están organzados por ntervalo, por lo tanto parte de la nformacón ya no es dentfcable; como resultado, no es posble determnar la medana exacta. Sn embargo, puede estmarse: entonces; 1) Localzamos la clase en que se encuentra la medana. ) Realzando nterpolacones dentro de esa clase para obtener dcho valor, la razón de éste enfoque es que se supone que los datos están espacados unformemente, en la clase medana. Formula: En donde: L = límte nferor de la clase modal n = nos srve de referenca para ubcar la clase medana 13 N-1= Frecuenca acumulada anteror a la clase medana

Me= Y -1 + n N ( n Ejemplo 7 j 1 ) C Para lustrar el método contnuemos con el ejercco de las hortalzas. Suponga que en el ejercco de las hortalzas muestreadas, queremos hallar la medana. Me = Y-1 + (n/ N 1) c n Prmero calcularemos la clase medana, para ello tomamos n (número total de la muestra) n/ = 0/ = 10 Con el valor encontrado vamos a la Columna N (frecuenca absoluta de datos en la tabla de frecuenca absoluta, ( ver tabla xxx, ddáctca ), y busco 10, s no lo encuentro tomo el valor nmedato superor; en este caso sería el 13 y luego nos vamos al ntervalo correspondente en este caso es (4,8 5,6), este ntervalo debe contener el valor de la medana y se le llama ntervalo de clase medana. Me = 4.8 + (10-8) 0.90 = 4.8+0.36 = 5.16 Lb. 5 Interpretacón: El 50% de los rendmentos de las hortalzas muestreadas está por debajo de 5.16 Lb NOTA: S al hallar n encontramos ese valor en la columna N, se puede afrmar que el valor de la Me es el límte nferor del ntervalo correspondente, y por tanto no se requere el uso de la formula anteror. 3. LA MODA: MO Se defne como el dato que tene mayor frecuenca. MODA DATOS NO AGRUPADOS. En datos no agrupados se toma el dato que más se repte, s exste dos datos que tene gual frecuenca se dce que la dstrbucón de datos es bmodal Ejemplo 8 14

Utlzando el ejemplo anteror de: Suponga que se toma una muestra de los ngresos mensuales en una empresa en mles de dólares US$ 35, 45, 5, 56, 57, 67, 67 La moda es US $ 67 Interpretacón: El ngreso con mayor frecuenca es US $ 67. Ejemplo 9 S por ejemplo se agregara otro ngreso (56) entonces el conjunto de datos sería bmodal, es decr con dos modas: US $ 56 y 67 Interpretacón: Los ngresos con mayor frecuenca son US $ 56 y 67 MODA DATOS AGRUPADOS: Mo Para datos agrupados por ntervalo es posble aproxmar la moda utlzando el punto medo de la clase que contene el mayor número de frecuencas de clase. Formula: 1 M o = L + ( ) c En donde: 1 L = límte nferor de la clase modal = frecuenca de la clase modal menos la frecuenca de la clase anteror. 1 = frecuenca de la clase modal menos la frecuenca de la clase sguente. C = ampltud de la clase modal Ejercco 10 Solo para lustrar el método contnuemos con el ejercco de las hortalzas. Suponga que en el ejercco de las hortalzas muestreadas, queremos hallar la moda La fórmula a usar es: Mo = L + (Δ 1) C Δ1 + Δ La clase modal, es decr la clase que contene a la moda la dentfcamos en la tabla de frecuencas, en la columna, n, es tene mayor valor de frecuenca absoluta. En este caso es n4 = 5, por tanto el ntervalo de clase con mayor frecuenca es (4.8-5.6) 15

Mo = 4.8 + (5 ) 0.90 = 4.8 + 0.75 (5-) + (5-4) Interpretacón: El rendmento más frecuente es 5.55Lb 4. MEDIDAS DE DISPERSIÓN Mden que tanto se apartan los datos u observacones alrededor de la meda artmétca. Las meddas más útles son la varanza y la desvacón estándar 4.1 VARIANZA Y DESVIACIÓN TÍPICA O ESTÁNDAR 4.1.1 Para datos no agrupados: La varanza tene dos notacones; varanza poblaconal y S varanza muestral X X X Varanza poblaconal N S n 1 16 Varanza muestral

En donde: = Varanza o varanza poblaconal X = Cada uno de los datos observados = Meda poblaconal N= Tamaño de la poblacón S = Varanza Muestral X = Meda Muestral n= Tamaño Muestral Debdo a que es complejo hacer comparacones entre la meda medda lneal y la varanza cuadratca, surgó la fórmula de la desvacón estándar muestral: S S Ejemplo 1. Calcular la varanza y la desvacón estándar de los sguentes datos de una muestra: 3, 1, 4,, 0, donde la meda es X = Solucón Tabla n 4.1 Cálculo de la Varanza datos muestrales. Datos no agrupados X x - X (x - X ) 3 1 1 1-1 1 4 4 17

0 0 0-4 X X 10 S X X n 1 10 S,5 S,5 1, 58 4 Interpretacón: la varacón de los datos correspondentes a la muestra, respecto a la meda artmétca es de 1,58 4.1. Las fórmulas para el cálculo de la varanza y la desvacón típca para datos agrupados son los sguentes: y X n S ; n 1 En donde: S y X n n 1 y n y N ; N S = Varanza Muestral = Sumatora desde = 1 hasta m = Número de ntervalos. y = Marcas de clase n = Frecuencas absolutas n = Varanza poblaconal = Desvacón típca poblaconal o error típco X = Meda Muestral Nota 1. = Meda Poblaconal 18 Varanza y desvacón estándar Muestral respectvamente. Varanza y desvacón estándar Poblaconal respectvamente.

Recordar, para datos no agrupados, Y, Smbolza los valores de la varable. Para datos agrupados, Y, representa la marca de clase. Ejemplo. Calcular la varanza y la desvacón estándar de los sguentes datos correspondentes a una muestra tomada de las notas de los cursos de estadístca de la unversdad de Medellín. Tabla n 4. Calfcacones de la muestra tomadas de los cursos de estadístca. Datos agrupados por ntervalo Calfcacones Y ï-1 - Y ï # de Estudante Marca de Y*n n clase: Y 40 49 5 44.5.5 50 59 54.5 109 60 69 1 64.5 774 70 79 14 74.5 1043 80 89 9 84.5 760.5 90 99 6 94.5 567 48 3496 3496 X 7,83 48 Solucón. La fórmula para la varanza es S Y X n 1 la tabla 4., adconando las sguentes columnas: Y, Y X y Y X n Tabla n 4.3 Para cálculo de la varanza. Datos agrupados n y para su cálculo, contnuamos con 19

Calfcacones Y í-1- Y Estudantes n Frecuenca acumulada N Marca de clase Y X Y Y X f 40 49 5 5 44,5 80,59 401,95 50 59 7 54,5 335,99 671,98 60 69 1 19 64,5 05,35 464, 70 79 14 33 74,5,79 39,06 80 89 9 4 84.5 136,19 15.71 90 99 6 48 94.5 469,59 817.54 48 1131.44 Aplcando la fórmula de varanza: Y X n S = 1131,44 n 1 48 1 Por tanto la desvacón estándar es: S = 38,97 = 15.46 = 1131,44 47 = 38,97 Varanza Interpretacón: La tendenca de vararacón por encma y por debajo, de las calfcacones muestreadas, respecto a su meda artmétca es de 15.46 4. COEFICIENTE DE VARIACIÓN (CV) Es una medda porcentual, que permte la comparacón entre dos o más dstrbucones de datos, con undades de medcón dferentes. Esta medda es admensonal, es decr, carece de magntud. S CV 100 = % X Nota. S la meda artmétca es negatva se utlza el valor absoluto 0

Debdo a que la desvacón típca y la meda venen ndcadas en undades de medcón guales, al establecer la dvsón, se elmna la undad de medcón. Otras meddas relatvas son los valores de las varables de las dstrbucones probablístcas. Una de las más utlzadas son los valores Z de la dstrbucón normal. Ejemplo 3 1. Calcular la meda, la medana, la varanza y la desvacón típca de los datos sguentes: Tabla n 4.4 Dstrbucón porcentual de los costos de mano de obra en la produccón de algunos pequeños anmales en Colomba. Produccón Mano de obra % Apcultura 6,8 Avcultura huevos,8 Avcultura pollos 3,0 Psccultura 15,6 Porccultura ceba,6 Porccultura cría 4,8 Suponendo que son datos muéstrales, tenemos: 1. Cálculo de la meda para datos no agrupados: 6,8+,8 + 3 +15.6 +,6 + 4,8 X = 9, 7 % 6 El promedo de los porcentajes de los costos de mano de obra en la produccón de certos anmales, es del 9,7%.. Cálculo de la medana Ordenando los datos, obtenemos:,6,8 3,0 4,8 15,6 6,8 3,0 4,8 Me 3,9 % 1 Profesor Orlando Lastra.. 1

El 50% del porcentaje de los costos de mano de obra en la produccón de estos anmales, se encuentra entre,6 y 3,9%. 3. Cálculo de la varanza La fórmula de la varanza para datos no agrupados es: S X X n 1 Dsponemos los datos en la sguente forma: Tabla n 4.5 Cálculo de Varanza. Datos no agrupados Dstrbucón porcentual de los costos de mano de obra en la produccón de algunos pequeños anmales en Colomba. S Costo Produccón Mano de obra X X Apcultura 6,8 307,3009 Avcultura huevos,8 41,8609 Avcultura pollos 3,0 39,319 Psccultura 15,6 40,0689 Porccultura ceba,6 44,4889 Porccultura cría 4,8 19,9809 493,0134 X X n 1 493,0134 98,6 6 1 Cálculo de la desvacón estándar. S S 98,6 9,93 % Interpretacón: obra respecto al promedo es 9,93% La varacón porcentual por encma y por debajo del costo de mano de Nota 3

Debemos tener en cuenta que a mayor valor de la varanza o de la desvacón típca hay mayor varabldad de los datos, es decr, los datos son más heterogéneos. La varanza y la desvacón típca adqueren más mportanca cuando hacemos comparacones entre grupos de datos que tenen la msma undad de medcón. Observe tambén que hemos comparado la desvacón típca con la meda porque presentan la msma undad de medcón; en este últmo ejemplo, ambas venen ndcadas en porcentajes. No podemos hacer comparacones con la varanza porque su medda, en este ejemplo, es porcentaje al cuadrado, (%). La varanca, generalmente, presenta undades extrañas. Dos consderacones para comparar grupos de datos utlzando la desvacón típca: 1. Las meddas deben ser muy parecdas.. Las undades de medcón de la meda y la desvacón típca deben ser guales. Ejemplo 4. De las tres seres de datos sguentes, Cuál presenta mayor varabldad? Tabla n 4.6 Seres de datos con sus meddas de promedos y desvacón estandar Sere X S Undad de medcón I 800 150 Fruto/planta II 635.483,7.455,39 $ III 95 5 Kg. Solucón. Como las undades de medcón son dstntas para cada una de las seres, la únca medda que podemos utlzar para comparar la varabldad, entre las tres seres, es el coefcente de varacón CV CV I S X 100 % 150 frutos/planta 800 frutos/planta 100 18,75% Profesor Orlando Lastra 3

CV II CV III $.455,39 $635.483,7 5 Kg. 95Kg. 100 % 0,3864% 100 % 5,63% Observe que en el cálculo de los tres coefcentes de la varacón las undades de medcón desapareceron, por ejemplo, en CV III se elmnan los Kg. Por estar en el numerador y en el denomnador. Vemos que la sere que presenta mayor varabldad es la sere 1 (tene el mayor coefcente de varacón) y la más homogénea, es decr, la de menor varabldad, es la sere II. S solo consderamos la desvacón típca podríamos pensar erradamente que la sere II es la que tene mayor varabldad. 4.3 PROPIEDADES DE LA MEDIA ARITMÉTICA Y LA VARIANZA 1. La varanza sempre será cero o postva. La meda puede ser negatva, cero o postva.. La varanza de una constante es cero. El promedo de una constante es la msma constante. 3. El valor de la meda sempre debe estar entre el menor y el mayor valor de los datos. La varanza no presenta esta característca. 4. La suma de las desvacones de los datos con respecto a la meda sempre es cero. En símbolos: X X 0 4.4 MEDIDAS DE POSICION PORCENTUAL Son aquellas que dvden el conjunto de datos en partes o proporcones guales, mden la dspersón del conjunto de datos. Cuartles (Qa) Qa = Dvden la nformacón en cuatro partes guales. 4

El cuartl dos es gual a la medana. Q = Me. Es decr la mtad de las observacones están por debajo y la mtad están por encma. Decles ( Da) Q1 Q Q3 Da = Dvden la nformacón en dez partes guales. Q1 Q Q9 Percentles (Pa) Pa = Dvden la nformacón en cen partes guales. Para su cálculo en datos no agrupados prmero calculamos su ubcacón y luego la medda de nterés. 4.4.1 Fórmulas para ubcarlos (Datos No Agrupados) Cuartles (Qa) UQa = a(n+1)/4 Decles (Da) UDa = a(n+1)/10 Percentles (Pa) UPa = a(n+1)/100 5

Ejemplo 5 : sean los sguentes datos ordenados de menor a mayor 3, 5,15, 30, 35, 45,50. Halle las sguentes meddas Q3, P3. Solucón: Cálculo de cuartl 3. Número de datos mpar; n=7 Ubcamos la poscón de la medda de nterés UQ3 = 3(7+1)/4 = 6 Q3=45 Interpretacón: La poscón es la 6 y corresponde al número 45, esto quere decr que el 75% de los datos está por debajo de 45% o el 75% de los datos esta entre 3 y 45. Calculo del percentl 3 Ubcamos la poscón de la medda de nterés UP3 = 3(7+1)/100 =, 6 Tomamos el dato número y al sguente le restamos el anteror es decr (15-5) y lo multplcamos por el decmal es decr 0.6. P3= 5 (15-5)0.60= 9 Interpretacón: El 3% de los datos está por debajo de 9. 4.4. Para datos agrupados Utlzamos las sguentes fórmulas, calculando la medda de nterés en forma smlar como calculamos la medana para datos agrupados por ntervalo. Cuartles (Qa) Qa = Y -1 + (an 4 N 1) n c Decles (Da) Da = Y -1 + (an 10 N 1) n c 6

Percentles (Pa) Pa = Y -1 + ( an 100 N 1) En donde: n c Y -1 = Límte nferor del ntervalo que contene la medda porcentual de nterés. a= subíndce representa la proporcón de nterés n=tamaño de la muestra C= ampltud del ntervalo de clase N -1 = Frecuenca acumulada anteror a la frecuenca acumulada que contene la medda porcentual de nterés n= frecuenca absoluta correspondente al ntervalo que contene la medda porcentual de nterés. Ejemplo 6: Del ejemplo n, págna 3. Calcular Q3: Aplcando la fórmula para cuartles se tene, Q3 = Y -1 + (an 4 N 1) c = 80 + Interpretacón: n 48 (3 4 33) 10 = 80+ (36 33)10 = 83,33% 9 9 El 83,33% de las calfcacones de estadístca en la unversdad de Medellín están por debajo del 75% Las demás meddas porcentuales se calculan de gual forma. 4.5 RANGO INTERCUARTÍLICO (RIQ) Es la dferenca entre el Q 3 y Q 1, es decr Q 3 -Q 1 ó P 75 -P 5 ; la mtad de las observacones se clasfcan dentro de ese rango, o lo que es gual, conformado por el 50% de la mtad de las observacones, elmnando el 5% nferor y el 5% superor del conjunto de datos., por lo que mplca que no está nfluencada por meddas extremas. 7

Resumen a)meda o Promedo a) Meddas de Tendenca central b) Medana c) Moda a) Meda artmétca b)meda ponderada Tpos de meddas b) Meddas de Poscón Porcentual a) Cuartles b) Decles c) Percentles a) Rango c) Meddas de Dspersón b)varanza c) Desvacón típca o estándar o error típco Contnuacón del ejercco sobre los rendmentos de las plantas de café. (Ejercco nº1). Aplcaremos las meddas de dspersón. 8

Cálculo de la Varanza y la desvacón Estándar Rendmentos (Lb) Y -1 Y n (número de plantas) h N H Y Marcas de clase (Lb).55-3.45 3 0.15 3 0.15 3 3.45-4.35 4 0.0 7 0.35 3.9 4.35 5.5 6 0.30 13 0.65 4.8 5.5-6.15 4 0.0 17 0.85 5.7 6.15 7.05 3 0.15 0 1.0 6.6 0 1.00 y n (y x ) (y x ) n 9 3.4 9.7 15.6 0.81 3.4 8.8 0 0.8 0.81 3.4 19.8 3.4 9.7 96 5.9 MEDIDAS DE TENDENCIA CENTRAL 1. Meda Artmétca: x = y n n x = y n n = 96 = 4. 8 lb 0 9

MEDIDAS DE DISPERSIÓN: 1. Varanza muestral : S Procedmento para hallar la Varanza: S = (y x ) n n 1 S = 5.9 = 5.9 = 1.36Lb 0 1 19. Desvacón Típca o Desvacón Estándar: S Procedmento para hallar la Desvacón típca o estándar: S = + (y x ) n n 1 S = + 1. 36 = 1. 166 Lb Interpretacón del resultado de la desvacón estándar: S Hay que recordar que la meda artmétca nos había dado: x = 4. 8 El promedo de rendmento que se obtene en las 0 plantas de café es de 4.8 Lbras. Para el caso de los datos tabulados correspondente al rendmento de las plantas de café (0 plantas), se obtuvo una desvacón estándar: S = 1. 166 lb. Esto ndca que la mayor parte de los datos están agrupados (dentro de 1. 166 lb, por encma y por debajo de la meda artmétca) entre: x s = y x + s = a. x s = 4. 8 1. 166 = 3. 634 lb b. x + s = 4. 8 + 1. 166 = 5. 966 lb 30

3. Coefcente de varacón CV: Procedmento para hallar el Coefcente de varacón CV: CV = S x 100 1. 166 CV = 100 = 4. 9% 4. 8 NOTA: Al ser bastante cercano a cero dremos que es bastante homogénea, por lo que la meda de la dstrbucón será bastante representatva del conjunto. CÁLCULO DE LAS MEDIDAS PORCENTUALES 1. Prmer cuartl Q1 a) Calculo del prmer cuartl, consderando los datos no agrupados Procedmento para hallar prmer cuartl Datos no agrupados Prmero se ordenan los 0 datos dados para el estudo 3.9 3.7 5.8 5.0 4.8 4.4 5.6 7.0 5.6 5.1 3.6 6.8 5.6 3.4 7.0 4.8.6.7 4.0 4.8,6,7 3,4 3,6 3,7 3,9 4,0 4,4 4,8 4,8 4,8 5,0 5,1 5,6 5,6 5,6 5,8 6,8 7,0 7,0 Segundo utlzar la sguente formula: 1 (n + 1) Q 1 = 4 1 (0 + 1) Q 1 = = 5. 5 4 ; 5 + 0, 5 = 5, 5 Q 1 = 5, 5 es decr que debe estar entre la qunta y sexta poscón. 31

Sendo el valor de 3, 9 la sexta poscón Sendo el valor de 3, 7 la qunta poscón 6 a poscon 5 a poscon = 3, 9 3, 7 = 0, Este resultado "0," se multplca por la fraccón "0,5" = 0, 05 0, 0, 5 Ahora el valor de 0. 05 se le suma al valor de 3, 7, es decr: Luego el prmer cuartl es Q 1 = 3, 7 + 0, 05 = 3, 75 b) Cálculo del prmer cuartl, consderando los datos agrupados Rendmentos (Lb) y 1 y (número de plantas) n.55-3.45 3 3 N 1 3.45 y 1-4.35 4 n 7 N 4.35 5.5 6 13 5.5-6.15 4 17 6.15 7.05 3 0 0 N Prmero se dvde el tamaño de la muestra por 4: n 4 = 0 4 = 5 Se busca este resultado 5 en los datos de la frecuenca absoluta acumulada. Observamos que este valor no aparece en la columna de las frecuencas absolutas acumuladas, por tal razón, selecconamos el valor nmedatamente anteror (3) como N 1 y al valor nmedatamente superor tenendo a (7) como N. Ahora veamos la formula a aplcar : 3

n Q 1 = y 1 + C [ 4 N 1 ] n 5 3 Q 1 = 3. 45 + 0, 9 [ 4 ] Q 1 = 3, 45 + 0, 9 (0, 5) Q 1 = 3, 9. Cálculo del tercer cuartl Q3 a) Datos no agrupados es decr desarrollando el msmo ejercco como datos no agrupados Prmero se ordenan los 0 datos dados para el estudo 3.9 3.7 5.8 5.0 4.8 4.4 5.6 7.0 5.6 5.1 3.6 6.8 5.6 3.4 7.0 4.8.6.7 4.0 4.8,6,7 3,4 3,6 3,7 3,9 4,0 4,4 4,8 4,8 4,8 5,0 5,1 5,6 5,6 5,6 5,8 6,8 7,0 7,0 Segundo utlzar la sguente formula: 3 (n + 1) Q 1 = 4 3 (0 + 1) Q 1 = = 15, 75 4 Q 1 = 15, 75 es decr que debe estar entre la poscón (15) y poscón (16) A la 15 a poscón le corresponde el valor de 5, 6 A la 16 a poscón le corresponde el valor de 5, 6 16 a poscon 15 a poscon = 5, 6 5, 6 = 0 Este resultado "0" se multplca por la fraccón "0,75" 0 0, 75 = 0 Ahora este valor de "0" se le suma al valor en la 15 a poscón: Luego el tercer cuartl es Q 3 = 5, 6 + 0 = 5, 6 Luego Q 3 = 5, 6 33

b) Datos agrupados Cálculo de cuartles Rendmentos (Lb) y 1 y (número de plantas) n.55-3.45 3 3 3.45 y 1-4.35 4 7 N 4.35 5.5 6 13 N 1 5.5-6.15 4 n 17 N 6.15 7.05 3 0 0 Prmero se dvde el tamaño de la muestra por 4: 3n 4 = 3(0) = 15 4 Se busca este resultado 15 en los datos de la frecuenca absoluta acumulada. Observamos que este valor no aparece en la columna de las frecuencas absolutas acumuladas, por tal razón, selecconamos el valor nmedatamente anteror (13) como N 1 y al valor nmedatamente superor tenendo a (17) como N. Ahora veamos la formula a aplcar : 3n Q 3 = y 1 + C [ 4 N 1 ] n 15 13 Q 3 = 5, 5 + 0, 9 [ ] Q 4 3 = 5, 5 + 0, 9 (0, 5) Q 3 = 5, 7 3. Desarrollar el cálculo del Decl sexto, es decr D6, de gual forma 4. Desarrollar el cálculo percentl trenta y dos, es decr P3. 34