Capítulo III Medidas de posición y de dispersión

Documentos relacionados
Medidas de Variabilidad

16/02/2015. Ángel Serrano Sánchez de León

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

EJERCICIOS RESUELTOS TEMA 2

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

SEMANA 13. CLASE 14. MARTES 20/09/16

Descripción de una variable

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

INTRODUCCIÓN. Técnicas estadísticas

Tema 1: Estadística Descriptiva Unidimensional

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Medidas de centralización

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Prueba de Evaluación Continua

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

GUÍA DE APOYO AL APRENDIZAJE N 2

MEDIDAS DESCRIPTIVAS

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

DATOS AGRUPADOS POR INTERVALOS DE CLASE

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Estadística Unidimensional: SOLUCIONES

2 Dos tipos de parámetros estadísticos

Tema 4: Variables aleatorias

Tema 1: Análisis de datos unidimensionales

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

9Soluciones a los ejercicios y problemas

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

1. Notación y tabulación

Práctica 3. Media, mediana y moda.

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

Tema 1.3_A La media y la desviación estándar

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I

CAPÍTULO 4 MARCO TEÓRICO

SEGUNDA PARTE RENTAS FINANCIERAS

DISTRIBUCIONES BIDIMENSIONALES

Probabilidad Grupo 23 Semestre Segundo examen parcial

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objetos de nuestro estudio.

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Tema 11: Estadística.

ESTADÍSTICA UNIDIMENSIONAL

Tema 6. Estadística descriptiva bivariable con variables numéricas

3 - VARIABLES ALEATORIAS

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

4) Ahora elaboremos la tabla de distribución de frecuencias: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE LOS PESOS DE LOS ESTUDIANTES MERU CALIDAD.

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

Métodos Estadísticos de la Ingeniería Tema 3: Medidas Estadísticas Grupo B

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

ESTADÍSTICA. Definiciones

LISTA DE TALLERES DE ESTADÍSTICA

17/02/2015. Ángel Serrano Sánchez de León

Medidas de Tendencia Central y de Variabilidad

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

Cálculo y EstadísTICa. Primer Semestre.

CLAVE - Laboratorio 1: Introducción

ESTADÍSTICA DESCRIPTIVA

Un estimado de intervalo o intervalo de confianza ( IC

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

Modelos lineales Regresión simple y múl3ple

Introducción a la Física. Medidas y Errores

DEPARTAMENTO DE MATEMÁTICAS

Problemas donde intervienen dos o más variables numéricas

MEDIDAS DE ASOCIACIÓN: COEFICIENTES DE CORRELACIÓN Y DE REGRESIÓN I.- Introducción En el tema I estudiamos las medidas descriptivas para una

Capitalización y descuento simple

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

TEMA 1.- CONCEPTOS BÁSICOS

INICIACIÓN A LA ESTADÍSTICA. ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD ESTADÍSTICA. (SOLUCIONES)

Estadística Descriptiva

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

Figura 1

Tema 8: Estadística en una variable (unidimensional)

3.3 Prueba de Matemáticas y Lenguaje

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

ESTADÍSTICA (GRUPO 12)

ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana.

Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos. Frecuencia absoluta (f i )

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN PREPARATORIA No. 3

el blog de mate de aida CSI: Estadística unidimensional pág. 1

Utilizar sumatorias para aproximar el área bajo una curva

Transcripción:

Capítulo III Meddas de poscón y de dspersón Introduccón Hasta ahora, para descrbr un conjunto de datos, se han empleado tablas y gráfcos. Estos son útles para dar rápdamente una vsón general del comportamento de los valores que asume una varable; así, en el caso de varables categórcas, los dagramas son sufcentes para dar una descrpcón completa de las msmas. Sn embargo, para descrbr el comportamento de varables cuanttatvas se requere de una mayor precsón que la que puede proporconar un gráfco. Es mportante que esa descrpcón trascenda los límtes de lo vsual y lo subjetvo en cuanto sea posble. Como solucón a la stuacón planteada, surgen las meddas de poscón y de dspersón, para descrbr las característcas de las dstrbucones en forma cuanttatva. Más exactamente, la precsón que es deseable obtener al descrbr el conjunto de datos numércos se refere a dos aspectos, cada uno de los cuales se puede traducr en una pregunta: Exste algún valor de la varable que represente a la mayoría de los valores del conjunto de datos? Qué tan separados están entre sí los dferentes valores que asume la varable respecto al valor de la varable que representa a los datos? La prmera pregunta se refere a las meddas de poscón y la segunda, a las llamadas meddas de dspersón. Así tambén, un nvestgador del campo educatvo puede realzar una nvestgacón para determnar s las apttudes matemátcas son dferentes según el sexo de los estudantes. Este nvestga- [07] 07 07 3/03/006, 0:34 p.m.

dor tendrá dos conjuntos de calfcacones, luego obtendrá la calfcacón promedo de cada grupo y hará la comparacón de los promedos. La varabldad de los datos es otro aspecto mportante que el nvestgador debe de consderar. Así, necesta saber s las calfcacones son unformes o varían entre los estudantes del sexo femenno y del sexo masculno. Meddas de poscón En el campo socal y educatvo las meddas de tendenca central que se usan más frecuentemente son la meda artmétca, la medana, los percentles y la moda. A contnuacón desarrollaremos dchos temas. Meda artmétca Defncón S x,..., x n son los valores observados de una varable X, la meda artmétca o smplemente meda o promedo de estos datos se defne como el cocente de la suma de todos los valores observados entre el número de datos o tamaño de la muestra. Su expresón matemátca es: x+ x +... + x n n X = = x, (3.) n n = donde n es el número total de observacones. Ejemplo Los sguentes datos corresponden a las notas de 5 estudantes en el curso de Estadístca:, 5,, 09, 3. Encontraremos el valor de la meda artmétca. Solucón La nota promedo del curso es x+ x +... + x X = n = ( + 5 + + 09 + 3 ) = puntos. n 5 08 08 3/03/006, 0:34 p.m.

Meda artmétca ponderada Nos permte calcular un promedo tomando en cuenta la mportanca o peso de cada valor observado de la varable con respecto al total. Su expresón matemátca es: X w = k = k = xw w (3.) donde w, es la mportanca o peso que se asgna a cada valor de la varable. Ejemplo Supongamos que un profesor decde utlzar un promedo ponderado para obtener los promedos fnales de cada uno de los estudantes que assten al curso de Estadístca. El promedo de trabajos tendrá un valor de 0% de la calfcacón del estudante; el examen parcal, 5%; el examen fnal, 35%; y el promedo de práctcas, 0%. A partr de los datos sguentes calcularemos el promedo fnal para dos estudantes cualesquera. Estudante Nota de trabajos Examen parcal Examen fnal Promedo práctcas 5 8 3 7 0 4 7 Solucón a) Obtengamos el promedo ponderado del prmer estudante. Aplcando la fórmula (3.) se tene: X w k xw = k w = 5(0, ) + (0, 5) + 8(0, 35) + 3(0, 0) = = = 4,9 puntos. 0, 0 + 0,5 + 0,35 + 0, 0 Por otro lado, calculamos la meda artmétca de las notas del prmer estudante, obtenemos 4,5 puntos. b) Obtengamos el promedo ponderado del segundo estudante. En este caso el promedo ponderado es: 09 09 3/03/006, 0:34 p.m.

7(0, ) + 0(0,5) + 4(0,35) + 7(0,0) X w = = 4, puntos. 0, 0 + 0, 5 + 0,35 + 0,0 Observe que la meda artmétca del segundo estudante tambén es 4,5. El prmer estudante tene mayor promedo ponderado que el segundo estudante debdo a que el examen fnal tene mayor peso, a pesar de que el segundo estudante supera al prmero en las notas de trabajo y práctcas. S los datos se presentan en una dstrbucón de frecuencas, donde los valores x de la varable se repten f veces, la fórmula (3.) quedará expresada en la sguente forma: X k xf n = = (3.3) Ejemplo 3 Los alumnos del Doctorado en Educacón matrculados en el semestre 000, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM matrculados en el semestre académco 000-I y que ngresaron a la unversdad entre los años 997 y 999. El estudo se llevó a cabo entre abrl y juno del año 000. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 500, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 30 estudantes de la maestría en Gestón Educatva. A contnuacón se presentan los datos para la varable número de hjos de los 30 maestrstas. Encontraremos el número promedo de hjos. Número de hjos f X 0 4 3 5 3 Total 30 0 0 3/03/006, 0:34 p.m.

Solucón Como los datos se encuentran tabulados usaremos la expresón (3.3) para obtener la meda artmétca. Los cálculos auxlares se presentan en la sguente tabla. x f xf 0 0 4 3 5 3 5 Total 30 60 X Reemplazando en la fórmula (3. 3) se tene: k x f n = 0() + () + () + 4(3) + 5(3) 60 = = X = = = hjos. 30 30 En promedo, los estudantes de la maestría tenen hjos. S los datos se presentan en una tabla de dstrbucón de frecuencas agrupados en ntervalos de clase, los valores x de la expresón (3.3) serán reemplazados por la marca de clase de cada ntervalo y el valor de la meda artmétca se obtene de la sguente manera: k X = ', ' x f x es la -ésma marca de clase (3.4) n = Ejemplo 4 Los alumnos del doctorado en Educacón matrculados en el semestre 000, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM, matrculados en el semestre académco 000-I y que ngresaron a la unversdad entre los años 997 y 999. El estudo se llevó a cabo entre abrl y juno del año 000. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 500, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 30 estudantes de la maestría en 3/03/006, 0:34 p.m.

Gestón Educatva. A contnuacón se presentan los datos para la varable edad de los estudantes. Obtengamos la meda artmétca. Edades Marca de clase Frecuenca Absoluta [ L L), ' x f [3-3) 7,5 6 [3-4) 36,5 [4-50) 45,5 8 [50-59) 54,5 [59-68] 63,5 Solucón Como los datos se presentan agrupados en ntervalos de clase usaremos la expresón (3.4) para obtener el valor de la meda artmétca. Los cálculos auxlares se presentan en la sguente tabla: Edades Marca de clase Frecuenca Absoluta [ L L), ' x f x f [3-3) 7,5 6 65,0 [3-4) 36,5 438,0 [4-50) 45,5 8 364,0 [50-59) 54,5 09,0 [59-68] 63,5 7,0 Total 30 03,0 ' y reemplazando en la fórmula (3.4) se encuentra: n ' x f n = X = 7, 5(6) + 36,5() + 45,5(8) + 54, 5() + 63, 5() 03 = = = 40, años. 30 30 La edad promedo de los estudantes es 40, años. Propedades de la meda artmétca Propedad. La suma de las desvacones de los valores de la varable respecto a la meda artmétca es gual a cero. Expresado matemátcamente, tendremos: k = ( ) x X f = 0. 3/03/006, 0:34 p.m.

Demostracón k k k k xf = ( x X) f = xf 0, puesto que X f = nx nx= X= = = = n Ejemplo 5 El Drector del colego Guadalupe está preocupado porque durante el año académco 004, algunos alumnos han faltado frecuentemente a clases. Con la fnaldad de verfcar su percepcón, solcta al Drector Académco que tome una muestra de 0 estudantes que en el año 004 cursaron el cuarto año de secundara. Obtenga para dchos estudantes: a) el promedo de nasstencas del mes de novembre y b) compruebe la propedad de la meda artmétca. El nforme del Drector Académco consgna los sguentes datos. Número de Inasstencas 3 6 7 8 en Novembre f 3 4 8 3 Solucón a) Prmero encontramos la meda artmétca general usando la fórmula (3.3): x f x f 3 x 3= 3 3 4 3 x 4= 6 8 6 x 8=48 7 3 7 x 3= 8 8 x =6 Total 00 X k xf n = = de novembre. 00 = = 5 nasstencas en promedo en el mes 0 b) Luego, comprobamos la propedad : k ( x X) f ( ) ( ) ( ) = = 5 3+ 3 5 4+ 6 5 8 + (7 5)3 + (8 5)= 8+ 8+ 6+ 6= 0 3 3 3/03/006, 0:34 p.m.

Propedad. La suma de los cuadrados de las desvacones de todos los valores con respecto a la meda es mínma. Cuya expresón matemátca es: k = ( ) x X f es mínma Ejemplo 6 Aplcaremos la propedad a la dstrbucón de frecuencas descrta en el ejemplo 5. Número de Inasstencas 3 6 7 8 en Novembre f 3 4 8 3 Solucón Calculando los cuadrados de las desvacones con respecto a la meda y tambén con respecto a cada uno de los valores de la varable se tene: x f ( x ) f ( x 3) f ( x 6) f ( x 7) f ( x 8) f ( x X) f 3 (-5) x 3=48 0 75 08 47 3 4 (3-5) x 4=6 6 0 36 64 00 6 8 (6-5) x 8= 8 00 7 0 8 3 7 3 (7-5) x 3= 08 48 3 0 3 8 (8-5) x =8 98 50 8 0 Total 0 4 8 8 8 Observe que la suma de los cuadrados de las desvacones respecto a la meda de la dstrbucón es menor que cualquer otra suma de las desvacones con respecto a cada uno de los valores de la muestra. Propedad 3. Dados k conjuntos de datos con sus medas X, X,..., X k y con n, n,..., n k observacones, respectvamente, la meda global de todos los datos se obtene medante la meda ponderada, cuya expresón matemátca es: 4 4 3/03/006, 0:34 p.m.

X global nx + nx +... + n X = = k k = k n+ n +... + nk n = k nx donde el numerador representa la suma de todas las observacones y el denomnador el número total de observacones. Ejemplo 7 Para la dstrbucón del número de nasstencas a clases presentado en el ejemplo 5, se encontró que el promedo de nasstencas es 5. Partconaremos la muestra en dos submuestras, con las que se verfcará la propedad 3. Solucón a) En la muestra : x f x f 3 x 3= 3 3 4 3 x 4= 6 8 6 x 8= 48 Total 5 63 63 X = =4, 5 n =5 b) En la muestra : x f x f 7 3 7 x 3= 8 8 x =6 Total 5 37 37 X = = 7,4 5 n =5 c) Luego, la meda global es: nx + nx 5(4, ) + 5(7, 4) 63 + 37 00 X global = = = = = 5 n + n 5 + 5 0 0 nasstencas en promedo en el mes de novembre. Hemos encontrado el msmo valor de la meda de la muestra orgnal, verfcando así la propedad 3. 5 5 3/03/006, 0:34 p.m.

Propedad 4. La meda artmétca de una constante por una varable, es gual al producto de la constante por la meda artmétca de la varable. Esto es, s y = Cx =,..., n, entonces Y = CX Ejemplo 8 Los alumnos del doctorado en Educacón matrculados en el semestre 003, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM matrculados en el semestre académco 00-I y que ngresaron a la unversdad entre los años 000 y 00. El estudo se llevó a cabo entre abrl y juno de 003. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 3 000, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 5 estudantes de la maestría en Idomas. A contnuacón, se presentan los datos para la varable calfcacones en el prmer examen del curso de nglés para los 5 estudantes selecconados. Encontraremos la meda artmétca s el profesor decde duplcar la nota de cada estudante, sabendo que la meda es 30,4. Calfcacones Número de estudantes x f 0 3 0 5 30 8 40 6 50 3 Total 5 Solucón.- Para las notas orgnales verfcaremos el valor de la meda artmétca. Calfcacones Número de estudantes x f x f 0 3 30 0 5 00 30 8 40 40 6 40 50 3 50 Total 5 760 760 X = = 30, 4 5 6 6 3/03/006, 0:34 p.m.

El valor de la meda de las calfcacones del curso de nglés sí es 30,4 puntos.. La forma más rápda de obtener el promedo de las notas duplcadas será aplcando la presente propedad. Como el profesor le duplca la calfcacón a cada estudante, la constante es C=; luego, esta constante será multplcada por la meda de las calfcacones, es decr: Y = CX =(30,4)=60,8. La nueva meda de las calfcacones es Y =60,8. Propedad 5. La meda artmétca una varable mas una constante, es gual a la meda de la varable más la constante. Esto es, s y = x + C =,..., n, entonces Y = X + C. Ejemplo 9 Como parte de una tarea de laboratoro de nutrcón, 5 estudantes de tercer año de la Escuela Académco Profesonal de Nutrcón de la UNMSM matrculados el año académco 004, encontraron el número de calorías (X ) de una porcón de lasagña y obtuveron los sguentes valores: 9 35 47 8 30 5 6 5 4 46 53 6 7 33 a) Encontraremos la meda artmétca del número de calorías. b) Al acabar el trabajo, los estudantes se nformaron que el nstrumento de medcón que usaron estaba mal calbrado y marcó en cada caso 300 calorías por debajo de su valor. Encontraremos la meda artmétca de los nuevos valores de calorías. Solucón: a) La meda artmétca del número de calorías es: 56 X = = 35,06 calorías 5 b) Sumamos a todas las observacones de la varable X la constante C = 300 calorías, y los nuevos valores de calorías (Y ) es como sgue: 335 347 38 3 330 35 36 35 34 346 353 36 37 333 7 7 3/03/006, 0:34 p.m.

El cálculo de la meda artmétca de los nuevos valores de calorías se podrá smplfcar aplcando la propedad 5, esto es: Y = X + C =35,06+300=335,06 calorías. Medana Defncón Dado x,..., x n observacones de la varable X, una vez ordenadas las observacones en forma crecente, la medana es el valor o punto medo que supera al 50 por cento de los valores observados de la varable y es superado por el restante 50 por cento. La forma de obtener el valor de la medana depende del número de observacones. Así, s el número de observacones es mpar, la medana es el valor de la varable que ocupa la poscón central de los datos ordenados y, s el número de observacones es par, la medana es la meda artmétca de los dos valores que ocupan la poscón central de los datos ordenados. Esta defncón se puede plasmar medante la sguente expresón matemátca: S n es mpar: Me = x n+ S n es par: x + x Me = n n + (a) (b) (3.5) donde el subíndce ndca la poscón o lugar que ocupa el valor de la varable ordenada. S la muestra es de tamaño mpar, como por ejemplo: 3 9 0 n + 8 3, usar (3.5 (a)), donde n=7 y = 4, por lo que la medana es el valor de la varable que ocupa la poscón 4 de las observacones ordenadas: 3 8 9 0 3, es decr Me = x ( 4) = 9. S el tamaño de la muestra es par, como por ejemplo: 0 6 4 9 3 7, usar (3.5(b)) donde n=6 y ordenados son: 4 9 0 3 6 7, n n entonces, = 3, + = 4 por lo que x(3) = 0 y x(4) = 3 8 8 3/03/006, 0:34 p.m.

ocupan la poscón central. Luego, el valor de la medana es la meda artmétca de 0 y 3, es decr, Me = 0 + 3 =,5 Para obtener la medana a partr de una dstrbucón de frecuencas se consderan los sguentes casos: Datos sn agrupar en ntervalos de clase y presentados en tabla de frecuencas S los datos están en una dstrbucón de frecuencas, para calcular la medana se segurán los sguentes pasos: ) Encontrar las frecuencas absolutas acumuladas n ) Encontrar 3) En la columna de las frecuencas absolutas acumuladas, ubcar el ntervalo F < F donde F n es la frecuenca absoluta acumulada nmedatamente nferor o gual que n y F es la frecuenca absoluta acumulada nmedatamente superor que n. 4) Ubcar en la columna del recorrdo de la varable el valor x asocado a F y encontrar el valor de la medana de acuerdo con la fórmula sguente: Me = n x s F < < F ( a) o x + x n = s = < ( ) Me F- F b (3.6) Ejemplo 0 Para la dstrbucón de frecuencas del número de hjos de los estudantes de maestría presentados en el ejemplo 3, vamos a lustrar la obtencón de la medana. 9 9 3/03/006, 0:34 p.m.

Solucón Prmero debemos encontrar las frecuencas absolutas acumuladas, como se muestra a contnuacón: Número de hjos f F 0 3 F 4 3 4 3 7 5 3 30 Total 30 F n n 30 y luego calcular, es decr, = 5 =. En la columna de frecuencas absolutas acumuladas ubcamos F n y F de tal forma que, F = 3 < 5 F 4 = < =. Usando (3.6(a)), el valor de la varable asocada a la frecuenca absoluta acumulada F = F3 = 4, es x 3 = ; o sea, el valor de la medana es. Me =. El 50% de los estudantes de maestría tene o menos de hjos. Ejemplo Los alumnos del doctorado en Educacón matrculados en el semestre 000, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM matrculados en el semestre académco 000-I y que ngresaron a la unversdad entre 997 y 999. El estudo se llevó a cabo entre abrl y juno de 000. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 500, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 30 estudantes de la maestría en Gestón Educatva. A contnuacón, se presentan los datos para la varable número de hjos de los 30 maestrstas. Encontraremos la medana. 0 0 3/03/006, 0:34 p.m.

Número de hjos f F 0 3 5 F 9 4 3 4 3 7 5 3 30 Total 30 F n 30 El valor de = 5 = n, por lo que se cumple que conc- n de con F = F, esto es, F = 5 = 5 F 4 = < =. El valor de la varable asocada a la frecuenca absoluta acumulada F = F 3 =4 es x 3 =, y el valor de la varable que corresponde a F =5 es x =. Usando (3,6(b)) la medana es x + x3 + Me = = =,5. El 50% de los estudantes de maestría tenen menos de,5 hjos. Datos agrupados en ntervalos de clase y presentados en una tabla de frecuenca Segur los pasos ), ), 3) del caso anteror de datos sn agrupar en ntervalos de clase y, como paso 4), ubcar el ntervalo de clase asocado a la frecuenca absoluta acumulada F y encontrar el valor de la medana de acuerdo a la sguente expresón: n F n Me = L a S F F + < < (a) F F n Me = L S F F = < (b) (3.7) 3/03/006, 0:34 p.m.

donde: L es el límte nferor del ntervalo asocado a la frecuenca absoluta acumulada F y a es la ampltud del ntervalo asocado a la frecuenca absoluta acumulada F. Ejemplo Obtengamos la medana a partr de la dstrbucón de edad de los estudantes de maestría presentados en el ejemplo 4 del presente capítulo. Solucón Para obtener la medana, prevamente se calculan las frecuencas absolutas acumuladas como se muestra a contnuacón: Edades Frecuenca absoluta Frecuenca absoluta acumulada L, L f F [3-3) 6 6 F [3-4) 8 F [4-50) 8 6 [50-59) 8 [59-68] 30 Total 30 [ ) 30 El valor de n = = 5, se cumple n F = 6 < = 5 < F = 8, en este caso el ntervalo de clase asocado a F = F = 8 es [ 3 4) ; éste ntervalo contene el valor de la varable que ocu- 30 pa la poscón n = = 5. Para dcho ntervalo, la ampltud es a =9 y, el límte nferor es L = 3. Entonces, usando (3.7(a)), el valor de la medana es 5 6 Me = 3 + 9 = 3 + 6,75 = 38,75. El 50% de los 8 6 estudantes tene edades nferores a 38,75 años. 3/03/006, 0:34 p.m.

Ejemplo 3 Supongamos que en el ejemplo 4 la dstrbucón de frecuencas de la edad de los estudantes de maestría sea de la sguente forma: Edades Frecuenca absoluta Frecuenca absoluta acumulada [ L L), f [3-3) 6 6 [3-4) 9 5 F [4-50) 6 3 [50-59) 8 [59-68) 30 Total 30 F F Obtendremos la medana. Solucón El valor de n 30 5 n = =, se cumple que concde con F, esto n es, F =5= = 5 < F = 6. El ntervalo de clase asocado a la frecuenca absoluta acumulada F = F 3 =6 es [ 4 50) ; luego, usando (3.7(b)), la medana es Me = L L 4 = =. El 50% de los estudantes tene edades nferores a 4 años. Moda Defncón La moda es el valor de la varable que se repte con mayor frecuenca. Se expresa como: Mo = x, s x es el valor de la varable que más se repte (3.8) 3 3 3/03/006, 0:34 p.m.

Cuando todas las puntuacones de un conjunto de datos tenen la msma frecuenca, éste no tene moda. Tambén exsten stuacones donde se tene más de una moda, en tal caso dremos que la dstrbucón de frecuencas es bmodal, trmodal, o multmodal. Ejemplo 4 Obtendremos la moda para los sguentes conjuntos da datos: a) 0 3 09 5 b) 0 3 09 5 c) 05 04 Solucón Para el conjunto de datos (a): 0 3 09 5 la moda es Mo = (unmodal); mentras que en el conjunto (b): 0 3 09 5, no exste moda. S el conjunto de datos es (c): 05 04, las modas son Mo = y Mo = (bmodal). A contnuacón, se presentan los métodos de obtencón de la moda cuando se tene un mayor número de datos, razón por la cual prevamente han sdo tabulados. Datos sn agrupar en ntervalos de clase y presentados en tablas de frecuencas Para dentfcar el valor de la moda debe observarse la columna de las frecuencas absolutas y selecconar la mayor de ellas. Supongamos que esa frecuenca sea f ; entonces, el valor de la moda es: Mo = x s f > f y f > f+ (3.9) donde: f frecuenca absoluta nmedatamente anteror a f f frecuenca absoluta nmedatamente posteror a f + Ejemplo 5 Con los datos presentados en el ejemplo vamos a lustrar la obtencón de la moda. 4 4 3/03/006, 0:34 p.m.

Número de hjos f 0 3 9 4 3 5 3 Solucón Para calcular la moda, observamos la columna de frecuencas absolutas y vemos que la mayor frecuenca corresponde a f = 3. Por lo tanto el valor de la moda es x =, es decr, Mo =, ndca que la mayoría de estudantes de maestría tenen un hjo. Ejemplo 6 Con los datos presentados en el ejemplo 3 lustraremos nuevamente la obtencón de la moda. Número de hjos f 0 4 3 5 3 Solucón Esta dstrbucón posee dos modas: Mo = y Mo = ; pues a la segunda frecuenca f =, le corresponde el valor x = y a la tercera frecuenca absoluta, f 3 =, le corresponde el valor x 3 =. En este caso la mayoría de los estudantes tenen ó hjos. Datos agrupados en ntervalos de clase, presentados en tablas de frecuencas Debe observarse la columna de las frecuencas absolutas y detectar la mayor de ellas. Supongamos que esa frecuenca sea f, asocado a él se encuentra el ntervalo de clase [ L L) que contene a la moda y se denomna ntervalo modal. La moda se obtendrá medante la sguente expresón matemátca: 5 5 3/03/006, 0:34 p.m.

d = + Mo L a d+ d donde: (3.0) L f f f + d = f f es el límte nferor del ntervalo modal, es la mayor frecuenca, es la frecuenca nmedatamente anteror a la mayor frecuenca, es la frecuenca nmedatamente posteror a la mayor frecuenca, d = f f a +,, es la ampltud del ntervalo modal. Ejemplo 7 En el ejemplo 4 se tenen las edades de un grupo de estudantes de maestría de la Facultad de Educacón. Con dchos datos obtengamos la moda. Edades [ L L), Frecuenca Absoluta f [3-3) 6 [3-4) [4-50) 8 [50-59) [59-68) Solucón Se encuentra que el valor de la mayor frecuenca absoluta, f =. El ntervalo con mayor frecuenca es [ 3 4), su ampltud es gual a a =9 y su límte nferor es L =3, f = 6, f+ = 8 entonces: d = -6=6, d = -8=4. Luego, el valor de la moda es: d 6 Mo = L a + d d + = 3 + 9 = 3 + 5, 4 = 37,4años 6+ 4 La edad más frecuente es 37,4 años, es decr, 37 años. 6 6 3/03/006, 0:34 p.m.

Ejemplo 8 Los alumnos del doctorado en Educacón matrculados en el semestre 000, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM matrculados en el semestre académco 000-I y que ngresaron a la unversdad entre los años 997 y 999. El estudo se llevó a cabo entre abrl y juno de 000. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 500, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 30 estudantes de la maestría en Gestón Educatva. A contnuacón se presentan los datos para la varable dsposcón para el estudo. Obtengamos la moda. Dsposcón para el estudo Número de estudantes Nnguna Regular 7 Buena 5 Muy buena 9 Excelente 7 Total 30 Solucón Al observar la tabla de frecuencas, podemos afrmar que, con mayor frecuenca, 9 estudantes responderon tener muy buena dsposcón para el estudo. Luego, la moda es «muy buena» dsposcón para el estudo. Cabe ndcar que, en este ejemplo, tenemos la dstrbucón de una varable cualtatva; luego, la moda es la únca estadístca de poscón que podemos calcular cuando se tene una varable cualtatva. Cuartles Son números que dvden un conjunto de datos en cuatro partes guales. Ellos son: El cuartl uno, Q, es el punto por debajo del cual se ubca el 5% de los datos. El cuartl dos, Q, es el punto por debajo del cual se ubca el 50% de los datos. 7 7 3/03/006, 0:34 p.m.

El cuartl tres, Q3, es el punto por debajo del cual se ubca el 75% de los datos. Cálculo de cuartles en conjuntos de datos pequeños Prmero, ordenamos los datos en orden de magntud crecente. Luego, encontramos la poscón para cada uno de los cuartles, según como sgue: Para el cuartl uno, calcular ( ) 4 n+ y redondear al entero más cercano. La observacón ordenada que ocupa esta poscón, representa el cuartl uno. S la poscón es la mtad entre dos enteros consecutvos, el cuartl uno es el promedo de los dos valores correspondentes. Para encontrar el valor del cuartl dos (medana), usar la expresón (3.5). 3 Para el cuartl tres, calcular ( ) 4 n+ y redondear al entero más cercano. La observacón ordenada que ocupa esta poscón, representa el cuartl tres. S la poscón se encuentra a mtad entre dos enteros, el cuartl tres es el promedo de los dos valores correspondentes. Ejemplo 9 Para los sguentes conjuntos de datos a) 3 9 0 8 3 b) 0 6 4 9 3 7 Obtendremos el cuartl uno, el cuartl tres y la medana. Solucón a) S tenemos la sguente muestra de datos: 3 9 0 8 3, donde n=7; entonces, para encontrar el cuartl uno calculamos n+ 7+ = =, por lo que el cuartl uno es el valor de la varable 4 4 8 8 3/03/006, 0:34 p.m.

que ocupa la poscón de las observacones ordenadas: 3 8 Q = =. x 3 9 0 3. Luego, ( ) Para encontrar el cuartl dos por ser n mpar usamos la fórmula (3.5(a)): Me = x = x = x = 9. ( ) n+ 7+ 4 3 Para encontrar el cuartl tres, calculamos ( ) 4 n+ = 3 ( 7 + ) = 6 4 Q luego el cuartl tres es ( ) = x =. 3 6 b) S tenemos otra muestra de datos, por ejemplo 0 6 4 9 3 7, donde n=6 y ordenados son: 4 9 0 3 6 7. Entonces, para encontrar el cuartl uno, calculamos = =,75, luego, el entero n+ 6+ 4 4 más cercano es, por lo que el cuartl uno es el valor de la varable que ocupa la poscón de las observacones ordenadas. Luego, Q = x =. ( ) Para encontrar el cuartl dos o medana, por ser n par, usamos (3.5 (b)). 9 Me x + x x + x n n 6 6 + + x () + x 3 () 4 0+ 3 = = = = =,5. 3 Para encontrar el cuartl tres, calculamos ( ) 4 n+ = 3 ( 6 + ) = 5,5 luego, el entero más cercano es 5, por lo que el 4 cuartl tres es. Q3= x() = 6 5. 9 9 3/03/006, 0:34 p.m.

Para obtener los cuartles a partr de una tabla de dstrbucón de frecuencas, se procede como en el caso del cálculo de la medana, tenendo en cuenta que la fraccón n/ será cambada por las n n 3n fraccones,, según se requera calcular el cuartl uno, 4 4 4 cuartl dos (medana) o cuartl tres respectvamente. Así tenemos los casos sguentes. Datos sn agrupar en ntervalos de clase y presentados en tabla de frecuencas I. Para encontrar el cuartl uno, proceder de la sguente manera: ) Encontrar las frecuencas absolutas acumuladas, n ) Encontrar, 4 3) En la columna de las frecuencas absolutas acumuladas, ubcar el ntervalo F < F, donde F n 4 es la frecuenca absoluta acumulada nmedatamente nferor o gual que n y 4 F es la frecuenca absoluta acumulada nmedatamente superor que 4 n, 4) Ubcar en la columna del recorrdo de la varable el valor x asocado a F y encontrar el valor del cuartl uno de acuerdo con la fórmula sguente: 30 30 3/03/006, 0:35 p.m.

n Q = x s F F < < (a) 4 o x x + n Q = s F F - = < (b) 4 (3.) II. Para encontrar el cuartl tres: ) Encontrar las frecuencas absolutas acumuladas, 3 n ) Encontrar, 4 3) En la columna de las frecuencas absolutas acumuladas ubcar el ntervalo F < F donde F 3n 4 es la frecuenca absoluta acumulada nmedatamente anteror o gual que 3n y 4 F es la frecuenca absoluta acumulada nmedata- 3 n mente superor que, 4 4) Ubcar en la columna del recorrdo de la varable el valor x asocado a F y encontrar el valor del cuartl tres de acuerdo con la fórmula sguente: 3n Q3 = x s F F < < (a) 4 o x x 3n + Q s F F (b) 3 = - = < 4 (3.) Ejemplo 0 Con la dstrbucón del número de hjos de los estudantes de maestría del ejemplo 3, vamos a lustrar la obtencón del cuartl uno y el cuartl tres. 3 3 3/03/006, 0:35 p.m.

Solucón a) Cuartl uno. Prmero debemos encontrar las frecuencas absolutas acumuladas, como se muestra a contnuacón: Número de hjos f F 0 3 4 4 3 7 5 3 30 Total 30 n n 30 y luego calcular, es decr, = 4 4 4 = 7,5 En la columna de frecuencas absolutas acumuladas ubcamos F n y F de tal forma que, F 7,5 F 3 4. Ubcamos el valor de la varable asocada a la frecuenca absoluta acumulada F = F = 3, es x = ; luego, usando (3.(a)) el valor del cuartl uno es. Q = x =. El 5% de los estudantes tene como máxmo un hjo. b) Cuartl tres. Después de encontrar la frecuenca absoluta acumulada como se muestra en la tabla sguente: Número de hjos f F 0 3 4 4 3 7 5 3 30 Total 30 3 3 3/03/006, 0:35 p.m.

3 n 3 330 Calculamos, es decr, =,5 4 4 4 En la columna de la frecuenca absoluta acumulada ubcamos 3n F y F de tal forma que F = 3 <,5 F 4 4 = < =. Ubcamos el valor de la varable asocada a la frecuenca absoluta acumulada F = F3 = 4, es x 3 = ; luego, usando (3.(a)) el n = ( ) valor del cuartl tres es. Q3 = x3 =. El 75% de los estudantes tene dos o menos hjos. Cuartles a partr de una dstrbucón de frecuencas para datos agrupados en ntervalos de clase Para obtener los cuartles para datos agrupados en ntervalos de clase, se procede como en el caso del cálculo de la medana, tenendo en cuenta que la fraccón n ncluda en la fórmula (3.7) será n n 3n cambada por las fraccones,, según se requera obtener el cuartl uno, cuartl dos (medana) o cuartl tres, respectva- 4 4 4 mente. Percentles Son números que dvden el conjunto de datos en 00 partes guales. De manera semejante a la medana, en que la dstrbucón de un conjunto de datos se dvdó en dos partes, un 50% nferor y otro 50% superor, o en cuartles, en donde la dstrbucón se dvdó en cuatro partes, cada una contenendo un 5% de los datos. Así, por ejemplo, el percentl 0, P 0, es el valor de la varable debajo del cual se encuentra el 0% de los datos. Es mportante calcularlos en dstrbucones con un gran número de datos. A contnuacón se presentan los métodos de obtencón de los percentles para datos tabulados. 33 33 3/03/006, 0:35 p.m.

Datos sn agrupar en ntervalos de clase y presentados en una tabla de frecuencas Se procede como en el caso del cálculo de la medana, tenendo en n n cuenta que la fraccón será cambada por la fraccón k de 00 acuerdo al percentl que sea de nuestro nterés encontrar (k =,,,99), para luego contnuar con los pasos ya conocdos: ) Encontrar las frecuencas absolutas acumuladas, n ) Obtener la fraccón k, donde k puede tomar los valores k =,,...,99, 00 3) En la columna de las frecuencas absolutas acumuladas, ubcar el ntervalo F < F, donde F kn 00 es la frecuenca absoluta acumulada nmedatamente nferor o kn gual que y 00 F es la frecuenca absoluta acumulada kn nmedatamente superor que, 00 4) Ubcar en la columna del recorrdo de la varable el valor x asocado a F y encontrar el valor del percentl k de acuerdo a la fórmula sguente: kn Pk = x s F < < F (a) 00 o x + x kn Pk = s F- = < F (b) 00 (3.3) 34 34 3/03/006, 0:35 p.m.

Datos agrupados en ntervalos de clase y presentados en una tabla de frecuencas Para obtener el percentl k, en el caso de una dstrbucón de frecuencas para datos agrupados en ntervalos de clase, segur los pasos ), ), 3) del caso anteror de datos sn agrupar en ntervalos de clase y, como paso 4), ubcar el ntervalo de clase asocado a la frecuenca absoluta acumulada F y encontrar el valor del percentl k de acuerdo a la fórmula sguente: n k F 00 kn P L a F F s k = + < < F F 00 kn Pk = L s F F = < (b) 00 (a) (3.4) donde: L, es el límte nferor del ntervalo asocado a la frecuenca absoluta acumulada F y a es la ampltud del ntervalo asocado a F. Ejemplo Consderando los datos de la edad de los estudantes de maestría del ejemplo 4, vamos a obtener el percentl 75, P 75. Solucón Prevamente se calculan las frecuencas absolutas acumuladas como se muestra a contnuacón: Edades Frecuenca absoluta Frecuenca absoluta acumulada [ L L ), f F [3-3) 6 6 [3-4) 8 [4-50) 8 6 [50-59) 8 [59-68] 30 Total 30 35 35 3/03/006, 0:35 p.m.

y al calcular n 30 k = 75 =,5, se cumple 00 00 n F = 8 < k =,5 < F = 6, en este caso el ntervalo 00 asocado a F F3 6 4 50, que contene el valor de = = es [ ) 30 la varable que ocupa la poscón 75,5 00 =. La ampltud de dcho ntervalo es a =9 y el límte nferor L =4. Entonces, usando (3.4(a)), el valor del percentl 75, P 75, es n k F 00 P L a k = + F F,5 8 4,5 = 4+ 9 = 4+ 9 = 46, 6 8 8. El 75% de los estudantes tene edades nferores a 46, años. Comentaros Dependendo de lo que se quera representar o explcar y del tpo de varable con la que estemos trabajando, se elegrá a la estadístca de poscón más apropada según el caso. Por ello, hacemos las sguentes observacones. La meda artmétca es afectada por valores extremos de la varable. La medana no es afectada por valores extremos (valores nferores o superores muy dstantes del valor central) de la varable. La meda, medana y moda se pueden calcular para datos cuanttatvos. La moda es la únca medda que srve tanto para el caso de varables categórcas como para varables cuanttatvas, puesto que su defncón no exge ordenar los valores de la varable, n hacer operacones matemátcas con ellos. Por ejemplo, s se está trabajando la dstrbucón de la varable naconaldad para un determnado conjunto de personas, no tene nngún sentdo hablar del promedo o de la medana de esa dstrbucón; en cambo, sí tene sentdo hablar de la moda. 36 36 3/03/006, 0:35 p.m.

S se trabaja la dstrbucón de una varable cuanttatva, en prncpo tene sentdo calcular la meda, la moda y la medana; pero para efectos práctcos, puede no tenerlo. Entonces, hace falta desarrollar un certo crtero para decdr, en casos partculares, cuál es la mejor medda de tendenca central. La meda artmétca es muy sensble a valores extremos. Entonces, s en una dstrbucón hubera presenca de dchos valores, la meda no es la mejor de las meddas de tendenca central. Por ejemplo, tenemos dos conjuntos de datos, al trplcar el últmo valor del conjunto, el únco valor que se altera es el de la meda. Meda Medana Moda Conjunto : 9,9,9,0,,,3,4,9.77 9 Conjunto : 9,9,9,0,,,3,4,57 6 9 Puesto que las tres meddas de poscón tenen debldades y fortalezas, vale la pena observarlas e nterpretarlas en forma conjunta. Una forma de entender la relacón entre estas tres es localzando los valores de cada una de ellos en una dstrbucón de frecuencas. La sguente fgura muestra las tres formas más comunes de dstrbucón de frecuencas Moda<Medana< Meda Meda=Medana=Moda Meda<Medana< Moda (a) (b) (c) En la dstrbucón de frecuencas (a), la poscón relatva de la meda, medana y moda ndca asmetría postva. La dstrbucón de frecuencas (b) nos muestra que la meda, medana y moda de una varable son guales. Esta dstrbucón tene forma de campana y se la conoce como dstrbucón normal (o campana de Gauss). 37 37 3/03/006, 0:35 p.m.

En la dstrbucón de frecuencas (c), la poscón relatva de la meda, medana y moda ndca asmetría negatva Ejemplo Con la base de DATOS-maestría vamos a obtener la meda artmétca, la medana, la moda y el percentl 75 de la varable coefcente de ntelgenca usando el SPSS. Solucón Al usar la base de DATOS-maestría y los comandos del SPSS para estadístcas de poscón, la salda del SPSS para la varable coefcente de ntelgenca es: Statstcs coefcente de ntelgenca N Mean Medan Mode Sum Percentles Vald Mssng 75 70 0 0,79 00,00 00,00 75,00 04,3 Meda: El coefcente de ntelgenca promedo de los estudantes de maestría es 0,79 puntos. Medana: El 50% de los estudantes de maestría tenen un coefcente de ntelgenca menor a 00 puntos. Moda: La mayoría de los estudantes de maestría tenen un coefcente de ntelgenca gual a 00 puntos. P 75 : El el 75% de los estudantes de maestría tenen un coefcente de ntelgenca menor a 04,3 puntos. Ejemplo 3 Con la base de DATOS4-cudadanía obtendremos la meda artmétca, la medana, la moda, percentl 5 y el percentl 75 de la varable número de eleccones a las que asstó, usando los comandos del SPSS del capítulo VII (procedmentos estadístcos). 38 38 3/03/006, 0:35 p.m.

Solucón Se abre la base de DATOS4-cudadanía y usando los comandos del SPSS para estadístcas de poscón para la varable número de eleccones a las que asstó se obtene lo sguente: Statstcs N Mean Medan Mode Mnmum Maxmum Percentles Vald Mssng 5 75 00 0 3,00 3,00 3 5,00 4,00 Meda: El número promedo de eleccones a la que assteron representantes vecnales fue 3. Medana: El 50% de los representantes vecnales assteron a menos de 3 eleccones. Moda: La mayoría de los cudadanos asstó a 3 eleccones. P 5 : El 5% de los representantes vecnales assteron a menos de eleccones. P 75 : El 75 % de los representantes vecnales assteron a menos de 4 eleccones. Ejemplo 4 Con la base de DATOS3-educacón se obtendrá la meda artmétca, la medana, la moda y los percentles 0 y 90 para las varables edad, tempo de servco en la docenca y nota promedo de los partcpantes, usando el software SPSS. Solucón Se abre la base de DATOS3-educacón y usamos los comandos del SPSS del capítulo VII (procedmentos estadístcos). En este caso, se selecconan las varables edad, tempo de servco en la docenca y nota promedo de los partcpantes en el programa de capactacón. 39 39 3/03/006, 0:35 p.m.

En el sguente cuadro se presentan los resultados que proporcona el SPSS para las tres varables. Edad de los Tempo de Notas partcpantes servco promedo N Vald 47 47 47 Mean 34,78 3,97,536788 Medan 34,84 4,00,540694 Mode 30(a) 3(a) 8,8495(a) Sum 635 656 54,90 Percentles 0 3,07,00 9,556556 90 37,49 7,09 3,4739 a Multple modes exst. The smallest value s shown Meda: La edad promedo de los partcpantes en el programa de capactacón fue 34,78 años, es decr, 35 años. Medana: El 50% de los partcpantes en el programa de capactacón tenen menos de 34,84 años, es decr, 35 años. Moda: La mayoría de los partcpantes tenía 30 años, pero la dstrbucón no es unmodal, exsten otras modas. P 0 : El 0% de los partcpantes en el programa de capactacón tenen menos de 3,07 años, es decr 3 años. P 90 : El 90% de los partcpantes en el programa de capactacón tenen menos de 37,49 años, es decr menos de 37 años. Queda para el lector hacer las nterpretacones de manera smlar de las estadístcas de poscón para las varables, tempo de servco en la docenca y la nota promedo fnal de los partcpantes. Meddas de dspersón En la seccón anteror se defneron meddas que permten encontrar la ubcacón del centro de una dstrbucón y que, por tanto, contrbuyen a la descrpcón del correspondente conjunto de datos medante un valor representatvo; pero para lograr una magen completa de cómo es la dstrbucón es necesaro saber cómo se dstrbuyen los datos alrededor de ese valor representatvo. Retomemos, entonces, la segunda pregunta formulada en la ntroduccón del presente capítulo: Qué tan separados están entre sí los dferentes valores que asume la varable? El objetvo del presente capítulo es encontrar una manera adecuada de responder la pregunta plantea- 40 40 3/03/006, 0:35 p.m.

da, es decr, encontrar una forma de medr la dspersón de los datos. Entre las meddas de dspersón más usadas están: el rango, la varanza, la desvacón estándar y el coefcente de varacón. Rango Es la dferenca entre los valores máxmo y mínmo de un conjunto de datos. Rango xmáx xmín = (3.5) Ejemplo 5 Los dos conjuntos de valores que sguen corresponden a los años de servco en la docenca de 4 profesonales en Estadístca. Obtendremos el rango para cada conjunto de valores. Conjunto : 5 5 30 30 30 30 30 30 30 30 30 30 45 45 Conjunto : 5 5 0 30 30 30 30 30 40 40 40 40 40 45 Solucón En el conjunto, cuyos valores ya ordenados en forma ascendente son: 5 5 30 30 30 30 30 30 30 30 30 30 45 45 el máxmo valor es 45 y el mínmo valor es 5; entonces, el rango es: Rango =45-5=30 y, en el conjunto, tambén el máxmo valor es 45 y el mínmo valor es 5, e gualmente tene Rango = 45-5 = 30. Pero tenemos que aceptar que la prmera dstrbucón es menos dspersa que la segunda; sn embargo, el rango es el msmo para las dos dstrbucones. Por tanto, en este caso el rango es una medda que no refleja las dferencas que según la ntucón y la observacón son evdentes entre las dos dstrbucones. Este hecho nos exge segur buscando otras meddas de dspersón que superen la lmtacón anteror. Rango ntercuartílco Es la dferenca entre el cuartl uno y el cuartl tres y se expresa como: 4 4 3/03/006, 0:35 p.m.

Rango ntercuartílco = Q3 Q (3.6) Esta medda de dspersón nos permte saber en cuánto se dferencan el mayor valor del menor valor del 50% de los valores que se ubcan en la parte central de la muestra ordenada y, desde luego, no se ve nfluencada por la presenca de valores extremos. Ejemplo 6 Con los datos presentados en el ejemplo 5, encontraremos el rango ntercuartílco para cada conjunto de valores. Solucón a) Para el conjunto cuyos valores son: 5 5 30 30 30 30 30 30 30 30 30 30 45 45, encontraremos prmero los cuartles. Cuartl uno: se tene que n=4, la poscón es ( ) 4 n+ = ( 4 + ) = 3,75 4 y el entero más cercano a 3,75 es 4; luego, el valor que ocupa la poscón 4 es Q = x ( 4) =30. Cuartl tres: tambén n = 4, la poscón es ( ) 4 n+ = ( ) 4 3 3 4 + =,5 y el entero más cercano a,5 es ; luego, el valor que ocupa la poscón es Q 3 = x ( ) =30. Luego, Rango ntercuartílco = Q 3 Q = 30-30 =0. b) Para el conjunto, cuyos valores son: 5 5 0 30 30 30 30 30 40 40 40 40 40 45, tambén prmero encontraremos los cuartles. Cuartl uno: n=4, la poscón es ( ) 4 n+ = ( ) 4 4 + = 3,75, el entero más cercano a 3, 75 es 4; luego, el valor que ocupa la poscón 4 es Q = x ( 4) =30. 4 4 3/03/006, 0:35 p.m.

3 Cuartl tres: n=4, la poscón es ( ) 4 n+ = ( ) 4 3 4 + =, 5 y el entero más cercano a,5 es ; luego, el valor que ocupa la poscón es Q 3 = x ( ) =40. Luego, Rango ntercuartílco = Q 3 Q = 40-30 =0. En el conjunto, el rango ntercuartílco es gual a 0, es decr, no exste varabldad en el 50% de los datos que se encuentran ubcados en la parte central. Mentras que en el conjunto, el rango ntercuartílco es gual a 0, ndcando que el menor valor y el mayor valor del 50% de los datos que se encuentran ubcados en la parte central, tenen una dferenca de 0 undades. Rango sem-ntercuartílco Es la dferenca promedo desde la medana haca los dos cuartles; es decr, evalúa, en promedo, qué tan lejos se hallan los valores de los cuartles Q y Q 3 con respecto a la medana, y se expresa medante la fórmula: Rango sem-ntercuartílco = Q Q 3 (3.7) Ejemplo 7 Con los dos conjuntos de datos presentados en el ejemplo 5, correspondentes a los años de servco en la docenca, con rangos ambos guales a 30, rangos ntercuartílcos guales a cero y dez respectvamente, encontraremos el rango sem-ntercuartílco en cada caso. Solucón Q Q Para el conjunto : Rango sem-ntercuartílco = 3 = 30 30 = 0 Q3 Q Para el conjunto : Rango sem-ntercuartílco = = 40 30 = 0 = 5 43 43 3/03/006, 0:35 p.m.

Para el conjunto, esta medda de dspersón nos dce que no hay dspersón en el 50% central de los datos respecto a la medana. Para el conjunto, esta medda de dspersón nos dce que tanto el valor del cuartl uno como el valor del cuartl tres dstan de la medana en promedo en 5 undades. Ejemplo 8 En la Escuela de Educacón Prmara Juana de Arco, los estudantes fueron sometdos a un examen odontológco. Los sguentes datos corresponden al número de dentes con cares en una muestra de 7 alumnos de prmer año de prmara: 6, 0, 0, 8,, 3,. Encontraremos: a) El rango, b) rango ntercuartílco, c) rango semntercuartílco. Solucón a) El rango es: Rango = xmáx xmín =0-0 =0. b) Para encontrar el rango ntercuartílco: Ordenamos las observacones en orden crecente: 0,,, 3, 6, 8, 0 y prevamente encontramos los cuartles uno y tres: n+ 7+ Cuartl uno: calculamos la poscón = = entonces, 4 4 en la muestra ordenada, la observacón que ocupa la poscón es Q = =. x ( ) Q = x =. 3( n+ ) 3(7 + ) Cuartl tres: calculamos la poscón = = 6 entonces, en la muestra ordenada, la observacón que ocupa la 4 4 poscón 6 es ( ) Luego, 3 6 8 Rango ntercuartílco = Q 3 Q =8 = 7. Es decr, 7 es la dferenca entre el mayor y el menor número de dentes con cares del 50% de la parte central de la muestra, a dfe- 44 44 3/03/006, 0:35 p.m.

renca del rango que nos ndca que es la dferenca entre el mayor y el menor número de dentes con cares del 00% de la muestra. Q Q 8 7 c) Rango semntercuartílco = 3 = = =3,5. Esta medda de dspersón nos ndca que tanto el valor del cuartl uno como el valor del cuartl tres de la varable número de dentes con cares en el grupo de 7 alumnos, dstan de la medana en promedo en 3,5 dentes con cares. Cada una de las meddas que se han presentado hasta el momento proporconan nformacón parcal de la dspersón de la muestra. Una medda que descrbe la dspersón de todos los valores que conforman la muestra, es la varanza. Varanza Es una medda de dspersón y se defne como la meda o promedo de los cuadrados de las dferencas de cada valor de la varable con respecto a la meda artmétca, cuya expresón matemátca es: S = n = ( x ) X n donde X = n x = (3.8) n Una fórmula alternatva es la sguente: S = n = x nx n (3.9) Cabe ndcar que la varanza tambén se puede expresar como: S = n = ( x ) X n (3.0) 45 45 3/03/006, 0:35 p.m.

Cuando el tamaño de muestra es grande, las fórmulas (3.8) y (3.0) proporconan resultados smlares. La varanza es una buena medda de la dspersón absoluta de un conjunto de datos. Sn embargo, tene un problema, puesto que se consderan los cuadrados de las dferencas, y no las dferencas msmas, el resultado no se encuentra en la msma escala que los datos orgnales. Por ejemplo, s los datos se referen a estaturas de un grupo de estudantes, en centímetros, entonces tenemos la medda de dspersón varanza, en centímetros cuadrados, y la meda artmétca en centímetros. Este problema se resuelve defnendo la desvacón estándar. Desvacón estándar Es la raíz cuadrada de la varanza, y se expresa medante la fórmula: n ( ) x X x donde X n n = = S = =, n (3.) Tanto la varanza como la desvacón estándar mden la dspersón de todos los valores de la muestra con respecto a la meda de la msma. Para efectos de nterpretacón, la desvacón estándar es la más apropada. Ejemplo 9 Los sguentes datos representan las edades de ses nños en años cumpldos:, 3, 3, 0, 4,. La meda artmétca es X = años. Obtendremos la varanza. Solucón Los cálculos auxlares para el cálculo de la varanza se muestran en la sguente tabla: 46 46 3/03/006, 0:35 p.m.

Edades Edad - Meda (Edad- Meda) 0 0-=- 4 -=- -=- 3 3-= 3 3-= 4 4-= 4 Total n ( x ) X = = Luego, el valor de la varanza es: ( ) S x X años. n = = =, 4 n = 5 Desvacón estándar, 4,5 S = años = años. La varabldad meda de las edades de los nños respecto a la meda artmétca es de,5 años. S resolvemos el msmo problema usando el SPSS, se tenen los sguentes resultados: N Vald 6 Mean,00 Std. Devaton,549 Varante,400 Para obtener la varanza a partr de una dstrbucón de frecuencas, se consderan los sguentes casos: Datos sn agrupar en ntervalos de clase y presentados en tablas de frecuencas Para datos sn agrupar en ntervalos de clase, la fórmula de la varanza (3.8) se expresa como: 47 47 3/03/006, 0:35 p.m.

S = k = donde ( ) x X f n (3.) X = k xf =, n k es el número de valores dferentes que toma la varable, f es la frecuenca absoluta asocada al -ésmo valor dferente que toma la varable y la desvacón estándar (3.) es: k ( ) x X f x f donde X n n = = S = =, k Otra expresón de la varanza es la sguente: (3.3) S = k = x f n n X donde X = k = xf n (3.4) Ejemplo 30 Los alumnos del doctorado en Educacón matrculados en el semestre 000, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM matrculados en el semestre académco 000-I y que ngresaron a la unversdad entre 997 y 999. El estudo se llevó a cabo entre abrl y juno de 000. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 500, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 30 estudantes de la Maestría en Gestón Educatva. A contnuacón se presentan los datos para la varable número de hjos de los 30 maestrstas. Encontraremos la varanza y desvacón estándar del número de hjos. 48 48 3/03/006, 0:35 p.m.

Solucón Usaremos la expresón (3.4). Los datos y los cálculos auxlares se presentan en la sguente tabla: x f x x f 0 0 0 4 44 4 3 6 48 5 3 5 75 Total 30 78 Reemplazando en la expresón (3.4) se encuentra: S = k = x f n nx ( ) 78 30 = 30 = hjos S = hjos =, 4 hjos La varabldad meda del número de hjos respecto a la meda artmétca es de,4 hjos. Datos agrupados en ntervalos de clase y presentados en una tabla de frecuencas Para datos agrupados en ntervalos de clase, la fórmula de la varanza (3.8) se expresa como sgue: k ' ( ) x X f (3.5) = S = n donde, k es el número de ntervalos de clase ' x es la marca de clase del -ésmo ntervalo f es la frecuenca absoluta asocada al -ésmo ntervalo Otra expresón de la varanza para datos agrupados con ntervalos de clase es la sguente: 49 49 3/03/006, 0:35 p.m.

S k k ' ' x f nx x f = = = donde X = n y la desvacón estándar es: n (3.6) S = S en cualquera de los dos casos. Ejemplo 3 Los alumnos del doctorado en Educacón matrculados en el semestre 000, en el marco del curso de Estadístca Aplcada a la Investgacón, realzaron una nvestgacón con el objetvo de establecer el perfl de los estudantes de maestría de la UNMSM matrculados en el semestre académco 000-I y que ngresaron a la unversdad entre los años 997 y 999. El estudo se llevó a cabo entre abrl y juno de 000. Como el número total de estudantes que cursaban las dversas maestrías era alrededor de 500, después de grandes debates, los alumnos del doctorado en Educacón decderon selecconar una muestra de 30 estudantes de la maestría en Gestón Educatva. A contnuacón se presentan los datos para la varable edad de los estudantes. Obtengamos la varanza y la desvacón estándar. Solucón Se resumen los pasos para la obtencón de la varanza y los cálculos se presentan en el sguente cuadro: ' Se calculan las marcas de clase x, se genera una columna con los productos de cada marca ' de clase por su correspondente frecuenca x f, la columna anteror (los resultados obtendos en cada caso) se vuelve a multplcar por la correspondente marca de clase, resultando ' x f, 50 50 3/03/006, 0:35 p.m.