JUAN CARLOS VERGARA SCHMALBACH VÍCTOR MANUEL QUESADA IBARGUEN



Documentos relacionados
Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Tema 1: Estadística Descriptiva Unidimensional

EXPERIMENTACIÓN COMERCIAL(I)

Pruebas Estadísticas de Números Pseudoaleatorios

INTRODUCCIÓN. Técnicas estadísticas

Capitalización y descuento simple

Trabajo y Energía Cinética

Índice de Precios de las Materias Primas

PROPORCIONAR RESERVA ROTANTE PARA EFECTUAR LA REGULACIÓN PRIMARIA DE FRECUENCIA ( RPF)

TEMA 4 Variables aleatorias discretas Esperanza y varianza

Clase 25. Macroeconomía, Sexta Parte

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009


TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS.

Guía de ejercicios #1

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

12-16 de Noviembre de Francisco Javier Burgos Fernández

Medidas de Tendencia Central y de Variabilidad

INSTRUCTIVO No. SP 04 / 2002 INSTRUCTIVO PARA LA DETERMINACIÓN Y CÁLCULO DEL SALARIO BÁSICO REGULADOR

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó

Matemática Financiera Sistemas de Amortización de Deudas

CLAVE - Laboratorio 1: Introducción

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

JUAN CARLOS VERGARA SCHMALBACH VÍCTOR MANUEL QUESADA IBARGUEN

4) Ahora elaboremos la tabla de distribución de frecuencias: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE LOS PESOS DE LOS ESTUDIANTES MERU CALIDAD.

Análisis de Regresión y Correlación

Slide 1. Slide 2 Organización y Resumen de Datos. Slide 3. Universidad Diego Portales. Tablas de Frecuencia. Estadística I

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS

Algoritmo para la ubicación de un nodo por su representación binaria

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

Economía de la Empresa: Financiación

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

Prueba de Evaluación Continua

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

SEMANA 13. CLASE 14. MARTES 20/09/16

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Medidas de centralización

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Relaciones entre variables

Módulo 3. OPTIMIZACION MULTIOBJETIVO DIFUSA (Fuzzy Multiobjective Optimization)

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

DEFINICIÓN DE INDICADORES

17/02/2015. Ángel Serrano Sánchez de León

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

TEMA 1.- CONCEPTOS BÁSICOS

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

ESTADÍSTICA. Definiciones

REGRESION Y CORRELACION

Medidas de Variabilidad

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Descripción de una variable

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

Ejercicio de estadística para 3º de la ESO

ACTIVIDADES INICIALES

Correlación y regresión lineal simple

Para crear una lista como la anterior, primero escribe la información, y después selecciona el texto y aplícale el formato de viñetas.

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

CONSEJERÍA DE EDUCACIÓN, CULTURA Y DEPORTE

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

Unidad Central del Valle del Cauca Facultad de Ciencias Administrativas, Económicas y Contables Programa de Contaduría Pública

1.1 Ejercicios Resueltos Tema 1

Smoothed Particle Hydrodynamics Animación Avanzada

16/02/2015. Ángel Serrano Sánchez de León

Aspectos fundamentales en el análisis de asociación

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk

Material realizado por J. David Moreno y María Gutiérrez. Asignatura: Economía Financiera

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO PLANTEL IGNACIO RAMÍREZ C. DE LA ESCUELA PREPARATORIA

ANÁLISIS EXPLORATORIO DE DATOS

1.- Elegibilidad de estudiantes. 2.- Selección de estudiantes - 2 -

Estadística Unidimensional: SOLUCIONES

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

MÉTODOS PARA PROBAR NUMEROS

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

Aplicaciones de Estadística Descriptiva

UNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II

ADENDA 008 LICITACIÓN L-CEEC

Lección 4. Ejercicios complementarios.

LECTURA 03: DISTRIBUCIONES DE FRECUENCIAS (PARTE II)

MODELO DE PROCESOS TECNOLOGÍAS DE LA INFORMACIÓN - GESTIÓN DEL SERVICIO

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Organización y resumen de datos cuantitativos

MATEMÁTICA DE LAS OPERACIONES FINANCIERAS I

INSYS Advanced Dashboard for Enterprise

TEMA 8: PRÉSTAMOS ÍNDICE

GUIAS DE ACTIVIDADES Y TRABAJO PRACTICO Nº 22

ANÁLISIS DE ACCESIBILIDAD E INTERACCIÓN ESPECIAL:

Pronósticos. Humberto R. Álvarez A., Ph. D.

4.4.OTROS CONSEJERÍA DE EDUCACIÓN, CULTURA Y DEPORTE

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

Transcripción:

Introduccón a la estadístca, dstrbucones de frecuencas, gráfcos estadístcos, meddas de tendenca central, dspersón, poscón y forma, con ejemplos resueltos en Mcrosoft Excel JUAN CARLOS VERGARA SCHMALBACH VÍCTOR MANUEL QUESADA IBARGUEN ISBN: 978-84-690-5503-8 Grupo Métodos Cuanttatvos de Gestón Programa de Admnstracón Industral Unversdad de Cartagena Unversdad de Cartagena

ESTADÍSTICA BÁSICA CON APLICACIONES EN MS EXCEL JUAN CARLOS VERGARA SCHMALBACH VÍCTOR MANUEL QUESADA IBARGÜEN ISBN: 978-84-690-5503-8

CONTENIDO PRÓLOGO...8 LOS AUTORES...9 LIBRO: MÉTODOS CUANTITATIVOS CON WINQSB...10 INTRODUCCIÓN...11 1. INTRODUCCIÓN A LA ESTADÍSTICA...13 1.1 UN POCO DE HISTORIA...13 1. DEFINICIÓN Y CLASIFICACIÓN...14 1..1 Clasfcacón de la estadístca...15 1.3 LA INVESTIGACIÓN ESTADÍSTICA...16. LAS TABLAS DE FRECUENCIA...18.1 CONSTRUCCIÓN Y CARACTERÍSTICAS DE LAS TABLAS TIPO A...18.1.1 Ejemplo tabla de frecuenca tpo A...18.1. Característcas de las tablas Tpo A....1.3 Construccón de las tablas Tpo A en Excel.... CONSTRUCCIÓN Y CARACTERÍSTICAS DE LAS TABLAS TIPO B...3..1 Ejemplo 1: tablas de frecuenca tpo B...33.. El Problema de la Ambgüedad en las Tablas de Frecuenca Tpo B...37..3 Ejemplo : tablas de frecuenca tpo B...39..4 Característcas de las tablas tpo B...41..4 Construccón de las tablas tpo B en Excel...41.3 EJERCICIOS PROPUESTOS...5.4 CASO: LA GESTIÓN DEL GOBIERNO...56.5 CUESTIONARIO DE REPASO...58 3. GRÁFICOS ESTADÍSTICOS...60 3.1 GRÁFICOS DE SECTORES...60 3.1.1 Ejemplo de gráfcos de sectores...60 3.1. Característcas de los gráfcos de sectores...6 3.1.3 Construccón de los gráfcos de sectores en Excel...6 3. GRÁFICOS DE COLUMNAS...69 3..1 Ejemplo de gráfcos de columnas...69 3

3.. Característcas de los gráfcos de columnas...71 3..3 Construccón de los gráfcos de columnas en Excel...7 3.3 HISTOGRAMA...76 3.3.1 Ejemplo de hstogramas...76 3.3. Característcas de los hstogramas...78 3.3.3 Construccón de hstogramas en Excel...79 3.4 POLÍGONOS DE FRECUENCIAS...81 3.4.1 Ejemplo de polígonos de frecuencas...81 3.4. Característcas de los polígonos de frecuencas...83 3.4.3 Construccón de los polígonos de frecuencas en Excel...84 3.5 CURVAS SUAVIZADAS O CURVAS DE FRECUENCIAS...85 3.5.1 Construccón de las curvas suavzadas en Excel...85 3.5. Característcas de las curvas suavzadas...86 3.6 OJIVAS...86 3.6.1 Ejemplo de ojvas...86 3.6. Característcas de las ojvas...88 3.6.3 Interpretando la nformacón en las ojvas...88 3.6.4 Construccón de ojvas en Excel...89 3.7 PICTOGRAMAS...94 3.7.1 Ejemplo de pctogramas...94 3.7. Característcas de los pctogramas...95 3.8 EJERCICIOS PROPUESTOS...96 3.9 CASO: EL PROVEEDOR DE TUBOS DE ACERO...100 3.10 CUESTIONARIO DE REPASO...101 CAPITULO 4: MEDIDAS DE TENDENCIA CENTRAL...104 4.1 LA MEDIA ARITMÉTICA...104 4.1.1 Meda artmétca para datos no agrupados...104 4.1. Ejemplo: la meda artmétca para datos no agrupados...105 4.1.3 Meda artmétca para datos agrupados...105 4.1.4 Ejemplo: meda artmétca para datos agrupados en tablas tpo A...106 4.1.5 Ejemplo: meda artmétca para datos agrupados en tablas tpo B...107 4

4.1.6 Ejemplo: comparatva entre el cálculo de la meda artmétca para datos no agrupados y datos agrupados en tablas tpo B...108 4.1.7 Cálculo de la meda artmétca en Excel...109 4.1.8 Ventajas...113 4.1.9 Desventajas...113 4. LA MEDIANA...114 4..1 Ejemplo: medana para datos no agrupados (cantdad de datos mpar)...114 4.. Ejemplo: medana para datos no agrupados (cantdad de datos par).115 4..3 Ejemplo: medana para datos agrupados en tablas tpo A...115 4..4 Ejemplo: medana para datos agrupados en tablas tpo B...117 4..5 La fórmula para calcular la medana...118 4..6 Ubcando la medana en el gráfco de ojva...119 4..7 Calculo de la medana en Excel...119 4..8 Ventajas...10 4..9 Desventajas...10 4.3 LA MODA...11 4.3.1 Ejemplo: moda para datos no agrupados...11 4.3. Ejemplo: moda para datos agrupados...11 4.3.3 Calculo de la moda medante fórmula...1 4.3.4 Calculo de la medana en Excel...1 4.3.5 Ventajas...14 4.3.6 Desventajas...14 4.4 EJERCICIOS PROPUESTOS...15 4.5 CASO: POBLACIÓN Y MUESTRA...17 4.6 CUESTIONARIO DE REPASO...18 CAPITULO 5: MEDIDAS DE DISPERSIÓN...131 5.1 DESVIACIÓN MEDIA...131 5.1.1 Ejemplo: Desvacón meda para datos no agrupados...134 5.1. Ejemplo: Desvacón meda para datos agrupados...135 5.1.3 Cálculos de la desvacón meda en Excel...136 5. LA VARIANZA...140 5

5..1 Ejemplo: Varanza para datos no agrupados...141 5.. Ejemplo: Varanza para datos agrupados...141 5..3 Cálculo de la varanza en Excel...14 5.3 DESVIACIÓN ESTÁNDAR...146 5.3.1 Ejemplo: Desvacón estándar para datos no agrupados...147 5.3. Ejemplo: Desvacón estándar para datos agrupados...148 5.3.3 Cálculo de la Desvacón estándar en Excel...149 5.4 COEFICIENTE DE VARIACIÓN...15 5.4.1 Ejemplo: Desvacón estándar para datos no agrupados...153 5.4. Calculo del coefcente de varacón en Excel...155 5.5 EJERCICIOS PROPUESTOS...156 5.6 CASO: EL RÍO MAGDALENA...158 CAPITULO 6: MEDIDAS DE POSICIÓN...160 6.1 PERCENTILES...160 6.1.1 Ejemplo: Calculo de percentles...16 6.1. La fórmula para calcular percentles...163 6. DECILES...163 6..1 Ejemplo: Calculo de decles...164 6.. La fórmula para calcular decles...166 6.3 CUARTILES...166 6.3.1 Ejemplo: Calculo de cuartles...167 6.3. La fórmula para calcular cuartles...168 6.4 APLICACIÓN DE PERCENTILES Y CUARTILES EN EXCEL...169 6.5 LAS MEDIDAS DE POSICIÓN Y EL GRÁFICO DE OJIVA...171 6.6 EJERCICIOS PROPUESTOS...173 6.7 CUESTIONARIO DE REPASO...175 CAPITULO 7: MEDIDAS DE FORMA...177 7.1 TIPOS DE DISTRIBUCIONES DE FRECUENCIA MÁS COMUNES...177 7.1.1 Dstrbucón smétrca...177 7.1. Dstrbucón asmétrca...178 7. RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA...179 7..1 Ejemplo: Relacón entre la meda, medana y moda...180 6

7.3 COEFICIENTE DE ASIMETRÍA...181 7.3.1 Ejemplo: Cálculo del coefcente de asmetría...181 7.4 CURTOSIS...183 7.4.1 Ejemplo: Cálculo de la Curtoss...184 7.5 EJERCICIOS PROPUESTOS...186 ANEXO A. RESUMEN DE SIMBOLOGÍA Y FÓRMULAS ESTADÍSTICAS UNIDAD II..188 ANEXO B. RESUMEN DE SIMBOLOGÍA Y FÓRMULAS ESTADÍSTICAS UNIDAD IV.189 ANEXO C. RESUMEN DE SIMBOLOGÍA Y FÓRMULAS ESTADÍSTICAS UNIDAD V.190 ANEXO D. RESUMEN DE SIMBOLOGÍA Y FÓRMULAS ESTADÍSTICAS UNIDAD VI 19 ANEXO E. RESUMEN DE SIMBOLOGÍA Y FÓRMULAS ESTADÍSTICAS UNIDAD VII193 7

PRÓLOGO El lector seguramente se preguntará el porqué y para qué de un nuevo texto de estadístca básca, con la abundanca de manuales de estadístca como exsten hoy día, de manera que se hace necesaro, desde estas prmeras págnas ponerle en conocmento las dferencas de este nuevo texto con cualquer otro que haya tendo a mano. En efecto, en cuanto a contendo, es posble que usted, señor estudante, docente, empresaro o, en general, usuaro de esta obra, sólo encuentre temas comunes a cualquer lbro de estadístca; no obstante encontrará un aspecto dferencador que consttuye un verdadero valor añaddo que le permtrá aglzar el estudo de las técncas estadístcas ahorrándole tempo aprecable en el manejo de datos y por ende dejándole un mayor espaco dsponble para el análss de la nformacón requerda para la toma de decsones. Es común en la enseñanza de la estadístca en las escuelas de ngenería, admnstracón y demás dscplnas que la utlzan, que los docentes reclamen la adquscón de software especalzado para el manejo de su asgnatura, a lo que no sempre las nsttucones responden con la debda dlgenca. Pero aún cuando haya respuesta postva en este sentdo, que las nsttucones se preocupen por mantenerse actualzadas en matera de software lcencado, en ocasones éstos revsten tal complejdad en su manejo que tanto estudantes como profesores dessten de su uso, permanecendo la enseñanza de esta matera en una stuacón de manualdad que oblga a que la mayor parte del tempo presupuestado para su desarrollo se nverta en la llamada carpntería y muy poco en el análss, cual es la fnaldad últma s se desea hacer uso óptmo de la nformacón dsponble. La obra que hoy ofrecemos a la comundad académca y empresaral cuenta con la ventaja de estar basada en Excel, un software al alcance de cualquer nsttucón o persona y de fácl manejo por parte de cualquer usuaro, de tal forma que al tempo que se mparte la asgnatura se logra tanto el domno de la estadístca como del Excel, una valosa herramenta para la gestón de procesos admnstratvos a cualquer nvel. Los estudantes de la estadístca descrptva encontrarán en este texto los conceptos báscos y la metodología para la manpulacón de datos para producr la nformacón relevante para el uso requerdo. Esperamos que el lbro tenga la acogda que se merece pues, sendo un tanto nmodestos, pretendemos que consttuya un aporte sgnfcatvo a la mejora de los métodos de enseñanza de esta mportante asgnatura, Los autores 8

LOS AUTORES VÍCTOR MANUEL QUESADA IBARGUEN: Docente Ttular de la Unversdad de Cartagena en el área de los métodos cuanttatvos del programa de Admnstracón Industral. Ingenero Industral de la Unversdad INCCA, Especalsta en Fnanzas U. del Valle, Especalsta en Investgacón U. de Cartagena, Magíster en Economía de la Unversdad Naconal de Colomba, Ph.D. Ingenería de Organzacón, Unversdad de Sevlla España. Pertenecente al Grupo de Investgacón de Métodos Cuanttatvos de Gestón (GMCG). Lbros publcados: Programacón Lneal (S/ISBN), Programacón Lneal y Entera. ISBN 958 33 0588 X (1997), Productvdad y Efcenca en la Empresa: Un Enfoque Práctco ISBN- 958-930-19-9 (003), Métodos Cuanttatvos con WINQSB ISBN- 978-84-690-3681-5 (007). Correo electrónco: quesastoque@une.com.co JUAN CARLOS VERGARA SCHMALBACH: Ingenero Industral de la Unversdad Tecnológca de Bolívar, especalsta en fnanzas de la Unversdad de Cartagena y magster en Admnstracón de Empresas de la Unversdad Naconal. Docente de tempo completo de la Unversdad de Cartagena en el área de los métodos cuanttatvos del programa de Admnstracón Industral. Pertenecente al Grupo de Investgacón de Métodos Cuanttatvos de Gestón (GMCG). Lbros publcados: Métodos Cuanttatvos con WINQSB ISBN- 978-84-690-3681-5 (006). Correo Electrónco: juancarlosvergaras@yahoo.com.mx. Págna WEB: http://juancarlosvergara.50webs.org. Págna WEB grupo métodos cuanttatvos de gestón: http://metodoscuanttatvos.50webs.org 9

LIBRO: MÉTODOS CUANTITATIVOS CON WINQSB El lbro MÉTODOS CUANTITATIVOS CON WINQSB lo ntroducrá en el apasonante mundo de la solucón de problemas complejos medante el uso de software para computadoras. WINQSB es una aplcacón versátl que permte la solucón de una gran cantdad de problemas desde nveles admnstratvos, produccón, recurso humano hasta la dreccón de proyectos. Debdo a su facldad y potenca de manejo, este lbro se converte en una herramenta ndspensable para el estudante de pregrado o postgrado que partcpa en materas relaconadas como la nvestgacón de operacones, los métodos de trabajo, planeacón de la produccón, evaluacón de proyectos, control de caldad, smulacón, estadístca, entre otras. Los módulos tratados en este lbro son: - Programacón Lneal y Entera - Programacón por Metas - PERT CPM - Planeacón Agregada - Pronóstcos - Teoría y Sstemas de Inventaro - Análss de Decsones - Planeacón de Requermento de Materales (MRP) - Programacón Dnámca - Modelos de Redes - Teoría y smulacón de colas - Cadenas de Markov Puede consegur la versón electrónca en la págna web http://www.eumed.net o en http://metodoscuanttatvos.50webs.org 10

INTRODUCCIÓN El lbro ESTADÍSTICA BÁSICA CON APLICACIONES EN MS EXCEL esta dseñado como un texto ntroductoro haca la Estadístca Descrptva, a partr de ejerccos resueltos paso a paso, utlzando como complemento Mcrosoft Excel. Al termnar el curso, el estudante comprenderá el orgen de la Estadístca, los métodos cuanttatvos báscos para el tratamento de datos y un manejo en las funcones estadístcas ofrecdas por Mcrosoft Excel. El lbro cuenta con sete capítulos donde se presenta una ntroduccón teórca, ejerccos resueltos paso a paso, ejerccos propuestos, un cuestonaro y un resumen de fórmulas utlzadas por captulo. La temátca tratada se resume en: Captulo 1 - Introduccón a la estadístca: Incluye una breve hstora del orgen y desarrollo de la estadístca. Al gual que los conceptos báscos necesaros para ncar el curso. Captulo Tablas de frecuenca: Tabulacón de datos en tablas smples (llamadas tpo A) y con ntervalos de clases (tpo B). Captulo 3 Gráfcos estadístcos: Gráfcos construdos a partr de las tablas de frecuencas. Captulo 4 Meddas de tendenca central: Calculo de la meda, medana y moda. Captulo 5 Meddas de dspersón: Cálculo de la desvacón meda, varanza y desvacón estándar. Captulo 6 Meddas de poscón: Cálculo de percentles, Decles y cuartles. Captulo 7 Meddas de forma: Cálculo de ndcadores que dentfcan la forma en que se dstrbuyen los datos. El lbro cuenta con pequeños conos que dentfcan seccones especales: Identfcador de defncones de térmnos estadístcos Ejercco resuelto en Mcrosoft Excel Formato de la funcón estadístca empleada en Mcrosoft Excel 11

CAPITULO 1 INTRODUCCIÓN A LA ESTADÍSTICA En este captulo se hará un pequeño recorrdo por la hstora de la estadístca, menconando algunos de los personajes que la mpulsaron, recalcando sus progresos y aportes a través del tempo. Analzaremos los conceptos que adoptan los dstntos autores sobre la defncón de estadístcas y su clasfcacón. Por últmo, entenderemos la estadístca como una herramenta de apoyo a la nvestgacón de tpo cuanttatva, la cual se hace partcpe desde la recoleccón de datos hasta el análss de los msmos. 1

1. INTRODUCCIÓN A LA ESTADÍSTICA 1.1 UN POCO DE HISTORIA El uso de herramentas cuanttatvas para el tratamento de datos, tene orgen en épocas remotas. Se tene nformacón de hace más 3000 años antes de Crsto, donde las antguas cvlzacones, como la Egpca, aplcaron contnuamente censos que ayudaban a la organzacón del estado y la construccón de las prámdes. El antguo testamento nos sugere que Mosés ordenó un Censo a la poblacón Israelta para dentfcar los membros de las famlas. En la antgua Greca y el Impero Romano, era común la aplcacón de censos para la planfcacón de mpuestos y la prestacón del servco mltar. La palabra estadístca derva del latín moderno statstcum collegum ( consejo de estado ), del latín antguo status ( poscón, forma de goberno ), de la palabra talana moderna statsta ( estadsta, polítco ) y del talano antguo stato ( estado ). En 1749, el alemán, Gottfred Achenwall (1719-179) usa el térmno Statstk en su lbro ttulado Staatswssenschaft der vornehmen Europäschen Reche und Republken, quen orgnalmente desgnó la palabra estadístca para el análss de los datos de un goberno, defnéndola como la Cenca del Estado. A Gottfred Achenwall se le conoce como el Padre de la Estadístca. La prmera persona que ntrodujo el térmno estadístca en Inglaterra fue Sr John Snclar (1754-1835) con su trabajo Statstcal Account of Scotland (1791-,1799) trabajo complado en 1 volumenes. El autor explca en su lbro, que la palabra estadístca la adoptó gracas al estudo de nvestgacones realzadas en Alemana, como una palabra novedosa que llamaría la atencón de los ngleses; a dferenca, de que en Alemana la estadístca se usa como nstrumento para medr la fortaleza de un estado, mentras que Snclar, la emplearía como generadora de nformacón nterna para encontrar falencas y proponer mejoras en el país. A este trabajo le sgueron dos publcacones: la segunda edcón elaborada entre 1834 y 1845; la tercera edcón comenza después de la segunda guerra mundal comprendendo los perodos entre 1951 y 199. 1 A comenzos del sglo XIX, la palabra estadístca adopta un sgnfcado más generalzado haca la recoleccón y clasfcacón de cualquer tpo de datos cuanttatvos. Wllam Playfar (1759-183) expone su dea de que los gráfcos permten una comuncacón más efcente que las tablas de frecuenca. Es consderado como el nventor de los gráfcos lneales, de barras y de sectores. Playfar publcó el lbro ttulado The Commercal and Poltcal Atlas (1786) el cual contene 43 gráfcos 1 Para obtener el texto completo de las edcones puede drgrse al sguente lnk http://edna.ac.uk/stat-accscot 13

de seres de tempo y por prmera vez, es usado un gráfco de barras. En 1801 utlza el prmer gráfco de sectores en su obra Playfar s Statstcal Brevary. Sr Francs Galton (18-1911) creó el concepto estadístco de regresón y correlacón, y fue el prmero en aplcar métodos estadístcos para estudar las dferencas humanas basado en el uso de cuestonaros y entrevstas para recolectar los datos. Herman Hollerth (1860-199) fue un estadístco estadoundense quen desarrollo la prmera máquna tabuladora basada en tarjetas perforadas y mecansmos eléctrco-mecáncos para el tratamento rápdo de mllones de datos. Su máquna fue usada en el censo de 1890 en estados undos que redujo la tabulacón de los datos de 7 años (censo de 1880) a.5 años. Creó la frma Computng Tabulatng Recordng Corporaton (CTR), que bajo la presdenca de Thomas J. Watson fue renombrada a Internatonal Busness Machnes (IBM) en 194. Major Greenwwod (1880-1949) nvestga los problemas de salud asocados al trabajo en fábrcas. Desarrolló la Epdemología y en 1919 creó el Mnstero de la Salud en Inglaterra, responsable de datos estadístcos médcos. 1. DEFINICIÓN Y CLASIFICACIÓN Como vmos en el apartado anteror, la estadístca a varado su sgnfcado a través del tempo, pasando de ser una herramenta usada solo para la admnstracón de los gobernos, a una cenca con un sn fn de aplcacones en dferentes dscplnas. Estadístca: La encclopeda Brtánca defne la estadístca como la cenca encargada de recolectar, analzar, presentar e nterpretar datos. La estadístca pasa a ser una cenca básca cuyo objetvo prncpal es el procesamento y análss de grandes volúmenes de datos, resuméndolos en tablas, gráfcos e ndcadores (estadístcos), que permten la fácl compresón de las característcas concernentes al fenómeno estudado. Estadístca: El famoso dcconaro Ingles Word Reference defne la estadístca como un área de la matemátca aplcada orentada a la recoleccón e nterpretacón de datos cuanttatvos y al uso de la teoría de la probabldad para calcular los parámetros de una poblacón. Estadístco: Cualquer característca medble calculada sobre una muestra o poblacón. Los datos pueden provenr de una poblacón o muestra. Esto datos deben ser cuanttatvos, para así poder aplcar sobre ellos, operacones artmétcas. 14

Muestra: Es un subconjunto de una poblacón. Una muestra es representatva cuando los elementos son selecconados de tal forma que pongan de manfesto las característcas de una poblacón. Su característca más mportante es la representatvdad. La seleccón de los elementos que conforman una muestra pueden ser realzados de forma probablístca o aleatora (al azar), o no probablístca. Muestra Poblacón 1..1 Clasfcacón de la estadístca La estadístca se puede clasfcar en dos grandes ramas: Estadístca descrptva o deductva. Estadístca nferencal o nductva. La prmera se emplea smplemente para resumr de forma numérca o gráfca un conjunto de datos. Se restrnge a descrbr los datos que se analzan. S aplcamos las herramentas ofrecdas por la estadístca descrptva a una muestra, solo nos lmtaremos a descrbr los datos encontrados en dcha muestra, no se podrá generalzar la nformacón haca la poblacón. La estadístca nferencal permte realzar conclusones o nferencas, basándose en los datos smplfcados y analzados de una muestra haca la poblacón o unverso. Por ejemplo, a partr de una muestra representatva tomada a los habtantes de una cudad, se podrá nferr la votacón de todos los cudadanos que cumplan los requstos con un error de aproxmacón. 15

1.3 LA INVESTIGACIÓN ESTADÍSTICA El proceso de aplcacón de la estadístca mplca una sere de pasos: 1. Seleccón y determnacón de la poblacón o muestra y las característcas contendas que se desean estudar. En el caso de que se desee tomar una muestra, es necesaro determnar el tamaño de la msma y el tpo de muestreo a realzar (probablístco o no probablístco).. Obtencón de los datos. Esta puede ser realzada medante la observacón drecta de los elementos, la aplcacón de encuestas y entrevstas, y la realzacón de expermentos. 3. Clasfcacón, tabulacón y organzacón de los datos. La clasfcacón ncluye el tratamento de los datos consderados anómalos que pueden en un momento dado, falsear un análss de los ndcadores estadístcos. La tabulacón mplca el resumen de los datos en tablas y gráfcos estadístcos. 4. Análss descrptvo de los datos. El análss se complementa con la obtencón de ndcadores estadístcos como las meddas: de tendenca central, dspersón, poscón y forma. 5. Análss nferencal de los datos. Se aplcan técncas de tratamento de datos que nvolucran elementos probablístcos que permten nferr conclusones de una muestra haca la poblacón (opconal). 6. Elaboracón de conclusones. Se construye el nforme fnal. PASO 1 Seleccón y determnacón de la poblacón o muestra PASO Obtencón de los datos (observacón, encuesta, expermento) PASO 3 Clasfcacón, tabulacón y organzacón. PASO 6 Informe fnal PASO 5 Análss nferencal (opconal) PASO 4 Análss descrptvo 16

CAPITULO TABLAS DE FRECUENCIA El prncpal objetvo de la estadístca descrptva es sntetzar conjuntos de datos medante tablas o gráfcos resumen, con el fn de poder dentfcar el comportamento característco de un fenómeno y facltar su análss exhaustvo. Cualquer nvestgacón que se emprenda puede conducr a la acumulacón de valores cuanttatvos y cuas-cualtatvos correspondentes a las dversas meddas efectuadas. Esta posbldad, converte a la estadístca en una herramenta vtal para el tratamento de volúmenes de datos medante tablas resúmenes conocdas como "Tablas de Frecuenca". Cuando los datos son agrupados, la nterpretacón resulta ser más senclla. 17

. LAS TABLAS DE FRECUENCIA Tablas de Frecuenca: Tablas estadístcas que agrupan dversos valores de una varable, smplfcando los datos. Para entender como funconan las tablas de frecuenca, analcemos el sguente ejemplo: Una persona lanza una moneda 10 veces, y regstra s el lado superor cae en cara (C) o sello (S). Los resultados del expermento se muestran a contnuacón: C, S, S, C, C, S, S, C, S, C La forma de smplfcar los datos anterores equvale a contar cuantas veces se repte cada lado de la moneda. A esta operacón la conoceremos como frecuenca Absoluta. Frecuenca Absoluta (f): Numero de veces que se repte un valor dentro de un conjunto de datos. El lado cara se reptó 5 veces y el lado sello 5 veces. Nótese que la suma de las frecuencas equvale al total de lanzamentos. Lado Frecuenca ( f ) Cara (C) 5 Sello (S) 5 Podemos dentfcar dos tpos de tablas de frecuencas, las cuales denotaremos como tablas tpo A y B..1 CONSTRUCCIÓN Y CARACTERÍSTICAS DE LAS TABLAS TIPO A Las Tablas Tpo A se caracterzan por manejar un conjunto pequeño de posbles resultados de una varable dentro de la muestra o poblacón. Por lo general, su uso tende al manejo de datos cualtatvos o varables cuanttatvas dscretas..1.1 Ejemplo tabla de frecuenca tpo A Una empresa decde medr el grado de aceptacón de 10 clentes sobre un nuevo producto que hace poco saló al mercado. Para tal fn, se les pde que valoren, empleando una escala del 1 al 5, su opnón frente al producto. (1 = Muy Malo, = Malo, 3 = Regular, 4 = Bueno y 5 = Excelente). Las respuestas tabuladas de los 10 clentes son: 18

Clente Respuesta 1 5 3 4 4 5 5 4 6 3 7 4 8 5 9 3 10 5 En presenca de estos puntajes, la persona encargada del proyecto, pde que se smplfquen y luego se nterpreten los datos. SOLUCIÓN Como podemos observar, el numero de resultados que puede alcanzar la varable grado de aceptacón son relatvamente pocos (solo cnco posbldades), por lo cual dentfcaremos la tabla de frecuenca resultante como una Tabla Tpo A. Otra forma de catalogar los datos es conocendo la dstanca o varacón que hay entre el valor menor (Xmn) y el valor mayor (Xmax), dferenca que de ahora en adelante la conoceremos como Rango. Rango (R): Dferenca exstente entre el valor Máxmo (X max ) y el valor Mínmo (X mn ) de un conjunto de datos. La fórmula empleada es: R En nuestro ejemplo R sera gual a 4. = R = 4 X max X mn R = 5 1 S el rango manejado es pequeño, bastara representar los datos con una tabla Tpo A. Para crear esta tabla deberemos segur los sguentes pasos: PASO 1: Contar las veces que se repte cada valor dentro de la muestra. PASO : Ubcar estas frecuencas en una tabla ordenada. 19

Grado de Aceptacón Frecuenca (f) 1 0 1 3 4 3 5 4 TOTAL 10 Nnguno de los clentes valoró al producto como muy malo (grado de aceptacón gual a 1), mentras que la mayoría de las respuestas se centraron en valorar al producto como Excelente y Bueno (grado de aceptacón guales a 5 y 4 respectvamente). Observando los datos resumdos, podemos conclur que la mayoría de las personas encuestadas tenen una vsón favorable del nuevo producto. Queda claro, como la tabla de frecuenca aglza el análss de los datos. Nótese que la sumatora de las frecuencas es gual al número de personas encuestadas (10), por lo cual podemos llegar a la sguente conclusón: Nc =1 f = n Donde Nc representa el número de posbles resultados tabulados en la tabla (que de ahora en adelante se le conocerán como clases ). En el caso de que se entrevste a toda la poblacón, la fórmula se adaptaría así: Nc =1 f = N La estadístca consdera otros tpos de frecuencas auxlares que complementan el análss de las tablas de frecuenca. Frecuenca Absoluta Acumulada (F): Presenta un saldo acumulado de las frecuencas de los ntervalos. Esta frecuenca se calcula sumando el acumulado de las frecuencas de los ntervalos anterores más la frecuenca absoluta del ntervalo actual. F = F 1 + f 0

La Frecuenca Absoluta Acumulada del últmo ntervalo es gual al tamaño de la muestra (o poblacón). Sguendo con el ejemplo, tenemos: Grado de aceptacón 1: Grado de aceptacón : Grado de aceptacón 3: Grado de aceptacón 4: Grado de aceptacón 5: F 1 = 0 F = 0 + 1 = 1 F3 = 1+ = 3 F4 = 3 + 3 = 6 F5 = 6 + 4 = 10 Esta frecuenca no proporcona de nmedato el número de casos que queda por debajo de cada clase. La F 4, por ejemplo, nos dce que ses personas opnaron que el producto se encontraba entre muy malo y bueno. Frecuenca Relatva (h): Equvale a la razón de las frecuencas de cada ntervalo sobre la totaldad de los datos (n o N, dependendo del caso). Matemátcamente se expresa: h = Para el ejemplo, las frecuencas relatvas son: f n Grado de aceptacón 1: Grado de aceptacón : Grado de aceptacón 3: Grado de aceptacón 4: Grado de aceptacón 5: h 0 10 1 10 10 3 10 4 10 1 = = h h h h = = 3 = = 4 = = 5 = = 0 0,1 0, 0,3 0,4 ó 10% ó 0% ó 30% ó 40% La sumatora de las frecuencas relatvas debe ser gual a 1 (s se trabaja estos valores como porcentaje, equvaldría al 100% de los datos). Nc = 1 h = 1 El 40% de las personas encuestadas (h 5 ), opnaron que el producto es excelente. 1

Frecuenca Relatva Acumulada (H): Presenta un saldo acumulado de las frecuencas relatvas de cada ntervalo de clase. Su cálculo resulta de la suma del acumulado de las frecuencas relatvas de los ntervalos anterores más la frecuenca relatva del ntervalo actual. H = H 1 + h La últma de las Frecuencas Relatvas Acumuladas equvale a 1. Las tablas de frecuencas suelen mostrar tanto las frecuencas absolutas, como relatvas. Grado de Aceptacón (Clase) F F h H 1 0 0 0,0 0,0 1 1 0,1 0,1 3 3 0, 0,3 4 3 6 0,3 0,6 5 4 10 0,4 1,0 TOTAL 10 1,0.1. Característcas de las tablas Tpo A - El número de posbles valores que toma la varable debe ser reducdo. (Rango pequeño). - Suele ser utlzada en la cuantfcacón de las varables cuas-cualtatvas. - Maneja varables cuanttatvas cuyos valores son preferblemente dscretos. - Su construccón es senclla. - La nterpretacón equvale a especfcar la frecuenca de cada resultado..1.3 Construccón de las tablas Tpo A en Excel Creemos un archvo nuevo en Mcrosoft Excel pulsando sobre la opcón Nuevo en el menú Archvo o pulsando sobre el botón encuentra en la barra de herramentas. que se Aquellos que posean la versón 007, deberán oprmr el botón ARCHIVO que se encuentra en la esquna superor zquerda de la ventana.

Ubquémonos a partr de la celda B y escrbamos los sguentes datos (una palabra en cada celda): Azul Verde Rojo Blanco Rojo Verde Rojo Rojo Azul Azul Blanco Verde Azul Rojo Verde Azul Azul Rojo Verde Azul Rojo Verde Verde Azul Rojo Negro Negro Negro Azul Verde Verde Verde Blanco Azul Rojo Negro Negro Azul Negro Blanco Rojo Azul Blanco Azul Negro Azul Azul Blanco Azul Rojo Blanco Rojo Blanco Rojo Blanco Verde Blanco Azul Verde Azul Rojo Verde Negro Blanco Rojo Azul Azul Rojo Azul Blanco En Excel debería verse así: 3

Construyamos la estructura de nuestra tabla de frecuenca dejando espaco para la frecuenca absoluta, absoluta acumulada, relatva y relatva acumulada a partr de la celda B13: Para determnar la cantdad de colores azul que exsten en los datos ncales emplearemos la sguente fórmula: CONTAR.SI: Permte contar una palabra, número o carácter especal dentro de un conjunto de datos. Formato: CONTAR.SI(rango;crtero) Categoría: Estadístca Ubcándonos en la celda C14 actvaremos la fórmula CONTAR.SI pulsando sobre el botón o en la opcón Funcón en el menú Insertar. En Mcrosoft Excel 007 deberá ngresar en la fcha FÓRMULAS y luego pulsar sobre el botón ASISTENTE PARA FUNCIONES. 4

Esto generará una ventana donde se encuentran todas las funcones dsponbles en Excel. Localcemos nuestra funcón y pulsemos en el botón Aceptar. La funcón CONTAR.SI requere de dos parámetros: El rango, equvalente a los datos ncales. El crtero, hacendo alusón al valor que se desea contar 5

Pulsemos en el botón desgnado para el Rango, el cual reduce la ventana de la funcón. Luego con ayuda del Mouse, selecconamos los datos ncales del ejemplo (B:H11): Pulsemos la tecla Enter o en el botón para regresar a la ventana de la funcón. Luego segumos los msmos pasos para el parámetro Crtero, tenendo en cuenta que solo selecconaremos el color que deseamos contar dentro de los datos ncales (el Azul): 6

Nos valdremos de la celda B13 en nuestra tabla de frecuenca donde se encuentran el lstado de los colores: Regresamos a la ventana de la funcón y pulsamos en el botón Aceptar: 7

Debe aparecer el valor 1, ndcando que exsten 1 acertos en los datos ncales. Para calcular la frecuenca del color Rojo debemos segur los msmos pasos que para el color Azul. Para ahorrarnos este trabajo, Excel tene la opcón de arrastrar fórmulas a otras celdas. En nuestro caso arrastraríamos la fórmula a las celdas C15, C16, C17 y C18. Para que esto tenga efecto debemos ajustar la fórmula ncal: El rango B:H11 marca los datos ncales, mentras que la celda B14 ndca el color que se va a contar. La celda B14 debe varar para poder asgnar los otros colores, mentras que el rango de datos ncales se debe mantener fjo (los datos ncales serán sempre los msmos). Ubquemos el cursor en la Barra de Fórmulas al comenzo de la celda B y pulsemos la tecla F4; de gual horma hacemos esto para la celda H11. El resultado debería verse como sgue: Lo que hcmos se conoce como Referenca Fja de Celda y permte que a la hora de arrastrar la fórmula, las celdas fjadas no varíen. Para arrastrar la celda debemos ubcar el Mouse en la esquna nferor derecha de la celda C14 hasta que el puntero cambe a una cruz negra delgada. Justo en ese momento, pulsaremos el botón zquerdo del Mouse y arrastramos haca la celda C18: El resultado fnal debería verse como sgue: 8

Recordemos que la sumatora de las Frecuencas Absolutas equvale al tamaño del conjunto de los datos ncales. Para verfcar esto emplearemos una nueva funcón llamada SUMA. SUMA: Suma todos los números en un rango de celdas Formato: SUMA(número1;número; ) Categoría: Matemátcas y Trgonométrcas Amplemos la tabla de frecuenca para nclur una fla al fnal cuyo encabezado sea Total: En la celda C19, ubquemos la funcón SUMA de la forma explcada en la funcón anteror o pulsando sobre el botón. De forma automátca se selecconará el rango de celdas C14:C18. 9

Pulsemos la tecla ENTER para ver el resultado de la sumatora: La prmera Frecuenca Absoluta Acumulada será gual a la prmera Frecuenca Absoluta (1). En la celda D14 colocaremos el sgno gual y luego pulsaremos sobre la celda C14 para trasladar su valor (recuerde pulsar la tecla Enter): La Frecuenca Absoluta Acumulada para el color Rojo (D15) equvale a la Frecuenca Absoluta Acumulada del color Azul (D14) más la Frecuenca Absoluta del color Rojo (C15). En Excel se vería como sgue: 30

Para calcular el resto de Frecuencas, arrastraremos la fórmula que esta en D15 hasta la celda D18. El resultado fnal se muestra a contnuacón: Para calcular las Frecuencas Relatvas (h) tomaremos cada Frecuenca Absoluta y la dvdremos sobre el total de datos (C19). Nótese que para poder arrastrar la fórmula debemos fjar prmero la celda C19 (el total no varía). El calculo de la Frecuenca Relatva Acumulada (H) lo haremos de forma smlar que el calculo de la Frecuenca Absoluta Acumulada (F). La tabla fnal de frecuenca es (se cambaron los formatos): 31

. CONSTRUCCIÓN Y CARACTERÍSTICAS DE LAS TABLAS TIPO B Este tpo de tablas suelen ser utlzadas cuando el número de resultados posbles que puede obtener una varable son tan amplos, que una Tabla Tpo A haría muy poco en resumrlos (estos datos representan un rango muy amplo). Debdo a esta cantdad de valores, será necesaro agruparlos medante ntervalos (la estadístca los llama Intervalos de Clases ). Por ejemplo, en el caso de contar con una valoracón del 1 al 100 (un rango equvalente a 99), una tabla de frecuenca Tpo A se encargaría de buscar cuantas veces se repte cada uno de los 99 posbles resultados en un conjunto de datos, tenendo una funcón contrara a la de resumr los datos. Agrupar los valores de la varable en ntervalos podría smplfcar estas fuentes de datos. Por ejemplo, podríamos hablar de las frecuencas para los valores comprenddos entre 0-0, 0-40, 40-60, 60-80 y 80-100. En el ntervalo 0-0 (que de ahora en adelante le llamaremos ntervalo de clase), se sumaran las frecuencas de los datos cuyos resultados estén entre 0 y 0. Intervalo de clase: Intervalos empleados en las Tablas de Frecuencas Estadístcas, capaz de contener dversas meddas de una varable. Consta de un límte nferor (Lm) y un límte superor (Ls). Otro punto mportante que el estadsta debe defnr, es la cantdad de ntervalos de clase que empleará en la tabla de frecuenca. Esta cantdad de ntervalos no deberían ser muchos, debdo a que no se cumplría el objetvo de resumr la nformacón, y no tan pocos ntervalos, ya que se perdería mucha nformacón. No exste una formula, n unos prncpos úncos para establecer el numero de ntervalos. Para nuestro lbro, optaremos por manejar un número de ntervalos convenentes entre 5 y 15. Algunos autores han propuestos formulas que permten ayudar en la tarea de consegur el numero deal de ntervalos. Numero de ntervalos (Nc): Cantdad de ntervalos con los cuales se compone una tabla de frecuenca. La prmera, la más conocda, establece el número de ntervalos al obtener la raíz cuadrada del total de elementos consderados en el estudo. 3

Nc = n Cuando se trabajan con muestras mayores a 5, la formula obtene un Nc superor a 15, por tanto, recomendaremos para estos casos la sguente formula: 1+ 3,log n S en ambas formulas obtenemos un Nc mayor a 15, smplemente tomaremos 15 ntervalos. El estadsta podrá omtr los resultados de las formulas y consegurá selecconar el numero de ntervalos que crea son los mas adecuados, de acuerdo al objeto del estudo o las característcas que desea mostrar de la varable. Cada ntervalo posee un número máxmo de resultados que puede agrupar. A este valor lo conoceremos como el Ancho del Intervalo de Clase (A). Ancho del ntervalo de Clase (A): Equvale a la dferenca entre el Lmte superor (Ls) y el Lmte nferor (Lm) de cada ntervalo. Matemátcamente se expresa: A = L s L m Su cálculo resulta de la dvsón del Rango (R) entre el Número de Intervalos (Nc) A = R / Hay que aclarar, que el ancho puede varar entre los ntervalos, pero por razones estétcas, comprensón y para facltar el análss, se recomenda manejar un ancho común. Nc A contnuacón expondremos un ejemplo completo de tablas tpo B...1 Ejemplo 1: tablas de frecuenca tpo B Un sondeo realzado en la Unversdad de Cartagena sobre 30 alumnos del sexto semestre de Admnstracón Industral, pretende mostrar que edad es la más representatva. En el caso de que hablemos de la poblacón, reemplazaremos n por N. 33

Las edades de los alumnos fueron: 17 17 19 19 31 1 18 7 1 4 19 5 4 4 3 0 9 1 19 1 1 0 0 19 19 3 0 1 Elabore una tabla de frecuenca que resuma los resultados. SOLUCIÓN Antes de elaborar la tabla de frecuenca, debemos defnr cual de los dos tpos propuestos es el que mejor se adapta (Tpo A y Tpo B). S resummos los datos en una tabla tpo A, tendríamos una tabla muy extensa, en la cuales algunas frecuencas de las edades seran 0. Esto se debe a que el rango manejado es muy amplo (R = 31-17 = 14). Edad f 17 18 1 19 6 0 4 1 6,,, 31 1 Total 30 En el caso de que queramos agrupar aun más estos datos, trabajaríamos con el concepto de ntervalos de clase (Tabla Tpo B). PASO 1: Determnar el numero de ntervalos (Nc). Optaremos por utlzar la prmera formula expuesta: Nc = Nc = n 30 = 5,477 6 Intervalos Se debe sempre aproxmar el número de ntervalos al entero más próxmo, recordando que este valor no será menor a 5, n un valor mayor a 15. Nuestra tabla estará consttuda por ses ntervalos. 34

Paso : Determnar el ancho de cada ntervalo. Antes de hallar el ancho de los ntervalos de clase, debemos calcular el rango (R) como prmera medda. R = 14 Con el Rango y el número de ntervalos, podremos hallar el ancho: A R = Nc A = 14 = 6,333 El ancho se debe ajustar para trabajar con el msmo número de decmales que en el conjunto de datos tratados. Como los datos son valores enteros (varable dscreta), aproxmamos al entero superor. A 3 El ajuste del Ancho no podrá ser menor al valor obtendo ncalmente. Paso 3: Determnar el nuevo Rango (R ). En el momento de realzar el ajuste del ancho del ntervalo, el rango se ncrementa automátcamente. Este Nuevo Rango lo denotaremos como R : R '= A x Nc R ' = 3 x 6 = 18 Nuevo Rango (R ): Rango que es convendo por el Ancho de los ntervalos a los decmales que son manejados en los datos objeto del estudo. Su calculo se realza multplcando el Ancho ajustado por el Número de Intervalos: R '= A x Nc El rango se ncremento en cuatro años. El ncremento se le sumará al valor Máxmo (Xmax ) o restará al valor Mínmo (Xmn ). En este caso optaremos por aumentar el valor Máxmo y reducr el valor Mínmo en dos. Incremento = R ' R = 18 14 = 4 X ' = 31+ = 33 X max mn ' = 17 = 15 El alumno podrá repartr el ncremento de la forma que crea más convenente. 35

Este procedmento permte encontrar los valores máxmos y mínmos cuya resta sea gual al nuevo Rango (R ) R' = X max ' X mn ' = 18 Paso 4: Determnar los ntervalos de clases ncales. Con los valores máxmos y mínmos, y el ancho, podremos armar cada ntervalo de clase. El prmer ntervalo parte del valor mínmo, al cual le agregamos el ancho. N Lm Ls 1 15 18 El segundo ntervalo parte del límte superor del ntervalo anteror. N Lm Ls 1 15 18 18 1 Segumos realzando este proceso hasta alcanzar el valor máxmo: N Lm Ls 1 15 18 18 1 3 1 4 4 4 7 5 7 30 6 30 33 Esta prmera dstrbucón presenta algunos nconvenentes al momento de repartr las frecuencas a cada ntervalo de clase, por ejemplo, exsten 6 personas del total de encuestados que tenen una edad de 1 años, los cuales podrían ser clasfcados en el ntervalo dos o en el tres. N Lm Ls 18 1 3 1 4 Este caso se le conoce como el Problema de la Ambgüedad, y el cual debe ser soluconado antes de termnar la tabla de frecuenca tpo B. 36

.. El Problema de la Ambgüedad en las Tablas de Frecuenca Tpo B Propondremos dos solucones dferentes para resolver el problema de la ambgüedad....1 Prmera Solucón Se trabajan con ntervalos cuyos límtes Superores e Inferores tendrán un decmal adconal sobre el número de decmales manejados en los datos. Por ejemplo, s el Lmte Superor del prmer ntervalo es 1 y los datos trabajados son valores enteros, el nuevo límte superor será 1,1. S los datos trabajan con un decmal, el nuevo Lmte Superor sería 1,01. El prmer límte Inferor (Valor Mínmo) y el últmo límte Superor (Valor Máxmo) se mantendrán sn modfcacón. El problema quedaría soluconado de la sguente manera: N Lm Ls 18.1 1.1 3 1.1 4.1 Las ses personas que tenen 1 años quedarían regstradas en el ntervalo número.... Segunda Solucón Se converten los Lmtes Superor e Inferor en Límtes Abertos y Cerrados. Se consdera como Límte Aberto aquel que admte un número superor, más no gual, al valor ndcado. El Límte Cerrado puede admtrse así msmo. Los límtes que son abertos se dentfcan con el Paréntess y los Límtes Cerrados con el Corchete. La solucón a nuestro problema quedaría: N Lm Ls ( 18 1 ] 3 ( 1 4 ] 37

El valor 1 se ubca en el ntervalo dos. Otra forma de colocar los ntervalos es: N Lm Ls [ 18 1 ) 3 [ 1 4 ) El valor 1 se ubca ahora en el ntervalo número tres. Contnuando con el ejemplo anteror: Paso 5: Determnar los ntervalos de clases reales. N Lm Ls 1 15,0 18,1 18,1 1,1 3 1,1 4,1 4 4,1 7,1 5 7,1 30,1 6 30,1 33,0 Paso 6: Determnar las frecuencas absolutas, frecuencas relatvas y marcas de clases. Un valor representatvo de los ntervalos en las tablas de frecuenca son las Marcas de Clase. Marcas de Clase (Mc): Se defne como el punto medo de un ntervalo de clase. Mc L s + L m Las marcas de clase son muy utlzadas en algunas gráfcas estadístcas y en cálculos que serán vstos posterormente. N Lm Ls F F H H MC 1 15,0 18,1 3 3 0,10 0,10 16,6 18,1 1,1 16 19 0,53 0,63 19,6 3 1,1 4,1 7 6 0,3 0,87,6 4 4,1 7,1 8 0,07 0,93 5,6 5 7,1 30,1 1 9 0,03 0,97 8,6 6 30,1 33,0 1 30 0,03 1,00 31,6 Total 30 1,00 = 38

..3 Ejemplo : tablas de frecuenca tpo B Crear una tabla tpo B que resuma los sguentes datos: 96,65 118,94 353,18 831,5 170,7 136,76 546,56 949,14 717,34 189,10 6,96 888,39 376,43 97,94 7,06 897,99 510,13 774,0 358,48 835,14 146,19 99,4 7,36 56,06 718,43 869,57 51,83 473,74 53,90 85,44 859,76 950,77 74,90 43,41 558,50 965,75 705,55 461,15 167,49 174,51 919,39 784,01 73,16 673,45 137,8 490,94 87,95 763,3 731,09 35,69 97,49 43,07 4,61 89,01 Paso 1: Determnar el número de ntervalos (Nc). Aplcamos la prmera fórmula para determnar el número de ntervalos de clase. Nc = Nc = n 54 = 7,348 8 Intervalos Paso : Determnar el ancho de cada ntervalo. Se determna el rango como prmera medda. X mzx = 99,4 X = 7,06 mn R = 99,4 7,06 = 90, 36 Con el Rango y el número de ntervalos, podremos hallar el ancho: A R = Nc 90,36 = 8 A = 115,045 El ancho se debe ajustar para trabajar con el msmo número de decmales que en el conjunto de datos tratados. A 115,05 39

Paso 3: Determnar el nuevo Rango (R ). Como el ancho fue ajustado, se procede a hallar el nuevo rango (R ). R '= A x Nc R' = 115,05 x 8 = 90,40 El ncremento entre el nuevo rango (R ) y el rango ncal (R), se reparte entre el valor mínmo y el valor máxmo Incremento = R' R = 90,40 90,36 = 0,04 X ' = 99,4 + 0,0 = 99,44 X max mn ' = 7,06 0,0 = 7,04 Paso 4: Determnar los ntervalos de clases ncales. N Lm Ls 1 7,04 187,09 187,09 30,14 3 30,14 417,19 4 417,19 53,4 5 53,4 647,9 6 647,9 76,34 7 76,34 877,39 8 877,39 99,44 Paso 5: Determnar los ntervalos de clases reales. N Lm Ls 1 7,040 187,091 187,091 30,141 3 30,141 417,191 4 417,191 53,41 5 53,41 647,91 6 647,91 76,341 7 76,341 877,391 8 877,391 99,440 40

Paso 6: Determnar las frecuencas absolutas, frecuencas relatvas y marcas de clases. N Lm Ls f F h H MC 1 7,040 187,091 14 14 0,6 0,6 19,57 187,091 30,141 7 1 0,13 0,39 44,6 3 30,141 417,191 3 4 0,06 0,44 359,67 4 417,191 53,41 4 8 0,07 0,5 474,7 5 53,41 647,91 30 0,04 0,56 589,77 6 647,91 76,341 7 37 0,13 0,69 704,8 7 76,341 877,391 9 46 0,17 0,85 819,87 8 877,391 99,440 8 54 0,15 1,00 934,9 Total 54 1,00..4 Característcas de las tablas tpo B - El número de posbles valores que toma la varable es elevado. (Rango grande). - Se utlza para el tratamento de varables cuanttatvas (dscretas y contnuas). - Su construccón es más compleja que en las tablas tpo A. - La nterpretacón equvale a especfcar la frecuenca de cada ntervalo de clase. - Presenta un componente adconal: las marcas de clase...4 Construccón de las tablas tpo B en Excel Desarrollemos los ses pasos para la construccón de tablas tpo B en Excel a partr del sguente conjunto de datos (dgítelos a partr de la celda B): 30 3 17 8 79 0 5 8 69 1 7 4 76 9 47 11 67 60 4 39 71 19 7 64 8 56 41 70 4 44 4 6 65 30 76 3 8 78 6 78 79 1 13 9 64 16 37 3 Paso 1: Determnar el número de ntervalos (Nc). El número de ntervalos depende del tamaño de la muestra o poblacón de datos. Para obtener esta nformacón utlzaremos una nueva funcón llamada CONTAR: 41

CONTAR: Cuenta un conjunto de celdas que posean números en su contendo Formato: CONTAR(ref1;ref; ) Categoría: Estadístcas Para aplcar la fórmula, prmero creemos una tabla resumen a partr de la celda B10, que empece por la cantdad de datos (n) y el número de ntervalos En la celda C10, ngresamos la funcón CONTAR: En Ref1, selecconaremos el rango de celdas equvalentes a la totaldad de los datos: 4

Al pulsar Enter y luego el botón Aceptar, tendremos como resultado el conteo de las celdas que tenen números (49 datos en total). Aplcando la fórmula: Nc = n Obtendremos un número de ntervalos. La raíz cuadrada se consgue con la fórmula RAIZ: RAIZ: Calcula la raíz cuadrada de un número. Formato: RAIZ(número) Categoría: Matemátcas y Trgonométrcas Ubquémonos en la celda C11 y actvemos esta funcón. El parámetro número corresponde a la celda C10, cuyo valor es 49: 43

Al pulsar en Aceptar tendremos como resultado el valor 7, ndcando que nuestra tabla tendrá 7 ntervalos de clase. Paso : Determnar el ancho de cada ntervalo. Aumentemos nuestra tabla resumen con cuatro nuevas flas: valor mínmo (Xmn), valor máxmo (Xmax), rango (R) y ancho del ntervalo de clase (A): Para determnar el valor mínmo y máxmo utlzaremos las dos sguentes fórmulas: MIN: Localza y muestra el valor mínmo de un conjunto de números. Formato: MIN(número1;número; ) Categoría: Estadístcas MAX: Localza y muestra el valor máxmo de un conjunto de números. Formato: MAX(número1;número; ) Categoría: Estadístcas En la caslla número1 de la funcón MIN, ubcaremos el rango correspondente a los datos del ejercco. Procedemos a hacer lo msmos con la funcón MAX. 44

La tabla resumen debe quedar: El rango se calcula con una smple fórmula dada por la resta de C13 y C1. El ancho equvale a la dvsón del rango (C14) y el número de ntervalos (C11). =C13-C1 =C14/C11 45

Paso 3: Determnar el nuevo Rango (R ). Ajustemos prmero el ancho del ntervalo a 1 (para trabajar con valores enteros) con la sguente funcón: MULTIPLO.SUPERIOR: Redondea un número haca arrba. Formato: MULTIPLO.SUPERIOR(número;cfra_sgnfcatva) Categoría: Matemátcas y Trgonométrcas Con una nueva fla encabezada por A (ndca el ancho ajustado), actvaremos esta funcón. En el parámetro número selecconaremos la celda donde se encuentra el ancho sn ajustar (C15), y en cfra_sgnfcatva (equvale al múltplo al que se desea redondear), el valor de 1. El nuevo rango resulta de la multplcacón entre la celda C16 y C11: 46

Sumaremos la dferenca entre R y R al valor máxmo (para no afectar el valor mínmo): =C1 =C13+(C14-C17) Paso 4 y paso 5: Determnar los ntervalos de clases ncales y reales. Construyamos la tabla de frecuenca para 7 ntervalos de clase: El límte nferor para el prmer ntervalo de clase es 1 (Xmn ), sendo su límte superor 13 (Xmn más el ancho de clase). =C18 =C+C16 47

El límte nferor de las sguentes clases es gual al límte superor de su clase anteror: Podremos arrastrar esta fórmula hasta el últmo ntervalo de clase (C8): Para calcular los límtes superor bastará con arrastrar la fórmula que esta en la celda D, fjando de antemano, la celda C16 que hace referenca al tamaño de la clase: El resultado de los ntervalos ncales es el sguente: 48

El problema de la ambgüedad se corregrá agregando al prmer límte superor un valor de 0,1 y restando al últmo este msmo valor: Paso 6: Determnar las frecuencas absolutas, frecuencas relatvas y marcas de clases. Comencemos con la frecuenca absoluta (f). emplearemos una nueva funcón: Para trabajar con ntervalos FRECUENCIA: Muestra el número de veces que se repte un número.dentro de un rango de celdas. Formato: FRECUENCIA(datos;grupos) Categoría: Estadístcas A partr de la celda E, actvamos la funcón FRECUENCIA mostrando una ventana que pde dos requstos: datos, que equvale al rango de celda donde está los datos ncales y grupos, correspondente en nuestro caso, a los límtes superores de la tabla de frecuenca. Datos 49

Límtes superores Al pulsar en Aceptar, Excel mostrará la frecuenca para el prmer ntervalo de clase: 50

Para el cálculo de las frecuencas restantes deberemos segur los sguentes pasos (dado que es una fórmula matrcal): Ubcados desde la celda E, seleccone las celdas consecutvas hasta C8. Pulse la tecla F. Luego pulse de forma conjunta las teclas Control + Mayúsculas + Enter. Ctrl + + El resultado fnal es: Determne el resto de las frecuencas empleando los msmos pasos vstos para las tablas tpo A. El cálculo de las marcas de clase se hace tomando la suma de los dos límtes dvddo entre dos. La prmera marca de clase es el resultado de: La tabla defntva (con algunos cambos en el formato) es: 51

.3 EJERCICIOS PROPUESTOS.3.1 Realce una tabla de frecuenca que resuma los sguentes datos: 1, 6, 8, 4, 5, 3, 4, 1, 1, 5, 3, 8, 7, 4, 6,, 8, 9, 3, 4, 10,. a. Cuál es el dato que mas se repte? b. Cuál es el dato que menos se repte? c. Cuál es el Rango? d. Qué tpo de tabla sería la más convenente para agrupar estos datos?.3. Crear una tabla de frecuenca que permta agrupar los sguentes datos cualtatvos Rojo Verde Azul Verde Negro Amarllo Azul Rojo Rojo Verde Negro Azul Blanco Negro Verde Rojo Negro Rojo Blanco Azul Rojo Verde Verde Negro.3.3 Un grupo de personas valora la gestón del departamento de servco al clente de un supermercado catalogándolo como: Excelente (E), Bueno (B), Regular (R) o Malo (M). Los resultados obtendos son: E B B R E M B E B R R R M B B E M E R R B B E R R B B E R M E E B E B B R M R E a) Elabore una tabla de frecuenca que permta resumr los datos b) Que porcentaje de personas valoró la Gestón del Departamento como Buena? c) Cuantas personas valoraron la gestón como Excelente y Buena? d) Interprete f3, F3, h3 y H3. 5

.3.4 Agrupe los sguentes datos en una Tabla de Frecuenca 3 1 43 41 19 9 17 33 35 30 5 11 8 40 45 43 3 9 3 9 47 47 31 1.3.5 Agrupe los sguentes datos en una tabla de frecuenca 11,3 14, 1 0,5 9,9 31, 33,7,5 7,6 0,3 9,4 31,4 1 1,1 30 9,9 15,6 3, 43 17,7 7,6,5 41,1 19,1 13,6 47,3 11 15,6 33,3 15,4 38,1 35,3 39,8 30 15.3.6 Los sguentes datos representan el dámetro nterno en cm. de 30 tubos para acueducto tomados como muestra dentro de un programa de caldad estatal. 14,1 14, 13,9 14,7 1,9 15 14,1 14,5 14,9 13,6 14,5 14 15,1 14,7 13,8 14, 14, 14,7 13,9 13 14,6 14,1 14 14,8 14,7 15, 13,5 14, 14,8 14,5 a) Elabore una tabla de frecuenca que agrupe los datos. Justfque la eleccón del Tpo de Tabla usada. b) Interprete F, F4 - F, F4 - f3, f3 + f. c) Interprete h1 + h, H3 - H, H3 - h.3.7 Elabore una tabla de frecuenca que agrupe los sguentes datos. 00,3 145,81 178,15 133,9 149,11 11,64 176,59 14,45 194,58 144,3 157,1 174,38 11,04 193, 139,45 01,55 174,73 147,83 30,99 1,71 53

.3.8 A contnuacón se muestran los ngresos regstrados en 50 famlas selecconadas al azar de estrato 3 en una mportante cudad: $ 58.400,00 $ 841.10,00 $ 458.88,00 $ 535.11,00 $ 83.47,00 $ 433.79,00 $ 413.914,00 $ 485.95,00 $ 463.710,00 $ 848.607,00 $ 417.08,00 $ 550.409,00 $ 91.93,00 $ 538.597,00 $ 438.579,00 $ 3.878,00 $ 80.678,00 $ 947.18,00 $ 40.334,00 $ 391.814,00 $ 6.441,00 $ 781.633,00 $ 503.314,00 $ 700.010,00 $ 76.1,00 $ 681.517,00 $ 593.656,00 $ 1.135,00 $ 570.688,00 $ 38.734,00 $ 431.97,00 $ 718.487,00 $ 688.648,00 $ 775.13,00 $ 59.40,00 $ 317.555,00 $ 341.04,00 $ 1.147.607,00 $ 303.165,00 $ 716.003,00 $ 696.637,00 $ 96.773,00 $ 380.497,00 $ 647.,00 $ 315.031,00 $ 584.599,00 $ 635.30,00 $ 345.931,00 $ 753.701,00 $ 500.558,00 $ 617.137,00 $ 85.715,00 $ 6.17,00 $ 1.115.43,00 $ 551.668,00 $ 698.338,00 $ 398.000,00 $ 655.30,00 $ 81.100,00 $ 93.31,00 $ 346.031,00 $ 415.560,00 $ 558.60,00 $ 306.300,00 $ 394.019,00 $ 347.485,00 $ 341.103,00 $ 400.496,00 $ 469.799,00 $ 773.411,00 $ 357.441,00 $ 19.019,00 $ 191.01,00 $ 810.474,00 $ 504.75,00 $ 489.05,00 $ 38.48,00 $ 353.89,00 $ 376.616,00 $ 480.314,00 $ 385.656,00 $ 705.757,00 $ 978.98,00 $ 7.38,00 $ 45.318,00 $ 736.707,00 $ 576.18,00 $ 310.504,00 $ 384.916,00 $ 584.196,00 $ 465.540,00 $ 88.898,00 $ 690.47,00 $ 90.84,00 $ 310.504,00 $ 480.314,00 $ 750.317,00 $ 1.115.851,00 $ 88.898,00 $ 7.38,00 Construya una tabla de frecuenca que agrupe los datos en 10 ntervalos de clase..3.9 A partr de la sguente tabla de frecuencas con datos parcales: Nc Lm Ls f F h H 1 (10 14] 10 (14 18] 15 3 (18 ] 31 4 ( 6] 4 5 (6 30] 55 TOTAL a) Calcule las frecuencas faltantes (f, h y H) b) Modfque la tabla de frecuenca para que ncluya los sguentes datos: 14,, 6, 7y 8. 54

.3.10 Debdo a un grave accdente, el gerente de una compañía consultora perdó nformacón de un estudo de mercado que realzó a una mportante compañía a nvel naconal de gaseosas. Solo se conoce algunos datos parcales sobre una entrevsta que se elaboró a 150 personas. Nc Lm Ls f F h H 1 0,0,1 4 4 0,16 0,16,1 4,1 38 6 0,5 0,41 3 4,1 6,1 45 107 0,30 0,71 4 6,1 8,1 16 13 0,11 0,8 5 8,1 10,1 8 131 0,05 0,87 6 10,1 1,1 17 148 0,11 0,99 7 1,1 14,0 150 0,01 1,00 TOTAL 150 1,00 Reconstruya la tabla de frecuenca. Cuantas personas toman menos de 4 gaseosas por semana? Cuantas personas toman al menos 3 gaseosas por semana? 55

.4 CASO: LA GESTIÓN DEL GOBIERNO El alcalde de un pequeño pueblo, el Dr. Fernández, se sente preocupado por certos comentaros que rondan en la calle, en los cuales, lo crtcan de haberse desempeñado mal en el cargo. El asesor de magen cree que estas conjeturas son falsas, y propone al Centro de Planeacón que realce una encuesta sobre algunas famlas (según el DANE, el pueblo cuenta con 1.500 famlas) con el propósto de obtener certa nformacón de la gestón del goberno actual. La encuesta presentada por planeacón fue la sguente: 1. Calfque de 1 a 5 la gestón del goberno muncpal (sendo 1 el menor valor y 5 el máxmo).. Marque con una X. En cuál de las sguentes áreas el goberno presentó la mejor gestón: a. Economía b. Obras cvles c. Servcos Públcos d. Eventos culturales 3. Aprobaría usted la reeleccón del alcalde? S No 4. Cuántos empleos cree usted que generó la Alcaldía muncpal en el perodo actual de mandato? La nformacón recolectada se muestra en la sguente tabla: Tarea El Departamento de planeacón lo contrata a usted para que resuma la anteror nformacón en tablas de frecuencas, e nterprete los resultados sobre las 30 famlas encuestadas. Además, conteste las sguentes preguntas: 1. Que tpo de varables puede dentfcar en la encuesta?. Que tpo de tablas y por que, recomendaría utlzar para el resumen de los datos en cada pregunta? 3. Defna cual es la poblacón, la muestra y el fenómeno estudado por el departamento de planeacón? 56

4. Que puede conclur de los resultados de la encuesta? 5. Cree usted que la encuesta permte resolver todas las dudas sobre la gestón del goberno del pueblo? Sustente. Famla Valoracón Áreas Reeleccón Empleos 1 3 Economía S 150 3 Eventos culturales No 0 3 4 Eventos culturales S 00 4 5 Economía S 350 5 5 Servcos Públcos S 50 6 4 Eventos culturales No 100 7 Economía No 100 8 1 Servcos Públcos No 0 9 5 Obras cvles S 40 10 1 Economía No 5 11 3 Eventos culturales No 100 1 4 Servcos Públcos No 0 13 5 Economía S 50 14 5 Servcos Públcos S 450 15 4 Economía S 100 16 3 Servcos Públcos No 0 17 5 Eventos culturales S 150 18 5 Economía S 50 19 3 Eventos culturales No 0 0 4 Servcos Públcos S 300 1 Economía No 10 Obras cvles No 10 3 5 Eventos culturales S 410 4 1 Eventos culturales No 50 5 Eventos culturales No 0 6 5 Economía S 150 7 4 Eventos culturales S 0 8 4 Eventos culturales S 300 9 5 Economía S 400 30 3 Eventos culturales No 50 57

.5 CUESTIONARIO DE REPASO Seleccón Múltple con Únca Respuesta: Marque con una X la respuesta correcta. 1. Las Tablas de Frecuenca Tpo A se caracterzan por: A. Trabajan solo con datos cualtatvos. B. Agrupan datos cuyo Rango es bajo. C. Agrupan datos cuyo Rango es alto. D. Presentan más ntervalos que en las Tablas Tpo B.. Las frecuencas relatvas se dferencan de las frecuencas absolutas porque: A. Las frecuencas relatvas se establecen de acuerdo a una base. B. Las frecuencas relatvas se expresan como porcentaje. C. La suma de las frecuencas relatvas es gual a 1. D. La A y B. 3. En una tabla de frecuenca, F4 - F es lo msmo que: A. F4 - f3 B. F + f3 C. F3 D. f3 + f4 4. En una tabla de frecuenca, h3 + H es lo msmo que: A. H3 B. H4 C. h3 D. h3 - h4 5. En el proceso de elaboracón de las Tablas Tpo B, suele determnarse un nuevo Rango (R') para luego hacer los ntervalos de clase. Cuando es necesaro hallar R'? A. Cuando se desea agregar nuevos ntervalos. B. En el momento en que aproxmamos el Ancho de los Intervalos. C. Cuando se aumenta el tamaño de la muestra. D. Nnguna de las anterores. 58

CAPITULO 3 GRÁFICOS ESTADÍSTICOS Este captulo lo dedcaremos al estudo de los gráfcos estadístcos más usados que parten de resúmenes o tablas de frecuencas. La ventaja de los gráfcos con respecto a las tablas estudadas en el captulo anteror, es que permte una fácl nterpretacón y análss de los datos, al mostrar las frecuencas medante símbolos, barras, polígonos y sectores. 59

3. GRÁFICOS ESTADÍSTICOS Gráfcos Estadístcos: Son representacones vsuales que emplean símbolos, barras, polígonos y sectores, de los datos contendos en tablas de frecuencas. Trataremos sete tpos de gráfcos estadístcos: Gráfco de sectores Gráfcos de columnas Hstograma Polígonos de frecuencas Curvas suavzadas o curvas de frecuencas Ojvas Pctogramas 3.1 GRÁFICOS DE SECTORES Este tpo de dagramas consderan una fgura geométrca en que la dstrbucón de frecuencas se reparte dentro de la fgura como puede ser una dona, pastel, círculo o anllo, en el que cada porcón dentro de la fgura representa la nformacón porcentual del total de datos. 3.1.1 Ejemplo de gráfcos de sectores Realzar un dagrama de sectores a partr de la sguente tabla de frecuenca que resume las preferencas de un grupo de encuestados haca cnco canddatos a eleccones locales: SOLUCIÓN Clase Frecuenca Canddato 1 5 Canddato 30 Canddato 3 45 Canddato 4 0 Canddato 5 0 Total 140 Para crear un gráfco de sectores, hay que tener en cuenta los sguentes pasos: 60

PASO 1: Determnar las frecuencas relatvas para cada clase. Clase f h Canddato 1 5 0,1786 Canddato 30 0,14 Canddato 3 45 0,314 Canddato 4 0 0,149 Canddato 5 0 0,149 Total 140 1,0000 PASO : Determnar los ángulos que representan las porcones dentro de la fgura para cada clase. Un círculo esta formado por un ángulo de 360º. La porcón correspondente al Canddato 1 equvale a un 17,86% de esos 360º, es decr, 64,96º. Gráfcamente tendríamos (se parte desde el eje vertcal superor, y se comenza a grafcar cada clase en sentdo de las manecllas del reloj): 64,96º La tabla fnal con los ángulos repartdos para cada clase quedaría: Clase f h Ángulo Canddato 1 5 0,1786 64,96º Canddato 30 0,14 77,11º Canddato 3 45 0,314 115,704º Canddato 4 0 0,149 51,444º Canddato 5 0 0,149 51,444º Total 140 1,0000 360º 61

El gráfco defntvo se muestra a contnuacón (nótese que cada sector se dentfca con un color dferente): Canddato 5 14% Canddato 1 18% Canddato 4 14% Canddato 1% Canddato 3 33% 3.1. Característcas de los gráfcos de sectores - No muestran frecuencas acumuladas. - Se prefere para el tratamento de datos cualtatvos o cuascualtatvos. - La mayor área (o porcón de la fgura) representa la mayor frecuenca. - Son muy fácles de elaborar. - Suelen utlzarse para representar tablas tpo A. - La fgura completa equvale al 100% de los datos (360º). 3.1.3 Construccón de los gráfcos de sectores en Excel Vamos a explcar la creacón de gráfco de sectores a partr del ejemplo anteror. Los prmero es trasladar la tabla de datos (a partr de la celda B) en una hoja vacía: Utlce la funcón SUMA para calcular los totales 6

En el caso de Excel, solo es necesaro trabajar con una sola frecuenca. Ubquémoslos en una celda fuera de la tabla que acabamos de crear y pulsemos el botón de Asstentes para Gráfcos o elja la opcón Gráfco en el menú Insertar. El asstente cuenta de cuatro pasos sencllos para la creacón de varos tpos de gráfcos Aparecerá una nueva ventana con dferentes tpos de gráfcos. Selecconemos el correspondente al gráfco de sectores (Crcular en Excel). En el tenemos la opcón de 6 gráfcos de sectores. Para observar esta msma ventana en Mcrosoft Excel 007 deberá stuarse en la fcha INSERTAR y pulsar sobre el botón GRÁFICOS, luego pulsar el botón que amplía la ventana. 63

Se seleccona el tpo de gráfco CIRCULAR. Al pulsar en el botón SIGUIENTE, pasaremos al pasos dos del asstente, en donde especfcaremos los datos de orgen para crear el gráfco. Pulsemos el botón AGREGAR que se encuentra en la fcha SERIE: 64

Este botón permte ntroducr dstntas seres de datos (provenentes de dstntas tablas de frecuencas, varables o poblacones). Excel pde tres campos para construr el gráfco: - Nombre: Título o encabezado del gráfco. - Valores: Las frecuencas que están en la tabla (puede ser relatva o absoluta, ambas no acumuladas). - Rótulos del eje de categorías (X): Representa las clases de la tabla de frecuencas. Este formato se ncluye en la versón 007 en la opcón EDITAR DATOS DE ORIGEN ( Edt Data Source ). Equvale a valores Equvale a los rótulos del eje de categoría (X) En el título escrbamos Gráfco de Sectores. En valores señalemos las frecuencas absolutas (f): Rango de frecuencas absolutas 65

En la caslla rótulos del eje de categoría corresponde al rango de las celdas que muestran las clases: Rango de Clases En MS Excel 007 la ventana para ntroducr los datos de orgen debe quedar como sgue: Pulse nuevamente sguente para drgrnos al tercer paso del asstente. En el podremos edtar tres fchas: Títulos, Leyendas y Rótulos de datos. En la fcha 66

Leyenda (ntermeda) desactvemos la caslla Mostrar Leyenda para amplar un poco el gráfco (es opconal). En la fcha Rótulos de datos actvaremos Nombre de la categoría y Porcentajes Vsta prelmnar del gráfco Mcrosoft Excel 007 permte edtar las opcones del gráfco drectamente sobre el gráfco a partr de un DISEÑO RÁPIDO selecconado. 67

Por últmo (paso 4), esta la opcón de vsualzacón (este paso se aplca en la versón 007 al presonar sobre el botón MOVER GRÁFICO): - En una hoja nueva: El gráfco aparece en una nueva hoja, abarcando todo el espaco. - Como objeto en: Se crea el gráfco como un objeto edtable en una hoja exstente. Optemos por actvar en una hoja nueva, modfcando el nombre de la hoja por Gráfco de Sectores y luego pulse en el botón Fnalzar. Hoja nueva 68

Podrá edtar el gráfco en cualquer momento, modfcando los datos de orgen, formatos y tpo: Gráfco de Sectores Canddato 5 14% Canddato 1 18% Canddato 4 14% Canddato 1% Canddato 3 33% 3. GRÁFICOS DE COLUMNAS Los gráfcos de barras representan las frecuencas medante columnas (o barras), a través de la altura de las msmas en un plano cartesano. 3..1 Ejemplo de gráfcos de columnas Realzar un gráfco de barras a partr de la sguente tabla de frecuenca: Clase Frecuenca A 5 B 11 C 11 D 4 E 15 F 18 G 4 Total 88 69

SOLUCIÓN Para crear un gráfco de barras, seguremos sencllos pasos: PASO 1: Representar las escalas en los ejes horzontal y vertcal del prmer cuadrante de un plano de cartesano. En el eje vertcal colocaremos las frecuencas y en el eje horzontal las clases. Para establecer la escala en eje vertcal, nos guaremos por la frecuenca máxma, sendo ese el punto más elevado. Puede trabajarse tambén con frecuencas relatvas. El plano resultante quedaría: f 4 18 1 6 A B C D E F G PASO : A cada clase se representa con una columna (o barra) cuya altura concuerda con su frecuenca expuesta en el eje vertcal. Para la clase A con frecuenca 5, tenemos: f 4 18 1 6 A B C D E F G 70

El gráfco fnal se muestra a contnuacón: f 4 1 8 1 6 0 A B C D E F G Puede observar que las columnas se encuentran separadas una de otras. Tambén podríamos realzar el gráfco de forma horzontal (conocdo como gráfco de barras): G F E D C B A 0 6 1 1 8 4 3.. Característcas de los gráfcos de columnas - No muestran frecuencas acumuladas. - Se prefere para el tratamento de datos cualtatvos o cuascualtatvos. - La columna (o barra) con mayor altura representa la mayor frecuenca. - Son fácles de elaborar. - Suelen utlzarse para representar tablas tpo A. - La sumatora de las alturas de las columnas equvalen al 100% de los datos. 71

3..3 Construccón de los gráfcos de columnas en Excel En una hoja nueva copamos a partr de la celda B, la tabla de frecuenca del ejemplo anteror y en una celda fuera de la tabla, ncamos el asstente de gráfcos de Excel: En el asstente selecconamos el tpo de gráfco columnas y pulsamos el botón Sguente: 7

En la fcha Sere pulsamos en el botón Agregar (en el caso de que exsta una o varas seres en esta ventana, pulsemos en el botón Qutar hasta elmnar todas las seres). Llenamos los datos Nombre, Valores y Rótulos del eje de categorías, tal cual como se explco en el gráfco de sectores. En la ventana sguente podremos especfcar el nombre del eje vertcal (eje de valores Y) y horzontal (eje de categorías X) en la fcha Títulos. Para amplar el gráfco, desactvemos la Leyenda. Podremos tambén, mostrar los valores de las frecuencas para cada clase en la fcha Rótulos de datos pulsando sobre la opcón valor. 73

Actva y desactva la Leyenda del gráfco Muestra los valores de las frecuencas 74

Para termnar, el últmo paso permte crear el gráfco como objeto en una hoja exstente o en una hoja nueva. Esta vez pulsemos sobre Como objeto en y luego en el botón Fnalzar. El hstograma defntvo (con algunos cambos en el formato y lugar) se muestra a contnuacón: Los msmos pasos se emplean para el gráfco de barras: 75

3.3 HISTOGRAMA Se puede consderar como un gráfco de columnas especal. Se realza sobre el prmer cuadrante del plano cartesano. La dferenca radca en que el hstograma se utlza más a menudo para representar tablas tpo B, donde el ancho de la columna equvale al ancho del ntervalo de clase. Las frecuencas absolutas se colocan en el eje vertcal y tambén puede emplearse las frecuencas relatvas. Otra dferenca mportante es que no exste espaco entre las barras. 3.3.1 Ejemplo de hstogramas Realzar un hstograma a partr de la sguente tabla de frecuenca: Lm Ls Frecuenca MC.0 6.1 1 4.1 6.1 10.1 15 8.1 10.1 14.1 1 1.1 14.1 18.1 4 16.1 18.1.1 1 0.1.1 6.1 1 4.1 6.1 8.0 8 8.1 Total 9 76

SOLUCIÓN Al gual que en gráfco de sectores y el gráfco de columnas, seguremos pasos para la construccón del hstograma. PASO 1: Representar las escalas en los ejes horzontal y vertcal del prmer cuadrante de un plano de cartesano. En el eje vertcal colocaremos las frecuencas y en el eje horzontal las marcas de clases. Para dferencar este paso del anteror, trabajaremos con un ancho de columna únco, y dejaremos la mtad de ese espaco entre el vertcal y la prmera columna, y el fnal del eje horzontal y la últma columna. f 4 18 1 6 4.1 8.1 1.1 16.1 0.1 4.1 8.1 ½ base ½ base PASO : A cada clase se representa con una columna cuya altura concuerda con su frecuenca expuesta en el eje vertcal. Podemos decr que la marca de clase 4.1 es representada por una frecuenca 1: Las barras estarán pegadas una junto a la otra, es decr, ocupando el total del ancho de cada ntervalo de clase dspuesto en el gráfco. 77

f 4 18 1 6 4.1 8.1 1.1 16.1 0.1 4.1 8.1 El gráfco fnal quedaría: f 4 18 1 6 4.1 8.1 1.1 16.1 0.1 4.1 8.1 3.3. Característcas de los hstogramas - No muestran frecuencas acumuladas. - Se prefere para el tratamento de datos cuanttatvos. - La columna (o barra) con mayor altura representa la mayor frecuenca. - Suelen utlzarse para representar tablas tpo B. - La sumatora de las alturas de las columnas equvalen al 100% de los datos. 78

3.3.3 Construccón de hstogramas en Excel Excel no posee un módulo ndependente para la creacón de hstogramas gráfcos. Con unos ajustes podremos adaptar un gráfco de columna en algo muy parecdo a un hstograma, solo que no dejaremos espacos al nco y fn. En una hoja nueva copamos a partr de la celda B, la tabla de frecuenca tpo B del ejemplo anteror y creamos un gráfco de columnas como lo vmos en la seccón anteror: El gráfco se vería como sgue: HISTOGRAMA Frecuenca 30 5 0 15 10 5 0 1 4 1 1 15 1 8 4,1 8,1 1,1 16,1 0,1 4,1 8,1 Marca de Clase Ubcando el puntero del Mouse sobre una de las columnas, pulsamos el botón derecho y en el menú flotante que aparece, se seleccona Formato de seres de datos: 79

En la ventana generada pulsaremos sobre la fcha opcones: Dsmnumos la caslla Ancho de rango a cero para juntar las barras y pulsamos en el botón Aceptar: 80

Frecuenca 30 5 0 15 10 5 0 HISTOGRAMA 4 1 1 15 1 1 8 4,1 8,1 1,1 16,1 0,1 4,1 8,1 Marca de Clase 3.4 POLÍGONOS DE FRECUENCIAS Este gráfco se utlza para el caso de varables cuanttatvas, tanto dscretas como contnuas, partendo del dagrama de columnas, barras o hstograma, según el tpo de tabla de frecuenca manejada. 3.4.1 Ejemplo de polígonos de frecuencas Realzar un polígono de frecuenca a partr de la tabla de frecuenca dada en el ejemplo anteror: Lm Ls Frecuenca MC.0 6.1 1 4.1 6.1 10.1 15 8.1 10.1 14.1 1 1.1 14.1 18.1 4 16.1 18.1.1 1 0.1.1 6.1 1 4.1 6.1 8.0 8 8.1 Total 9 SOLUCIÓN PASO 1: Crear un hstograma (tabla tpo B) o gráfco de columnas (tabla tpo A). 81

f 4 18 1 6 4.1 8.1 1.1 16.1 0.1 4.1 8.1 PASO : Trazar líneas rectas entre los puntos medos de los techos de columnas contguas, partendo desde el punto de orgen (0,0) hasta el punto fnal defndo en el eje horzontal. f 4 18 1 6 4.1 8.1 1.1 16.1 0.1 4.1 8.1 Nuestro polígono de frecuencas sn el hstograma quedaría de la sguente forma: f 4 18 1 6 4.1 8.1 1.1 16.1 0.1 4.1 8.1 8

3.4. Característcas de los polígonos de frecuencas - No muestran frecuencas acumuladas. - Se prefere para el tratamento de datos cuanttatvos. - El punto con mayor altura representa la mayor frecuenca. - Suelen utlzarse para representar tablas tpo B. - El área bajo la curva representa el 100% de los datos. El polígono de frecuenca esta dseñado para mantener la msma área de las columnas. Analcemos una porcón de nuestro gráfco para probar esta afrmacón: f 4 18 1 6 4.1 8.1 1.1 Observe que cada línea corta una porcón de la columna, pero a su vez, agrega una porcón adconal. Ambas porcones son guales (trangulo rectángulos guales), mantenendo el área global en el gráfco. Altura Columna Altura Columna Base Columna Base Columna 83

3.4.3 Construccón de los polígonos de frecuencas en Excel A partr de la construccón de un hstograma en Excel, procedemos a cambar el tpo de gráfco pulsando con el botón derecho del Mouse sobre el gráfco y elgendo la opcón tpo de gráfco. Cambemos el gráfco a líneas y pulsemos el botón Aceptar. Cambemos tambén el ttulo de HISTOGRAMA por POLIGONO DE FRECUENCIA. F recu en ca 3 0 5 0 1 5 1 0 5 0 P O L I G O N O D E F R E C U E N C I A 4 1 1 1 5 1 1 8 4,1 8,1 1,1 1 6,1 0,1 4,1 8,1 M a r c a d e C la s e 84

3.5 CURVAS SUAVIZADAS O CURVAS DE FRECUENCIAS Son gráfcos representados por una sola línea curva (el polígono de frecuenca esta conformado por varas líneas rectas consecutvas). 3.5.1 Construccón de las curvas suavzadas en Excel Sobre el gráfco anteror, pulsemos el botón derecho del Mouse y en la opcón Tpo de gráfco. En la ventana selecconamos la fcha Tpos personalzados y elegmos línea suavzada. Elmnemos la leyenda que aparece para amplar el gráfco y cambamos el título a LÍNEA SUAVIZADA. 30 5 0 15 10 5 0 4,1 8,1 1,1 16,1 0,1 4,1 8,1 85

3.5. Característcas de las curvas suavzadas - No muestran frecuencas acumuladas. - Se prefere para el tratamento de datos cuanttatvos. - El punto con mayor altura representa la mayor frecuenca. - Suelen utlzarse para representar tablas tpo B. - Son más complcadas de elaborar que los gráfcos anterores. - El área bajo la curva representa el 100% de los datos. 3.6 OJIVAS En este gráfco se emplea un polígono de frecuenca o curva suavzada con una característca muy partcular: muestra las frecuencas absolutas o relatvas acumuladas. 3.6.1 Ejemplo de ojvas Los ngresos de 50 trabajadores de una empresa se resumen en la sguente tabla de frecuenca: N Lm Ls f F h H MC 1 [ 100000 150000 ) 3 3 6,00% 6,00% 15000 [ 150000 00000 ) 5 4,00% 10,00% 175000 3 [ 00000 50000 ) 5 10 10,00% 0,00% 5000 4 [ 50000 300000 ) 10 0 0,00% 40,00% 75000 5 [ 300000 350000 ) 4 4 8,00% 48,00% 35000 6 [ 350000 400000 ) 15 39 30,00% 78,00% 375000 7 [ 400000 450000 ] 11 50,00% 100,00% 45000 Total 50 100,00% SOLUCIÓN PASO 1: En un plano cartesano (prmer cuadrante), procedemos a establecer la escala de ambos ejes: En el eje vertcal se colocaran las frecuencas, partendo desde 0 hasta la últma frecuenca acumulada (absoluta o relatva). En el eje horzontal se ubcaran los límtes superores, partendo desde el prmer límte menor. 86

F 50.0 37.5 5.0 1.5 100 150 00 50 300 350 400 450 Ls PASO : A cada límte superor le corresponde su frecuenca acumulada. El punto ncal será 0 (no exsten datos por debajo de 100). Por ejemplo: Hasta un valor cercano a 150.000 exsten acumulado 3 datos. Hasta un valor cercano a 00.000 exsten acumulado 5 datos. Gráfcamente tenemos: F 50.0 37.5 5.0 1.5 100 150 00 50 300 350 400 450 Ls Podremos cambar la escala del eje vertcal para que trabaje con las frecuencas relatvas acumuladas sn afectar el gráfco: 87

H 100.0% 75.0% 50.0% 5.0% 3.6. Característcas de las ojvas 100 150 00 50 300 350 400 450 Ls - Muestran frecuencas acumuladas. - Se prefere para el tratamento de datos cuanttatvos. - El punto de nco equvale a una frecuenca de 0. - Suelen utlzarse para representar tablas tpo B. - El punto fnal equvale al 100% de los datos. 3.6.3 Interpretando la nformacón en las ojvas Dada su ventaja de representar frecuencas acumuladas, las ojvas se converten en una herramenta vtal para el análss estadístco. Partendo de la nformacón del ejemplo, se desea conocer que porcentaje de los trabajadores ganan más $5.000. Para conocer esta nformacón, debemos ubcar prmero el valor de $5.000 en el gráfco y luego, proyectar este punto en el eje vertcal: H 100.0% Porcentaje de empleados que ganan más de $5.000 75.0% 50.0% 5.0% 100 150 00 50 300 350 400 450 Ls Ingresos mayores a $5.000 88

La proporcón de empleados equvale a aproxmadamente a un 80%. El nconvenente de este método es que los cálculos se harán gráfcamente (valores aproxmados) y no de forma artmétca (valores exactos). 3.6.4 Construccón de ojvas en Excel A contnuacón construremos una ojva, empleando la tabla de frecuenca vsta en el ejemplo. Modfcaremos los límtes superore e nferores para poder trabajar en Excel: Antes del ncar el asstente de gráfcos, debemos ndcar que para un valor menor a $100.000, no exsten datos: En el asstente seleconamos el tpo de gráfco XY dspersón, optando por un gráfco por líneas rectas: 89

En la ventana sguente agregamos el nombre OJIVA, y procedemos a asgnar los valores para el eje horzontal (X) y eje vertcal (Y). Habíamos recalcado que la ojva comenza con el prmer límte nferor, por tanto, debemos pulsar sobre la celda C1 equvalente a los $100.000. Sguen los límtes superores, que se selecconaran mantenendo la tecla Ctrl pulsada: Ctrl + De gual forma aplcaremos la msma operacón a los datos lgados al eje horzontal. La ventana Datos de orgen quedaría: 90

En la tercera ventana agregamos nformacón adconal al gráfco y desactvar o actvar la leyenda: 91

La gráfca resultante debería quedar como sgue (con algunos ajustes en el formato): OJIVA 60 50 40 F 30 0 10 0 0,0 100000,0 00000,0 300000,0 400000,0 500000,0 Límtes Superores Corrjamos la escala del eje horzontal para que empece con $100.000. Esto se realza pulsando sobre la escala con el botón derecho del Mouse y marcando la opcón Formato de ejes. 9

En la fcha Escala realzamos los sguentes cambos: Valor ncal Últmo límte superor Undad de vsualzacón de valores La escala modfcada se mostrará así: OJIVA 60 50 40 F 30 0 10 0 100000,0 150000,0 00000,0 50000,0 300000,0 350000,0 400000,0 450000,0 Límtes Superores 93

Modfcamos tambén el valor máxmo del eje vertcal para que termne en 50. OJIVA 50 40 30 F 0 10 0 100000,0 150000,0 00000,0 50000,0 300000,0 350000,0 400000,0 450000,0 Límtes Superores 3.7 PICTOGRAMAS Los pctogramas utlzan símbolos para representar un conjunto de datos. La mayor frecuenca se dentfca por la mayor acumulacón de símbolos. Los pctogramas se emplean sobre todo, para hacer más amgables e entendbles los nformes estadístcos. 3.7.1 Ejemplo de pctogramas La demanda anual de un tpo partcular de vehículos en algunos países de Suramérca se muestra a contnuacón: País Demanda Colomba 0.000 Venezuela 40.000 Argentna 10.000 Chle 150.000 Brasl 160.000 94

Realzar un pctograma para la tabla anteror. SOLUCIÓN El símbolo que emplearemos tendrá forma de vehículo, asendo referenca al tema del nforme. Cada símbolo tendrá una equvalenca de 0.000 undades demandadas. 0.000 undades En un eje cartesano colocamos los países en el eje vertcal y las demandas en el horzontal. Colomba Venezuela Argentna Chle Brasl En el caso de Chle, la demanda equvale a 7 y ½ vehículos (140.000 + 10.000 undades). Este tpo de pctogramas tene forma a un gráfco de barras. 3.7. Característcas de los pctogramas - Su formato es lbre. - Emplean una secuenca de símbolos para representar frecuencas. - Se emplean para el tratamento de datos tanto cualtatvos como cuanttatvos. 95

3.8 EJERCICIOS PROPUESTOS 3.8.1 Realce un gráfco de sectores a la tabla de frecuenca que aparece en el ejercco.3.. 3.8. Realce un gráfco de columnas a la tabla de frecuenca que aparece en el ejercco.3.3. 3.8.3 Realce un hstograma a la tabla de frecuenca que aparece en el ejercco.3.5. 3.8.4 Una muestra de 100 estudantes del programa de ngenería de una unversdad, mostraron sus preferencas respecto a la creacón de un nuevo laboratoro en una encuesta para el daro estudantl: Tpo de laboratoro Número de alumnos a favor Estadístca 5 Control de caldad 10 Neumátca 15 Hdráulca 0 Smulacón 30 Muestre los datos gráfcamente empleando: a. Un gráfco de columna b. Un gráfco de barras c. Un gráfco de sectores 3.8.5 A partr de los sguentes datos, cree la correspondente tabla de frecuenca y grafque: a. Un hstograma b. Un polígono de frecuenca c. Una OJIVA 6,4 66,49 7,71 9,64 49,55 37,33 64,86 9,8 36,33 14,97 4,9 19,6 13, 5,3 85,45 66,85 77,37 93,43 96

3.8.6 A partr del gráfco de ojva, responda las sguentes preguntas (Tamaño de la muestra es 500): GRÁFICO DE OJIVA 100,0% 75,0% H 50,0% 5,0% 0,0% 100,5 140,5 180,5 0,5 60,5 300,5 340,5 380,5 Límte Superor a. Que cantdad de datos hay acumulado hasta 60.5? b. Srve este tpo de gráfco para mostrar la frecuenca absoluta (f)? c. Dseñe la tabla de frecuenca respectva 3.8.7 Cree una tabla de frecuenca que contenga 7 ntervalos de clase, para los sguentes datos: 31, 44,3 31,8 19,0 59,9 87,9 66,1 5,4 47,9 96,6 36,5 74,0 4,7 10,6 56,0 87,7 11,7 30,1 5,3 11,7 31,4 51, 67,0 46,8 60,7 9,6 55,6 67,0 3,1 8, 81, 75,5 91,0 40,4 4,4 31,8 6,6 70,1 30,4 6,4 19,1 77,6 57,3 6,1 40,9 Construya el hstograma respectvo. 97

3.8.8 El cuadro que fgura más abajo da los caudales mensuales del río Magdalena observados durante los meses del abrl y mayo, desde 1988 a 005 (la undad de medda no se precsa). AÑO ABRIL MAYO 1988 600 51 1989 7 11 1990 487 469 1991 560 370 199 51 363 1993 43 7 1994 307 41 1995 390 53 1996 364 408 1997 84 33 1998 415 45 1999 55 199 000 09 15 001 30 97 00 44 309 003 58 303 004 58 196 005 4 166 Se desea ordenar estos datos y efectuar el análss sguente: a. Dar una representacón global de los caudales de abrl y mayo. Grafcar medante dos hstogramas los datos resumdos. b. Qué comportamento puede observar en las frecuencas en ambos meses? 98

3.8.9 Determne los ángulos de las porcones y complete la tabla de frecuenca TIPO A, a partr del sguente gráfco de sectores, s el total de datos es de 99: F 14,14% A 10,10% E 13,13% B 15,15% D,% C 5,5% 3.8.10 Complete la tabla de frecuenca a partr del sguente hstograma, s el total de datos es de 00: 5% 0% 15% 10% 5% 1.6 18.6 4.6 30.6 36.6 4.6 99

3.9 CASO: EL PROVEEDOR DE TUBOS DE ACERO Una mportante empresa desea contratar el sumnstro de tubos de acero. Para la lctacón se presentaron tres empresas (llámense A, B y C), las cuales venden la undad al msmo preco y con las msmas especfcacones del materal. La empresa solcta que el proveedor mantenga un dámetro promedo por cada 30 tubos entregados de 00 mm; para lo cual solctó a cada empresa una muestra de este tamaño, obtenendo los sguentes dámetros (las undades están en mlímetros): COMPAÑÍA A COMPAÑÍA B COMPAÑÍA C 196 193 196 199 197 199 03 09 15 187 08 196 197 194 199 191 180 17 0 188 13 00 05 04 60 01 00 1 190 1 03 197 00 179 191 171 11 19 198 03 197 00 8 187 07 17 178 194 05 195 198 00 194 17 178 194 19 194 198 06 00 11 14 197 195 08 199 0 03 169 45 78 15 01 3 03 00 08 190 9 170 189 196 193 197 199 198 193 43 160 Cuál de los tres proveedores escogería usted? Justfque su respuesta medante un análss gráfco de los hstogramas resultantes para cada compañía (RECOMENDACIÓN: Cree los hstogramas a partr de tablas de frecuencas que empleen los msmos ntervalos de clases). 100

3.10 CUESTIONARIO DE REPASO Seleccón Múltple con Únca Respuesta: Marque con una X la respuesta correcta. Para las preguntas 1 y : A partr del sguente gráfco de Ojva. INGRESOS Frecuenca Relatva 100% 90% 80% 70% 60% 50% 40% 30% 0% 10% 0% 1. Se puede conclur: 0 100000 00000 300000 400000 500000 600000 Ingreso $ a. El 60% de la poblacón gana más de $400.000 b. El 50% equvale a un ngreso de $00.000 c. El 80% de la poblacón gana más de $100.000 d. Todas las anterores. Se puede conclur: a. El 50% de la poblacón gana más de $300.000 b. El 30% de la poblacón gana menos de $00.000 c. El sueldo máxmo regstrado fue de $600.000 d. Todas las anterores 3. Los gráfcos de sectores son usados para: a. Mostrar frecuencas acumuladas b. Mostrar las marcas de clase de una tabla de frecuenca tpo B c. Mostrar solo las frecuencas absolutas d. Mostrar frecuencas no acumuladas 101

4. Cual de las tablas de frecuenca corresponde al sguente hstograma: f 0 15 10 5 a. N Lm Ls f F h H MC 1,0 4,1 10 10 15,87% 15,87% 3,1 4,1 6,1 15 5 3,81% 39,68% 5,1 3 6,1 8,1 13 38 0,63% 60,3% 7,1 4 8,1 10,1 0 58 31,75% 9,06% 9,1 5 10,1 1,0 5 63 7,94% 100,00% 11,1 Total 63 100,00% b. N Lm Ls f F h H MC 1,0 4,1 5 5 7,94% 7,94% 3,1 4,1 6,1 0 5 31,75% 39,68% 5,1 3 6,1 8,1 13 38 0,63% 60,3% 7,1 4 8,1 10,1 15 53 3,81% 84,13% 9,1 5 10,1 1,0 10 63 15,87% 100,00% 11,1 Total 63 100,00% c. N Lm Ls f F h H MC 1,0 4,1 10 10 15,63% 15,63% 3,1 4,1 6,1 15 5 3,44% 39,06% 5,1 3 6,1 8,1 13 38 0,31% 59,38% 7,1 4 8,1 10,1 0 58 31,5% 90,63% 9,1 5 10,1 1,1 5 63 7,81% 98,44% 11,1 6 1,1 14,0 1 64 1,56% 100,00% 13,1 Total 64 100,00% d. Nnguna de las anterores 3.1 5.1 7.1 9.1 11.1 10

CAPITULO 4 MEDIDAS DE TENDENCIA CENTRAL La estadístca descrptva en su funcón básca de reducr datos, propone una sere de ndcadores que permten tener una percepcón rápda de lo que ocurre en un fenómeno. La prmera gama de ndcadores corresponde a las Meddas de Tendenca Central. Exsten varos procedmentos para expresar matemátcamente las meddas de tendenca central, de los cuales, los más conocdos son: la meda artmétca, la moda y la medana. 103

CAPITULO 4: MEDIDAS DE TENDENCIA CENTRAL Meddas de tendenca central: Son ndcadores estadístcos que muestran haca que valor (o valores) se agrupan los datos. Esta prmera parte la dedcaremos a analzar tres meddas de tendenca central: La meda artmétca La moda La medana En el suplemento de este captulo ncluremos otras meddas de tendenca central. 4.1 LA MEDIA ARITMÉTICA Equvale al cálculo del promedo smple de un conjunto de datos. Para dferencar datos muestrales de datos poblaconales, la meda artmétca se representa con un símbolo para cada uno de ellos: s trabajamos con la poblacón, este ndcador será µ; en el caso de que estemos trabajando con una muestra, el símbolo será X. Meda artmétca (µ o X ): Es el valor resultante que se obtene al dvdr la sumatora de un conjunto de datos sobre el número total de datos. Solo es aplcable para el tratamento de datos cuanttatvos. Hay que entender que exsten dos formas dstntas de trabajar con los datos tanto poblaconales como muestrales: sn agruparlos o agrupándolos en tablas de frecuencas. Esta aprecacón nos sugere dos formas de representar la meda artmétca. 4.1.1 Meda artmétca para datos no agrupados Podemos dferencar la fórmula del promedo smple para datos poblacones y muestrales: µ N = = 1 N X Poblacón X n = = 1 n Muestra X 104

Observe que la varacón de ambas fórmulas radca en el tamaño de los datos (N dentfca el tamaño de la poblacón, mentras que n el de la muestra). 4.1. Ejemplo: la meda artmétca para datos no agrupados El profesor de la matera de estadístca desea conocer el promedo de las notas fnales de los 10 alumnos de la clase. Las notas de los alumnos son: 3, 3,1,4 4,0 3,5 3,0 3,5 3,8 4, 4,0 Cuál es el promedo de notas de los alumnos de la clase? SOLUCIÓN Aplcando la fórmula para datos no agrupados tenemos: µ = 3, + 3,1 +,4 + 4,0 + 3,5 + 3,0 + 3,5 + 3,8+,4, + 4,0 10 µ = 3,47 = 34,7 10 Cabe anotar que en el ejemplo estamos hablando de una poblacón correspondente a todos los alumnos de la clase (10 alumnos en total). El promedo de las notas es de 3,47. Modfquemos la prmera nota por 0,0 y calculemos nuevamente la meda artmétca. µ = 0,0 + 3,1 +,4 + 4,0 + 3,5 + 3,0 + 3,5 + 3,8+,4, + 4,0 10 µ = 3,15 = 31,5 10 En este caso la meda pasa de 3,47 a 3,15. Esta varacón notora se debó a que la meda artmétca es sensble a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atípca comparada con las demás, que están ubcadas entre 3,0 y 4,. 4.1.3 Meda artmétca para datos agrupados En el captulo explcábamos dos tpos de tablas de frecuencas (A y B). Cuando los datos se agrupan en tablas tpo A, la meda artmétca es gual a la dvsón de la sumatora del producto de las clases por la frecuenca sobre el número de datos. 105

µ Nc = = 1 X N f X Nc = = 1 X n f Poblacón Muestra La sumatora parte desde el prmer ntervalo de clase ( = 1) hasta el últmo (Nc), sendo X la clase del ntervalo. Cuando los datos se agrupan en tablas de frecuencas tpo B, el cálculo de la meda varía un poco, ya que exste una pérdda de nformacón en el momento en que se trabaja con ntervalos de frecuenca y no con los datos drectamente (los datos se agrupan por ntervalo, desconocendo el valor exacto de cada uno de ellos). µ Nc = = 1 Mc N f X Nc = = 1 Mc n f Poblacón Muestra Las marcas de clases (Mc) cumple la funcón de representar los ntervalos de clase. 4.1.4 Ejemplo: meda artmétca para datos agrupados en tablas tpo A La sguente tabla de frecuenca muestra el número de preguntas de 81 encuestados sobre un Test que consta de solo ses preguntas. Preguntas Buenas Personas 1 15 13 3 8 4 19 5 1 6 5 106

SOLUCIÓN PASO 1: Realzar la sumatora del producto resultante de las clases por su frecuenca absoluta. Para efectos del cálculo de la meda, deberíamos sumar 15 veces el valor 1, 13 veces el valor, 8 veces el valor 3, hasta llegar a la últma clase: Nc = 1 X f = 1x15 + x13 + 3x8 + 4x19 + 5x1 + 6x5 = 76 PASO : Dvdr la sumatora sobre el número total de datos. X = Nc = 1 X n f = 76 81 X = 3,41 En promedo los encuestados contestaron aproxmadamente 3 (el valor exacto es 3,41) preguntas buenas. 4.1.5 Ejemplo: meda artmétca para datos agrupados en tablas tpo B Calcular la meda para los datos dstrbudos en la sguente tabla de frecuenca: SOLUCIÓN N Lm Ls f Mc 1 40,0 48,1 3 44,1 48,1 56,1 8 5,1 3 56,1 64,1 11 60,1 4 64,1 7,1 3 68,1 5 7,1 80,1 1 76,1 6 80,1 88,1 18 84,1 7 88,1 96,1 14 9,1 8 96,1 104,0 1 100,1 Las marcas de clase representan a los ntervalos de clase, por ejemplo, suponemos que la marca de clase para el prmer ntervalo (44,1) se repte 3 veces, al desconocer los 3 valores exactos que están dentro de dcho ntervalo. PASO 1: Realzar la sumatora del producto resultante entre las marcas de clase por su frecuenca absoluta. 107

Nc Mc f = 44,1x3 + 5,1x8 + 60,1x11 + 68,1x 3 + 76,1x 1 + 84,1x18 + 9,1x14 100,1x1 = 1 + Nc = 1 Mc f = 7890,6 PASO : Dvdr la sumatora sobre el número total de datos. X = Nc = 1 Mc n f = 7890,6 108 X = 73,1 4.1.6 Ejemplo: comparatva entre el cálculo de la meda artmétca para datos no agrupados y datos agrupados en tablas tpo B Calcular la meda artmétca a los sguentes datos sn agrupar y agrupándolos en una tabla de frecuenca tpo B (suponga que los datos son poblaconales): SOLUCIÓN 47,8 3,1 1,4 35,4 44,0 6, 18,6 11,0 3,0 1,4 49,4 41,4 18,6 1,0 6,3 11,1 1,4 30,6 1,8 43,1 18,1 38,1 16,8 1,4 33,6 40,9 15, 33, 48, 37,0 Calculemos la meda para los datos sn agrupar: µ = 47,8 + 3,1 + 1,4 + 35,4 + 44,0 + 6, +... + 37,0 30 µ = 7,74 = 83,1 30 Luego construyamos la tabla tpo B y calculemos su meda artmétca con el fn de comparar ambos resultados: 108

N Lm Ls f Mc 1 11,00 17,41 8 14,1 17,41 3,81 6 0,61 3 3,81 30,1 7,01 4 30,1 36,61 5 33,41 5 36,61 43,01 4 39,81 6 43,01 49,40 5 46,1 Total 30 PASO 1: Realzar la sumatora del producto resultante entre las marcas de clase por su frecuenca absoluta. Nc = 1 Mc f = 14,1x8 + 0,61x6 + 7,01x + 33,41x5 + 39,81x4 + 46,1x5 = 848,70 PASO : Dvdr la sumatora sobre el número total de datos. X = Nc = 1 Mc n f = 848,70 30 X = 8,9 Podemos ver claramente una dferenca entre ambas medas: 7,74 para los datos no agrupados y 8,9 para los datos agrupados. Esta dferenca radca que en la tabla tpo B exste una perdda de nformacón, al agrupar los datos en los ntervalos de clase. El valor de la meda exacta es el calculado para los datos no agrupados, pero dada la proxmdad de la meda para los datos agrupados, se tomar esta últma como certa. 4.1.7 Cálculo de la meda artmétca en Excel Excel presenta la funcón PROMEDIO para el cálculo de la meda artmétca: PROMEDIO: Permte calcular la meda artmétca (o promedo smple) de un conjunto de datos. Formato: PROMEDIO(número1;número; ) Categoría: Estadístcas 109

En una hoja nueva, cope los sguentes datos a partr de la celda B: Ubquémonos en la celda B9 y actvemos la venta de funcones, selecconando la funcón PROMEDIO: En la prmera caslla (número 1), selecconamos el conjunto de datos: 110

Pulsemos en el botón Aceptar para mostrar el resultado en la celda B9. =PROMEDIO(B:D7) El procedmento varía cuando tenemos tablas de frecuenca. Cope la sguente tabla en una hoja nueva a partr de la celda B: 111

Recordemos que el prmer paso es calcular la sumatora del producto entre clase y frecuenca, empleando la sguente funcón: SUMAPRODUCTO: Calcula la suma de los productos entre datos. Formato: SUMAPRODUCTO(matrz1;matrz;matrz3; ) Categoría: Matemátcas y trgonométrcas Actvemos esta funcón desde la celda B11, consderando al campo matrz 1 como las clases y matrz como las frecuencas. Al pulsar en Aceptar, tendremos el valor de la sumatora. =SUMAPRODUCTO(B3:B8;C3:C8) 11

Necestamos ahora dvdr el resultado de la sumatora sobre los 116 datos ncludos en el ejercco. Modfquemos la fórmula actual y agreguemos: Donde C9 es la celda que muestra el total de los datos. El resultado fnal es 3,6637931. 4.1.8 Ventajas Es la medda de tendenca central más usada. El promedo es estable en el muestreo. Es sensble a cualquer cambo en los datos (puede ser usado como un detector de varacones en los datos). Se emplea a menudo en cálculos estadístcos posterores. Presenta rgor matemátco. En la gráfca de frecuenca representa el centro de gravedad. 4.1.9 Desventajas Es sensble a los valores extremos. No es recomendable emplearla en dstrbucones muy asmétrcas. S se emplean varables dscretas o cuas-cualtatvas, la meda artmétca puede no pertenecer al conjunto de valores de la varable. 113

4. LA MEDIANA Medana (Me): Valor que dvde una sere de datos en dos partes guales. La cantdad de datos que queda por debajo y por arrba de la medana son guales. La defncón de geométrca se refere al punto que dvde en dos partes a un segmento. Por ejemplo, la medana del segmento AB es el punto C. A C B Exsten entonces dos segmentos guales: AC = CB 4..1 Ejemplo: medana para datos no agrupados (cantdad de datos mpar) Encontrar la medana para los sguentes datos: SOLUCIÓN 4 1 3 4 1 5 5 3 PASO 1: Ordenar los datos. 1 1 3 3 4 4 5 5 PASO : Localzar el valor que dvde en dos parte guales el número de datos. 1 1 3 3 4 4 5 5 La medana es 3, dejando 5 datos a cada lado. Me = 3 114

4.. Ejemplo: medana para datos no agrupados (cantdad de datos par) Modfquemos el ejemplo anteror, elmnando el últmo dato. Encontrar la medana: SOLUCIÓN 4 1 3 4 1 5 5 PASO 1: Ordenar los datos. 1 1 3 4 4 5 5 PASO : Localzar el valor que dvde en dos parte guales el número de datos. 1 1 3 4 4 5 5 El punto medo se encuentra entre dos valores: y 3, por tanto, el valor de la medana será,5. Me =,5 4..3 Ejemplo: medana para datos agrupados en tablas tpo A Calcular la medana a partr de la sguente tabla de frecuenca: SOLUCIÓN N Clase f F h H 1 10 5 5 10,4% 10,4% 0 7 1 14,6% 5,0% 3 30 10 0,8% 45,8% 4 40 13 35 7,1% 7,9% 5 50 10 45 0,8% 93,8% 6 60 47 4,% 97,9% 7 70 1 48,1% 100,0% Total 48 100,0% PASO 1: Localzar entre que clases se encuentra la medana. Observe que la medana se encuentra entre las clases 3 y 4, donde podremos encontrar una frecuenca relatva acumulada del 50%. 115

N Clase f F h H 1 10 5 5 10,4% 10,4% 0 7 1 14,6% 5,0% 3 30 10 0,8% 45,8% 4 40 13 35 7,1% 7,9% 5 50 10 45 0,8% 93,8% 6 60 Entre 47 las clases 4,% 3 y 497,9% se 7 70 1 encuentra 48 el,1% punto que 100,0% Total 48 dvde en dos 100,0% partes guales la cantdad de datos. PASO : Interpolar los datos para encontrar la medana. En el paso anteror habíamos dcho que el punto que dvde el parte guales se encuentra entre 30 y 40. Clase H 40 7,9% 30 45,8% Dferenca 10 7,1% La dferenca entre las frecuencas relatvas nos ndca que exste entre las clases 7,1% de los datos. Para llegar al 50% de los datos, debemos ncrementar en 4,% datos partendo desde la clase 30. 50,0% = 45,8% + 4,% Con una regla de tres senclla hallaremos el ncremento en undades dada en la clase para ese 4,%. 10 7,1% Incremento 4,% Incremento = 4,% x10 7,1% = 1,55 Para llegar al 50% de los datos, a la clase 30 debemos ncrementarle 1,55. Me = 31,55 116

4..4 Ejemplo: medana para datos agrupados en tablas tpo B Determnar la medana de la sguente tabla de frecuenca: N Lm Ls f F h H Mc 1 1,0 9,1 5 5 1,50% 1,50% 5,1 9,1 37,1 7 5,00% 17,50% 33,1 3 37,1 45,1 10 17 5,00% 4,50% 41,1 4 45,1 53,1 7 4 17,50% 60,00% 49,1 5 53,1 61,1 1 36 30,00% 90,00% 57,1 6 61,1 69,1 3 39 7,50% 97,50% 65,1 7 69,1 77,0 1 40,50% 100,00% 73,1 Total 40 100,00% SOLUCIÓN PASO 1: Localzar entre que ntervalos de clase se encuentra la medana. Podemos observar que el punto que dvde el 50% de los datos esta entre el ntervalo de clase 3 y 5, para ser más precso, entre los valores 45,1 y 53,1 (hasta 45,1 hay agrupados el 4,50% de los datos, y hasta 53,1 se resume el 60,00% de los datos). N Lm Ls f F h H Mc 1 1,0 9,1 5 5 1,50% 1,50% 5,1 9,1 37,1 7 5,00% 17,50% 33,1 3 37,1 45,1 10 17 5,00% 4,50% 41,1 4 45,1 53,1 7 4 17,50% 60,00% 49,1 5 53,1 61,1 1 36 30,00% 90,00% 57,1 6 61,1 69,1 3 39 7,50% 97,50% 65,1 En el ntervalo 4 se 7 69,1 77,0 1 40,50% 100,00% 73,1 encuentra el punto que Total dvde 40 en dos partes 100,00% guales el total de los datos. PASO : Interpolar los datos para encontrar la medana. En resumen tenemos que: Límte H Superor 53,1 (Ls 4 ) 60,00% (H 4 ) 45,1 (Ls 3 ) 4,50% (H 3 ) Dferenca 8,00 17.50% 117

Entre los dos límtes superores abarcan un total de 17,50% de los datos. Se debe aumentar en 7,50% los datos desde límte superor del tercer ntervalo de clase. 8,00 17,50% Incremento 7,50% Incremento = 7,50% x8,00 17,50% = 3,43 Para llegar al 50% de los datos, 45,1 se aumenta en 3,43 undades. Me = 45,1+ 3,43 Me = 48,64 4..5 La fórmula para calcular la medana De este últmo ejemplo podemos determnar la fórmula para calcular la medana. Observe que la medana parte del límte superor del ntervalo de clase anteror, la cual smbolzaremos por Ls -1, sendo gual a 4 (cuarto ntervalo de clase). A este valor se le suma el ncremento para llegar al 50% de los datos: Me = Ls 1 + Incremento El ncremento resulta de multplcar el ncremento para llevar la frecuenca al 50% (50% - H -1 ) por el ancho de la clase (A) sobre la dferenca porcentual entre los límtes superores (H H -1 ): Me = Ls 1 (50% H + A. ( H H Smplfcando aún más la fórmula, recordemos que H H -1 es lo msmo la frecuenca relatva del ntervalo de clase (h ). Me = Ls 1 (50% H + A. h Para expresar la fórmula en frecuencas absolutas tenemos que: Me = Ls 1 n ( F + A. f 1 1 1 ) 1 ) ) ) 118

4..6 Ubcando la medana en el gráfco de ojva En un gráfco de ojva, la medana corresponde a la proyeccón del punto en eje horzontal que equvale al 50% de los datos. En la el gráfco de ojva del ejemplo 3.6.1, la medana estaría ubcada en el sexto ntervalo, entre 350 y 400: H 100.0% Dvsón de la cantdad de datos en dos partes guales 75.0% 50.0% 5.0% 100 150 00 50 300 350 400 450 Ls Medana 4..7 Calculo de la medana en Excel Excel posee la funcón MEDIANA para el cálculo de la medana en datos no agrupados. MEDIANA: Calcula la medana para una sere de datos. Formato: MEDIANA(número1;número; ) Categoría: Estadístcas Cope los datos dados en el ejemplo 4..1 a partr de la celda B: Actve la funcón MEDIANA desde la celda B4 y en el campo número1 seleccones los datos del ejercco. 119

La medana en este caso es 3: =MEDIANA(B:L) 4..8 Ventajas Es estable a los valores extremos. Es recomendable para dstrbucones muy asmétrcas. 4..9 Desventajas No presenta todo el rgor matemátco. Se emplea solo en varables cuanttatvas. 10

4.3 LA MODA Moda (Mo): ndca el valor que más se repte, o la clase que posee mayor frecuenca. En el caso de que dos valores presenten la msma frecuenca, decmos que exste un conjunto de datos bmodal. Para más de dos modas hablaremos de un conjunto de datos multmodal. 4.3.1 Ejemplo: moda para datos no agrupados Los sguentes datos provenen del resultado de entrevstar a 30 personas sobre la marca de gaseosa que más consume a la semana: SOLUCIÓN Marca 1 Marca Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca Marca 1 Marca 1 Marca Marca 1 Marca 3 Marca 3 Marca Marca 1 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca Marca 3 Marca 1 Marca 3 Marca 3 Marca Marca 3 PASO 1: Determnar las frecuencas de cada valor de la varable. La marca 1 se repte 15 veces La marca se repte 6 veces La marca 3 se repte 9 veces PASO : la moda representa el valor que más se repte. En este caso es la marca 1. Mo = Marca 1 4.3. Ejemplo: moda para datos agrupados Calcular la moda a partr de la sguente tabla de frecuenca: N Lm Ls f Mc 1 [ 4 6 ) 5 [ 6 8 ) 4 7 3 [ 8 10 ) 4 9 4 [ 10 1 ) 5 11 5 [ 1 14 ] 5 13 Total 0 11

SOLUCIÓN Las marcas de clase que más frecuencas tenen son 11 y 13, por tanto decmos que es un caso donde aparecen dos modas (bmodal). Mo 1 = 11 Mo = 13 4.3.3 Calculo de la moda medante fórmula Algunos autores suelen aplcar una fórmula para determnar la moda para tablas de frecuenca. Mo = L S 1 + A. ( f f f 1 f 1 ) + ( f f 1 ) Donde L S-1 equvale al límte superor del ntervalo anteror donde se encuentra la moda. 4.3.4 Calculo de la medana en Excel Con la funcón MODA que provee Excel, podremos calcular el valor que posee mayor frecuenca en datos no agrupados. MODA: Determna el valor que más se repte en un conjunto de datos. Formato: MODA(número1;número; ) Categoría: Estadístcas Calcule la moda a partr de los sguentes datos copados en una hoja nueva de Excel: 1

Actve la funcón MODA en la celda B9 y en el campo número1 seleccones los datos del ejercco. La moda del ejercco es. 13

=MODA(B:F7) Esta fórmula solo muestra una moda, correspondente a la de menor valor. En el caso de que no exsta la moda aparecen los símbolos #N/A. 4.3.5 Ventajas Es estable a los valores extremos. Es recomendable para el tratamento de varables cualtatvas. 4.3.6 Desventajas Pueda que no se presente. Puede exstr más de una moda. En dstrbucones muy asmétrcas suele ser un dato muy poco representatvo. Carece de rgor matemátco. 14

4.4 EJERCICIOS PROPUESTOS 4.4.1 Calcular la meda, medana y moda para los sguentes datos: 11 5 4 8 9 8 6 11 3 7 10 7 3 8 4.4. Determnar la meda, medana y moda a la sguente tabla de frecuenca: N Lm Ls f 1 100,0 150,1 1 150,1 00,1 3 00,1 50,1 15 4 50,1 300,1 16 5 300,1 350,1 1 6 350,1 400,1 14 7 400,1 450,1 11 8 450,1 500,0 7 Total 87 4.4.3 Para que un producto sea aceptado por su clente prncpal, debe cumplr con certas especfcacones de caldad. Una de ellas, radca en que el promedo de longtud de los 0 prmeros productos este entre 0,0 y 0,9 centímetros. S las meddas son:,3 0,4 19,8 19,9 0,1 0,8 1,6 19,8 0,5 3,4 19,6 1,5 18,5 18,7 0,9 1,1 0,1 1,5,3 17,9 Cumple en el proveedor con las especfcacones del clente? 4.4.4 Calcular la meda, medana y moda para los sguentes datos (agrúpelos en una tabla de frecuenca):,1 44,4 3,1 56,0 9,4 37,7 3,3 9,0 30,5 45,3 0,7 15,6 41,1 41, 39,5 0,8 34,1 31,8 1,9 47,0 5,6 4.4.5 Calcular la meda, medana y moda de la tabla de frecuenca dada en el ejercco.3.10. 15

4.4.6 Calcule y ubque la meda, medana y moda en el sguente gráfco de ojva: OJIVA F 100 90 80 70 60 50 40 30 0 10 0 5,0 30,0 35,0 40,0 45,0 50,0 55,0 Límte Superor 4.4.7 Calcule la meda, medana y moda a partr del sguente hstograma: HISTOGRAMA f 16 15 14 13 1 11 10 9 8 7 6 5 4 3 1 0 45,0 55,1 65,1 75,1 85,1 95,1 105,1 Marcas de Clase 16

4.5 CASO: POBLACIÓN Y MUESTRA Los ngresos en dólares de 30 hombres elegdos al azar (entre un total de 1000) se muestran a contnuacón: 45,16 79,85 76,91 88,91 6,59 88,61 68,89 54,33 16,60 19,9 19,48 6,37 58,4 56,70 37,5 83,61,07 65,73 99,49 34,0 41,50 9, 53,0 6,59 58,00 77,41 47,10 4,16 91,46 45,40 a. Calcule la meda artmétca para todos los datos sn agruparlos. b. Calcule la meda artmétca empleando la tabla de frecuencas. c. Cuál cree usted son las razones de las dferencas entre ambas medas? d. Explque medante este ejemplo, la dferenca entre meda, medana y moda? e. Qué representa para usted la moda y medana (en termno de pesos)? f. Se puede consdera que la poblacón de 1000 personas tendrán la msma meda que la muestra de 30 personas? 17

4.6 CUESTIONARIO DE REPASO Para las preguntas 1 a 4: Se muestran los hstogramas como resultado de medcones realzadas a 10 cudades de un país. El prmer hstograma muestra las poblacones de las cudades (undades dadas en mllones), ndcando que solo una cudad alcanza los 3 000.000 de habtantes. El hstograma sguente muestra el porcentaje de analfabetsmo de las cudades objeto del estudo. POBLACIÓN 4 No. de Cudades 3 1 0 0,5 1,0 1,5,0,5 3,0 Poblacón (mllones) ANALFABETISMO 5 No. de Cudades 4 3 1 0 0,0 1,0,0 3,0 4,0 5,0 % Analfabetsmo 1. El total de cudades consderadas en el estudo es de: a. 3 b. 5 c. 10 d. 30. Que sgnfcado tene la moda para el estudo del analfabetsmo a. Cuatro de las cudades no presentan analfabetsmo b. La mayoría de las cudades no presentan analfabetsmo c. Ses cudades presentan problemas de analfabetsmo d. Nnguna de las anterores 18

3. El porcentaje promedo de analfabetsmo que arroja el estudo es de: a. 0,4% b. 1,0% c. 1,4% d.,0% 4. El estudo arrojado al número de habtante por cudad ndca que: a. El promedo de habtantes por cudad es de 0,5 mllones. b. El promedo de habtantes por cudad es de 1,0 mllón. c. El promedo de habtantes por cudad es de 1,45 mllones. d. El promedo de habtantes por cudad es de,0 mllones. 19

CAPITULO 5 MEDIDAS DE DISPERSIÓN No solo basta con determnar las meddas de tendenca central para comprender el comportamento de una sere de datos, es mportante además, conocer que tan alejados están esos datos respecto a ese punto de concentracón. Las meddas de dspersón nos ndcan la dstanca promedo de los datos respecto a las meddas de tendenca central. Así podremos dferencar dos conjuntos de datos que poseen guales medas, sendo los datos de uno más dspersos del otro. 130

CAPITULO 5: MEDIDAS DE DISPERSIÓN Meddas de dspersón: Son ndcadores estadístcos que muestran la dstanca promedo que exste entre los datos y la meda artmétca. En el estudo de las meddas de dspersón daremos un vstazo a cuatro ndcadores báscos: Desvacón meda Varanza Desvacón estándar Coefcente de varacón El cálculo de cada uno de ellos se toma basado en la meda artmétca. 5.1 DESVIACIÓN MEDIA Para conocer con un solo ndcador que tan dsperso se encuentran un conjunto de datos a un punto de concentracón, debemos como prmera medda, calcular la dstanca de cada dato respecto a una medda de tendenca central. Por ejemplo: 4 5 3 5 3 3 5 1 4 1 4 Tenemos que la meda artmétca es de aproxmadamente 3,0667 (ndcador de tendenca central por excelenca). El prmer dato (4), se aleja de la meda en 0,9333 haca la derecha. Gráfcamente tendríamos: 0,933 Dato 1 1 3 4 5 X = 3,0667 Para el segundo dato (5) la dstanca es de 1,9333 respecto a la meda artmétca: 131

1,933 Dato Dato 1 1 3 4 5 X = 3,0667 Note que el tercer dato (3) posee una dstanca de 0,0667 haca la zquerda de la meda. Para ndcar las dstancas de estos puntos, agregaremos el sgno negatvo, por tanto, la dstanca del tercer dato sería 0,0667. La representacón gráfca de todos los puntos quedaría: Dato 14 Dato 15 Dato 1 Dato9 Dato8 Dato7 Dato6 Dato 10 Dato 5 Dato 13 Dato 11 Dato 3 Dato 4 Dato Dato 1 1 3 4 5 X = 3,0667 El total de las dstancas de los puntos que están a la zquerda respecto a la meda es de -8,6 (empleando todos los decmales), que es gual a la sumatora de las dstancas de los puntos que están a la derecha respecto a la meda 8,6. Conclumos que la sumatora de todas las dstancas de cada punto respecto a la meda artmétca es gual a cero (las dstancas se anulan): 13

n ( X X ) = 0 = 1 Para responder a la pregunta de qué tan dsperso están los datos respecto a la meda artmétca?, recurrremos nuevamente al promedo smple. Para llegar a una fórmula básca de dspersón, en que las dstancas postvas y negatvas no se elmnen, modfcaremos la fórmula anteror para trabajar solo con dstancas postvas medante el valor absoluto: n = 1 X X = 17, La dstanca promedo sería de aproxmadamente 1,15 (resultado de la dvsón entre la dstanca total absoluta y el total de datos). A esta dstanca promedo se le conoce con el nombre de desvacón meda y sgnfca que en promedo, los datos se separan de la meda en 1,15. Desvacón meda (Dm): Equvale a la dvsón de la sumatora del valor absoluto de las dstancas exstentes entre cada dato y su meda artmétca y el número total de datos. Dm n = = 1 X n X Se debe hacer la dstncón que para datos poblaconales (no agrupados), la fórmula quedaría: N X µ = Dm = 1 N La varacón para los datos agrupados en tablas tpo B radca en cambar el valor de X por la marca de clase correspondente, multplcando esa dstanca por su frecuenca: 133

Dm = Nc = 1 Mc N µ f. Dm = Nc = 1 Mc X. f n Poblacón Muestra Para las tablas tpo A solo cambaremos la marca de clase por su respectvo valor de clase (representada por X ): Dm = Nc = 1 X µ f. N Dm = Nc = 1 X X. f n Poblacón Muestra 5.1.1 Ejemplo: Desvacón meda para datos no agrupados Tres alumnos son sometdos a una competenca para probar sus conocmentos en 10 materas dferentes, cada una sustentada con 10 preguntas. La dea del concurso es encontrar al alumno más dóneo para representar al colego en un torneo a nvel naconal. El número de preguntas buenas por matera se muestra a contnuacón: Matera Carlos Pedro Juan 1 7 5 9 6 3 10 5 4 6 5 5 3 6 5 6 1 3 5 7 9 6 4 8 9 7 5 9 1 6 6 10 4 5 4 134

SOLUCIÓN Lo prmero que analzaremos es la meda de los puntajes para cada uno de los alumnos, con el fn de determnar el alumno con mayor promedo de preguntas buenas. 50 Carlos : X c = = 5 10 50 Pedro : X p = = 5 10 50 Juan : X j = = 5 10 Las medas para los resultados de los alumnos concden: los tres alumnos tenen responden en promedo 5 preguntas correctas por prueba. Cuál sería entonces el ndcador dferencador entre los alumnos?. Complementemos el análss anteror calculando la desvacón meda: Dm c = 5 + 9 5 + 10 5 + 5 + 3 5 + 1 5 10 + 9 5 + 9 5 + 1 5 + 4 5 39 = = 3,9 10 Dm p = 7 5 + 5 + 5 + 6 5 + 6 5 + 3 5 10 + 6 5 + 7 5 + 6 5 + 5 5 1 = =,1 10 Dm j = 5 5 + 6 5 + 5 5 + 5 5 + 5 5 + 5 5 10 + 4 5 + 5 5 + 6 5 + 4 5 = 9 10 = 0,9 Carlos muestra una desvacón meda de 3,9 ndcando que los datos se alejan en promedo de la meda en 3,9 preguntas buenas. Pedro dsmnuye su varacón (,9), sendo Juan el que menos varacón presenta con 0,9 preguntas tanto por arrba como por debajo de la meda artmétca. Se recomenda al colego elegr como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedo acerta 5 preguntas buenas con una varacón muy baja (rondando entre 4 y 6). 5.1. Ejemplo: Desvacón meda para datos agrupados Una maquna dspensadora de gaseosas esta programada para llenar un envase con 350 c.c. de un refresco popular. A partr de una muestra de prueba realzada sobre 30 envases se realzó la sguente tabla de frecuenca: 135

N Lm Ls F Mc 1 130.0 140.1 135.1 140.1 150.1 5 145.1 3 150.1 160.1 14 155.1 4 160.1 170.1 4 165.1 5 170.1 180.1 4 175.1 6 180.1 190.0 1 185.1 Total 30 Calcular e nterpretar la desvacón meda. SOLUCIÓN PASO 1: Calcular la meda artmétca. X = 471,84 30 = 157,095 PASO : Calcular la desvacón meda. Dm = 135,1 150,095. + 145,1 150,095.5 + 155,1 150,095.14 + 165,1 150,095.4 + 175,1 150,095.4 + 185,1 150,095.1 30 La desvacón meda es de aproxmadamente 8,8 c.c. Conclumos que con datos sumnstrados de una muestra, el dspensador llenó los 30 envases con un promedo de 157,095 c.c. con una desvacón meda de 8,8 c.c. La desvacón meda descrbe un rango de dspersón promedo de llenado del dspensador, ubcándolo entre 148,95 c.c. (equvale a restar la meda a la desvacón meda) y 165,895 c.c. (sumar una desvacón meda a la meda artmétca). 5.1.3 Cálculos de la desvacón meda en Excel Presentaremos el cálculo de la desvacón meda en Excel tanto para datos sn agrupar, como para los datos agrupados en tablas de frecuencas. Copemos los sguentes datos a partr de la celda B. 136

Excel cuenta con la funcón DESVPROM para el cálculo de la desvacón meda para datos sn agrupar. DESVPROM: Calcula la desvacón meda de un conjunto de datos numércos. Formato: DESVPROM(número1;número; ) Categoría: Estadístcas Actvemos esta funcón en la celda B9, señalando el rango de celdas B:F7 en el campo número1. Al pulsar en el botón Aceptar, se mostrará la desvacón meda. =DESVPROM (B:F7) Para el cálculo de la desvacón meda en tablas de frecuenca debemos calcular de antemano la meda artmétca y el valor absoluto de las dstancas. Copemos la sguente tabla de frecuenca en una hoja nueva en Excel (es la msma utlzada en el ejemplo 5.1.). 137

El prmer paso es calcular la meda artmétca para datos agrupados con ayuda de la funcón SUMAPRODUCTO (ver el ejemplo dado en el punto 4.1.7), aplcado sobre las frecuencas y marcas de clases. =SUMAPRODUCTO(E3:E8,F3:F8)/E9 Luego hallaremos las dstancas de cada marca de clase respecto a la meda, convrténdolas a su valor absoluto con la funcón ABS. ABS: Devuelve el valor absoluto de un número. Formato: ABS (número) Categoría: Matemátcas y trgonométrcas Esta funcón posee un únco campo (número) el cual contendrá, la dstanca entre la marca de clase y la meda. Para el prmer ntervalo de clase tendríamos: Donde F3 representa la prmera marca de clase y B11 la meda artmétca. Para completar el cálculo, multplcaremos esta funcón por la frecuenca respectva: 138

Para poder arrastrar la fórmula, debemos recordar que la celda B11 no varía (la meda artmétca es una sola), ubcándonos sobre las letras B11 en modo de edcón y luego pulsando la tecla F4. El resultado fnal, después de haber arrastrado la fórmula, debería verse como sgue: El total de las dstancas se muestra en la celda G9. La desvacón (que ubcaremos en la celda B1), es el resulta de la dvsón de la dstanca total sobre el número de datos empleados en el ejercco. =G9/E9 139

5. LA VARIANZA Otra forma para asegurar que las dferencas entre la meda y los puntos de un valor postvo, es elevándola al cuadrado. Al promedo de estas dstancas al cuadrado se le conoce como varanza. Varanza (S o σ ): Es el resultado de la dvsón de la sumatora de las dstancas exstentes entre cada dato y su meda artmétca elevadas al cuadrado, y el número total de datos. S = n = 1 ( X X ) n 1 o σ N = = 1 ( X µ ) N Dstngumos dos símbolos para dentfcar la varanza: S para datos muestrales, y σ para datos poblaconales. Note que la fórmula para la varanza muestral presenta en su denomnador al tamaño de la muestra menos uno, tendenca adoptada por los estadístcos para denotar una varanza más conservadora. Al gual que ocurre con la desvacón meda, podemos defnr las fórmulas para datos agrupados en tablas tpo A y tpo B. Para las tablas tpo A tenemos: σ = Nc = 1 ( X µ ). N f S = Nc = 1 ( X X ) n 1. f Poblacón Muestra Para las tablas tpo B, la clase camba por la marca de clase del ntervalo: σ Nc = = 1 ( Mc µ ) N. f S = Nc = 1 ( Mc X ) n 1. f Poblacón Muestra Una advertenca en el uso de esta medda, es que al elevar las dstancas al cuadrado, automátcamente se elevan las undades. Por ejemplo, s undad trabajada en los datos es centímetros, la varanza da como resultados centímetros al cuadrado. 140

5..1 Ejemplo: Varanza para datos no agrupados La sguente muestra representa las edades de 5 personan sometdas a un análss de preferencas para un estudo de mercado. Determnar la varanza. SOLUCIÓN 5 19 1 35 44 0 7 3 38 33 18 30 19 9 33 6 4 8 39 31 31 18 17 30 7 PASO 1: Calcular la meda artmétca. PASO : Calcular la varanza X 694 = = 5 7,76 En este punto, la varanza es dentfcada por S. S = ( 5 7,76) + ( 19 7,76) + ( 1+ 7,76) +... + ( 7 7,76) 5 1 S = 144,56 4 = 51,8567 La varanza equvale a 51,8567. Por elevar las undades al cuadrado, carece de un sgnfcado contextual dentro del análss descrptvo del caso. 5.. Ejemplo: Varanza para datos agrupados Calcular la varanza a partr de la sguente tabla de frecuenca (suponga que los datos son poblaconales). N Lm Ls f Mc 1 [15 17) 16 [17 19) 5 18 3 [19 1) 13 0 4 [1 3) 4 5 [3 5] 1 4 Total 5 141

SOLUCIÓN PASO 1: Calcular la meda artmétca. 16x + 18x5 + 0x13 + x4 + 4x1 µ = = 5 µ = 19,76 494 5 PASO : Calcular la varanza En este punto, la varanza es dentfcada por S. σ = ( 16 19,76). + ( 18 19,76).5 + ( 0 + 19,76).13 + ( 19,76).4 + ( 4 19,76) 5.1 σ = 8,56 5 = 3,304 5..3 Cálculo de la varanza en Excel Excel posee dos funcones propas para el cálculo de la meda, dferencando los datos muestrales de los datos poblaconales. VAR: Calcula la varanza de una muestra. Formato: VAR(número1;número; ) Categoría: Estadístcas VARP: Calcula la varanza de todos los datos de una poblacón. Formato: VARP(número1;número; ) Categoría: Estadístcas Mostremos su funconamento calculando la varanza en ambos casos a partr de los sguentes datos: 138, 195,8 14,5 101,7 137,1 130,3 110,0 101,4 104,5 18,5 135,5 197,5 159,6 140,7 103, 134,3 191 180,6 189,9 186,3 116,4 155,3 146,6 199,1 188,4 113,8 11,9 135,7 14,6 15,6 14

Los datos copados en Excel desde la celda B deberían verse como sgue: S los datos provenen de una muestra, emplearemos la funcón VAR, en cuyo denomnador se tendría el valor 9 en vez de 30, equvalente al tamaño de la muestra. Actvemos esta funcón en la celda B8. El resultado de la varanza muestral es de 1034,138051. =VAR(B:G6) En la celda B9 calculemos la varanza para datos poblaconales. 143

=VARP(B:G6) La funcón de la varanza VARP, dvde la sumatora de las dstancas al cuadrado por los 30 datos, dando como resultado un valor menor que con la funcón VAR (la varanza para la muestra es un valor más conservador). Para el cálculo de la varanza en datos agrupados en Excel, tomaremos la tabla de frecuenca dada en el ejemplo 5... Calculemos la meda en la celda B10. =SUMAPRODUCTO(E3:E7;F3:F7)/E8 144

En una columna adconal colocaremos las dferencas entre la marca de clase y la meda elevadas al cuadrado multplcadas por su frecuenca. Analcemos la fórmula empleada desde la celda C3. La celda B10 esta fja ndcando la meda artmétca. Aparece el operador, la cual eleva al cuadrado lo que esta dentro del paréntess. Esta dstanca se multplca por el número de veces que se repte (por su frecuenca). Al fnal calculamos su sumatora. En la celda B11 calculamos la varanza. =G8/E8 145

5.3 DESVIACIÓN ESTÁNDAR Habíamos vsto que la varanza transforma todas las dstancas a valores postvos elevándolas al cuadrado, con el nconvenente de elevar consgo las undades de los datos orgnales. La desvacón estándar solucona el problema obtenendo la raíz cuadrada de la varanza, consguendo así, un valor smlar a la desvacón meda. Desvacón estándar o típca (S o σ): Es gual a la raíz cuadrada de la varanza. S = S o σ = σ La S representa la desvacón estándar de una muestra, mentras que σ la desvacón para todos los datos de una poblacón. Amplando las fórmulas tenemos: σ = N = 1 ( X µ ) N S = n = 1 ( X X ) n 1 Poblacón Muestra Aplcamos el msmo procedmento a las fórmulas para las tablas de frecuencas tpo A. σ = Nc = 1 ( X µ ). N f S = Nc = 1 ( X X ) n 1. f Poblacón Muestra Y para las tablas de frecuencas tpo B. σ = Nc = 1 ( Mc µ ) N. f S = Nc = 1 ( Mc X ) n 1. f Poblacón Muestra 146

5.3.1 Ejemplo: Desvacón estándar para datos no agrupados Calcular la desvacón estándar al sguente conjunto de datos muestrales. 0 15 18 10 10 19 08 07 13 5 13 04 5 11 1 18 00 05 0 15 17 09 07 11 18 PASO 1: Calcular la meda artmétca. X = 0 + 15 + 18 + 10 + 10 +... + 18 5 = 5339 5 X = 13,56 PASO : Calcular la varanza En este punto, la varanza es dentfcada por S. S = ( 0 13,56) + ( 15 13,56) + ( 18 + 13,56) + ( 10 13,56) +... + ( 18 13,56) 5 1 1030,16 S = = 4,933 5 1 PASO 3: Calcular la desvacón estándar a partr de la raíz cuadrada de la varanza. S = S 4,933 = 6,5516 Los datos se alejan en promedo de la meda artmétca en 6,5516 puntos. 147

5.3. Ejemplo: Desvacón estándar para datos agrupados Calcular la desvacón estándar a partr de la sguente tabla de frecuenca. Consdere los datos como poblaconales. No. Lm Ls f Mc 1 13,0 15,1 15 14,1 15,1 17,1 10 16,1 3 17,1 19,1 1 18,1 4 19,1 1,1 4 0,1 5 1,1 3,1 5,1 6 3,1 5,1 1 4,1 7 5,1 7,0 1 6,1 Total 48 PASO 1: Calcular la meda artmétca. 14,1x15 + 146,1x10 + 18,1x1 + 0,1x4 +,1x5 + 4,1x1 + 6,1x1 µ = = 48 µ = 18,7917 90 48 PASO : Calcular la varanza En este punto, la varanza es dentfcada por σ. σ = ( 14,1 18,7917).15 + ( 16,1 18,7917).10 + ( 18,1 18,7917).1+... + ( 6,1 18,7917) 48.1 σ = 789,96 48 = 58,14 PASO 3: Calcular la desvacón estándar a partr de la raíz cuadrada de la varanza. σ = σ = 58,14 7,639 Los datos se alejan en promedo de la meda artmétca en 7,639 puntos. 148

5.3.3 Cálculo de la Desvacón estándar en Excel Al gual que en la varanza, Excel posee dos funcones para el cálculo de la meda, dferencando los datos muestrales de los datos poblaconales. DESVEST: Calcula la desvacón estándar de una muestra. Formato: DESVEST(número1;número; ) Categoría: Estadístcas DESVESTP: Calcula la desvacón estándar de todos los datos de una poblacón. Formato: DESVESTP(número1;número; ) Categoría: Estadístcas Tomemos los datos del ejemplo 5..1 para aplcar la fórmula de desvacón estándar para datos muestrales. Cope los datos a una hoja en blanco en Excel: En la celda B8 actve la funcón DESVEST, marcando en la prmera caslla, losdatos del ejercco y luego pulsando en el botón aceptar. 149

El resultado es de aproxmadamente 6,5516. Para datos agrupados, calcularemos la varanza tal cual como se mostró en la seccón 5..3 para luego calcular su raíz cuadrada con la funcón RAIZ: RAIZ: Calcula la raíz cuadrada de un número. Formato: RAIZ(número1) Categoría: Matemátcas y trgonométrcas Calculemos la raíz cuadrada de una tabla de frecuenca senclla. N Clase f 1 4 15 5 10 3 6 1 4 7 4 5 8 5 6 9 1 Total 47 En la celda B11 hallamos la meda artmétca de la tabla. 150

En una columna nueva colocamos las dstancas de las clases respecto a la meda, multplcadas por sus frecuencas respectvas. Dvdmos el total de las dstancas al cuadrado por el número de datos (colocamos el resultado en la celda B1). La desvacón será gual a la raíz cuadrada del valor contendo en la celda B1. 151

La desvacón estándar es de,06. =RAIZ(B1) 5.4 COEFICIENTE DE VARIACIÓN El coefcente de varacón permte comparar la dspersón entre dos poblacones dstntas e ncluso, comparar la varacón producto de dos varables dferentes (que pueden provenr de una msma poblacón). Estas varables podrían tener undades dferentes, por ejemplo, podremos determnar s los datos tomados al medr el volumen de llenado de un embase de certo líqudo varían más que los datos tomados al medr la temperatura de el lqudo contendo en el embase al salr al consumdor. El volumen los medremos en centímetros cúbcos y la temperatura en grados centígrados. 15

El coefcente de varacón elmna la dmensonaldad de las varables y tene en cuenta la proporcón exstente entre una medda de tendenca y la desvacón típca o estándar. Coefcente de varacón (Cv): Equvale a la razón entre la meda artmétca y la desvacón típca o estándar.. S σ Cv = o Cv = X µ S envés de la meda artmétca se emplea la medana, obtendremos el coefcente de varacón medana. S Cv = o Me Cv = σ Me Este índce solo se debe calcular para varables con todo los valores postvos, para dar segurdad de un X o µ mayores a cero (un coefcente de varacón postvo). 5.4.1 Ejemplo: Desvacón estándar para datos no agrupados En un juego de tro al blanco con escopeta de perdgones por dos partcpantes a un tablero, obtenen el sguente regstro después de 15 dsparos cada uno. Determnar el coefcente de varacón para ambos casos. 1 Pts. Pts. 3 Pts. 4 Pts. 5 Pts. Jugador 1 Jugador Dsparo f Dsparo f 1 6 1 0 3 7 3 0 3 7 4 3 4 1 5 3 5 0 153

PASO 1: Calcular las medas artmétcas: X X 1x6 + x3 + 3x0 + 4x3 + 5x3 39 = = 15 15 1 = 1x0 + x7 + 3x7 + 4x1 + 5x0 39 = = 15 15 = PASO : Calcular las varanzas En este punto, la varanza es dentfcada por S.,6,6 S 1 S = = ( 1,6).6 + (,6).3 + ( 3,6).0 + ( 4,6).3 + ( 5,6) S 39,6 = 14 15 1 1 =,886 ( 1,6).0 + (,6).7 + ( 3,6).7 + ( 4,6).1+ ( 5,6) S 5,6 = 14 15 1 1 = 0,4.3.0 PASO 3: Calcular la desvacón estándar a partr de la raíz cuadrada de la varanza. S 1 =,886 = 1,6818 S = 0,4 = 0,635 La puntuacón de los dsparos se aleja en promedo de la meda artmétca en aproxmadamente 1,6818 para el jugador 1 y 0,635 para el jugador. PASO 4: Calcular el coefcente de varacón. Cv Cv = X S 1,6818 =,6 1 1 = 1 = X S 0,635 =,6 = 0,6469 0,433 154

El menor coefcente de varacón ndca que el jugador presento una dspersón menor de sus puntuacones respecto a la meda, caso contraro al jugador 1 donde la dspersón fue mayor. 5.4. Calculo del coefcente de varacón en Excel Para calcular el coefcente de varacón con ayuda de Excel, debemos calcular prmero la meda artmétca y la desvacón estándar. Por ejemplo, calculemos el coefcente de varacón para los sguentes datos: Empleando las fórmulas vstas en Excel, se halla la meda y desvacón (tomando los valores como muestrales): =PROMEDIO(B:F4) =DESVEST(B:F4) El coefcente de varacón es el resulta de la dvsón entre la desvacón (C7) y la meda (C6): =C7/C6 155

5.5 EJERCICIOS PROPUESTOS 5.5.1 Calcular la desvacón meda a partr del regstro de las sguentes edades de una muestra de 36 personas. 48 19 1 1 19 15 1 5 14 18 49 0 30 17 46 40 43 45 8 8 3 50 7 44 11 18 1 13 48 3 35 41 49 3 5.5. Calcular la desvacón meda a partr de la sguente tabla de frecuenca. Nc Lm Ls f 1 100,00 150,51 5 150,51 01,01 8 3 01,01 51,51 9 4 51,51 30,01 15 5 30,01 35,51 6 35,51 403,01 6 7 403,01 453,50 4 Total 49 5.5.3 Calcular la desvacón meda, varanza y desvacón estándar a los datos mostrados en los ejerccos 4.4.1, 4.4., 4.4.3 y 4.4.4 5.5.4 Calcule la desvacón meda, varanza y desvacón estándar a partr de los sguentes datos sn agrupar y agrupándolos en una tabla de frecuenca tpo B (notar la varacón de las meddas de dspersón en ambos casos). 49,15 46,17 53,8 49,41 49,00 36,14 41,65 51,75 45,13 43,00 41,95 45,95 5,66 47,50 37,43 48,53 47,4 47,55 51,17 5,69 37,1 49,39 35,0 45,14 35,0 40,59 54,06 47,05 47,04 53,13 53,88 4,33 45,16 35,87 35,0 39,33 48,64 51,83 49,89 36,13 156

5.5.5 Calcule la desvacón meda, varanza y desvacón estándar a partr del sguente gráfco de ojva (dado en el ejercco 4.4.6): OJIVA F 100 90 80 70 60 50 40 30 0 10 0 5,0 30,0 35,0 40,0 45,0 50,0 55,0 Límte Superor 5.5.6 Calcule la desvacón meda, varanza y desvacón estándar a partr del sguente gráfco de ojva (dado en el ejercco 4.4.7): HISTOGRAMA f 16 15 14 13 1 11 10 9 8 7 6 5 4 3 1 0 45,0 55,1 65,1 75,1 85,1 95,1 105,1 Marcas de Clase 157

5.6 CASO: EL RÍO MAGDALENA El cuadro que fgura más abajo da los caudales mensuales del ro Magdalena observados durante los meses del abrl y mayo, desde 1988 a 005 (la undad de medda no se precsa). AÑO ABRIL MAYO 1988 600 51 1989 7 11 1990 487 469 1991 560 370 199 51 363 1993 43 7 1994 307 41 1995 390 53 1996 364 408 1997 84 33 1998 415 45 1999 55 199 000 09 15 001 30 97 00 44 309 003 58 303 004 58 196 005 4 166 Se desea ordenar estos datos y efectuar el análss sguente: 1. Dar una representacón global de los caudales de abrl y mayo. Grafcar medante dos hstogramas los datos resumdos (recomendacón: agrupe los datos empleando tablas de frecuenca con guales ntervalos de clase).. Calcular la meda de los caudales de abrl, y la meda de los caudales de mayo. 3. Calcular la desvacón típca de los caudales de abrl, y la desvacón típca de los caudales de mayo. 4. Comparar los caudales de abrl con los caudales de mayo, a partr de la nformacón sumnstrada en la segunda y tercera pregunta. 5. Realzar conclusones sobre: meda, medana, moda, frecuencas, desvacones e hstogramas de frecuenca. 158

CAPITULO 6 MEDIDAS DE POSICIÓN Las meddas de poscón equvalen a los valores que puede tomar una varable caracterzados por agrupar a certo porcentaje de observacones en la muestra o poblacón. Las meddas de poscón son deales para obtener nformacón adconal a partr de datos resumdos, es decr, que presentan perdda de nformacón por agrupamento en ntervalos de clase. 159

CAPITULO 6: MEDIDAS DE POSICIÓN Meddas de poscón: Son ndcadores estadístcos que muestran la frecuenca acumulada hasta un valor k cualquera. En este captulo analzaremos tres meddas de poscón: Percentles Decles Cuartles Es necesaro revsar nuevamente el concepto de nterpolacón, ya que la base de estos ndcadores es encontrar el valor de la varable a partr de un porcentaje de datos acumulados, de forma smlar como se hzo con la medana. 6.1 PERCENTILES Los percentles representan los valores de la varable que están por debajo de un porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total de los datos es dvdo en 100 partes guales). La notacón empleada será: P k Donde k es equvalente al porcentaje de datos acumulados, y P k es el valor de la varable que representa dcho porcentaje. Por ejemplo, P 5 es el valor de la varable que deja por debajo el 5% de los datos. P 78 será entonces el valor que agrupa el 78% de los datos. f 0 18 16 14 1 10 8 6 4 0 P 5 P 78 10 0 30 40 50 60 70 Varable: Edad HISTOGRAMA Número total de personas consultadas: 100 160

Podemos conclur que P 50 sería el valor que dvde en dos parte guales la cantdad de datos de la muestra o poblacón sendo equvalente a la medana. P = Me 50 Traslademos el gráfco de barra a su respectva tabla de frecuenca y tratemos de localzar los Percentles expuestos en el ejemplo: Nc Lm Ls f F h H 1 [ 5 15) 14 14 14,00% 14,00% [15 5) 1 6 1,00% 6,00% 3 [5 35) 0 46 0,00% 46,00% 4 [35 45) 18 64 18,00% 64,00% 5 [45 55) 14 78 14,00% 78,00% 6 [55 65) 1 90 1,00% 90,00% 7 [65 75] 10 100 10,00% 100,00% TOTAL 100 100,00% Podemos conclur fáclmente (con ayuda de las frecuencas acumuladas), que 14 personas (14% del total) están por debajo de los 15 años (podemos aproxmarlo a 15 años), lo cual representaría al percentl 14: P 14 = 15 El percentl 5 (P 5 ) no puede ser calculado drectamente, pero podemos conclur que dcho valor se encuentra en el prmer ntervalo, ya que este acumula el 14% de las personas. No ocurre lo msmo con el percentl 78 (P 78 ) que aparece drectamente en la tabla: Nc Lm Ls f F h H 1 [ 5 15) 14 14 14,00% 14,00% [15 5) 1 6 1,00% 6,00% 3 [5 35) 0 46 0,00% 46,00% 4 [35 45) 18 64 18,00% 64,00% 5 [45 55) 14 78 14,00% 78,00% 6 [55 65) 1 90 1,00% 90,00% 7 [65 75] 10 100 10,00% 100,00% TOTAL 100 100,00% En el ntervalo 5 se encuentra el percentl 78 P 78 = 55 161

El 78% de las personas consultadas poseen una edad gual o nferor a los 55 años. 6.1.1 Ejemplo: Calculo de percentles A partr de la tabla de frecuenca anteror calcular el percentl 5 (P 5 ) SOLUCIÓN PASO 1: Localzar en cuál de los ntervalos de clase se encuentra el percentl Como se había menconado, el percentl 5 se encuentra en el prmer ntervalo. Nc Lm Ls f F h H 1 [ 5 15) 14 14 14,00% 14,00% [15 5) 1 6 1,00% 6,00% 3 [5 35) 0 46 0,00% 46,00% 4 [35 45) 18 64 18,00% 64,00% 5 [45 55) 14 78 14,00% 78,00% 6 [55 65) 1 90 1,00% 90,00% 7 [65 75] 10 100 10,00% 100,00% TOTAL 100 100,00% En el ntervalo 1 se encuentra el percentl 5 PASO : Interpolar los datos para encontrar el percentl. En resumen tenemos que: Límte H Superor 15,00 (Ls 1 ) 14,00% (H 1 ) 5,00 (Ls 0 ) 0,00% (H 0 ) Dferenca 10,00 14,.00% En este caso, suponemos un ntervalo adconal cuyo límte superor llamaremos Ls 0 equvalente a 5 el cual agrupa 0% de los datos. Entre los dos límtes superores abarcan un total de 14% de los datos. S queremos llegar al 5% de los datos, debemos ncrementar el porcentaje en una cantdad gual. 10,00 14,00% Incremento 5,00% Incremento = 5,00% x10,00 14,00% = 3,57 Para llegar al 5% de los datos, el límte 5 se debe aumentar en 3,57 undades. 16

P = 5,00 5 + P = 8,57 5 3,57 6.1. La fórmula para calcular percentles El percentl k parte desde límte superor del ntervalo anteror al que se encuentra dcho percentl más un ncremento El ncremento esta dado por: Pk = Ls 1 + Incremento P k = Ls 1 ( k H + A. ( H H 1 ) 1 ) Smplfcando aún más la fórmula tenemos: P k = Ls 1 ( k H + A. h 1 ) Para expresar la fórmula en frecuencas absolutas tenemos que: P k = Ls 1 ( n. k F + A. f 1 ) Aplcando la fórmula al ejemplo 6.1.1, conclumos: 6. DECILES P (5,00% 0,00%) = 5 + 10,00. 14,00% 5 = 8,57 Para los decles, tomaremos el total de los datos dvddos en 10 partes guales, por tanto, exstrán 10 decles representado como D k D 1 = Valor de la varable que agrupa el 10% de los datos. D = Valor de la varable que agrupa el 0% de los datos. D 3 = Valor de la varable que agrupa el 30% de los datos. D 4 = Valor de la varable que agrupa el 40% de los datos. D 5 = Valor de la varable que agrupa el 50% de los datos. D 6 = Valor de la varable que agrupa el 60% de los datos. D 7 = Valor de la varable que agrupa el 70% de los datos. 163

D 8 = Valor de la varable que agrupa el 80% de los datos. D 9 = Valor de la varable que agrupa el 90% de los datos. D 10 = Valor de la varable que agrupa el 100% de los datos. Nuestro hstograma con los decles dentfcados quedaría como sgue: f 0 18 16 14 1 10 8 6 4 0 D 1 D HISTOGRAMA D 3 D 4 D 5 D 6 D 7 D 8 D 9 D 10 P 78 10 0 30 40 50 60 70 Varable: Edad Número total de personas consultadas: 100 Las equvalencas entre percentles y decles son: P P P P P P P P P P 10 0 30 40 50 60 70 80 90 100 6..1 Ejemplo: Calculo de decles = D 1 = D = D 3 = D 4 = D 5 = D 6 = D 7 = D 8 = D 9 = D = Me A partr de la tabla de frecuenca dada para ejemplfcar los percentles, encontrar el decl. 101 164

SOLUCIÓN PASO 1: Localzar en cuál de los ntervalos de clase se encuentra el decl El Decl se encuentra en el segundo ntervalo, ya que este almacena hasta el 6% de los datos. Nc Lm Ls f F h H 1 [ 5 15) 14 14 14,00% 14,00% [15 5) 1 6 1,00% 6,00% 3 [5 35) 0 46 0,00% 46,00% 4 [35 45) 18 64 18,00% 64,00% 5 [45 55) 14 78 14,00% 78,00% 6 [55 65) 1 90 1,00% 90,00% 7 [65 75] 10 100 10,00% 100,00% TOTAL 100 100,00% En el ntervalo se encuentra el decl PASO : Interpolar los datos para encontrar el decl. En resumen tenemos que: Límte H Superor 5,00 (Ls ) 6,00% (H ) 15,00 (Ls 1 ) 14,00% (H 1 ) Dferenca 10,00 1,00% Entre los dos límtes superores abarcan un total de 1% de los datos. S queremos llegar al 0% de los datos, debemos ncrementar el porcentaje acumulado en Ls 1 en un 6% 10,00 1,00% Incremento 6,00% Incremento = 6,00% x10,00 1,00% = 5,00 Para llegar al 0% de los datos acumulados, el límte de 15,00 se debe aumentar en 5 undades. D = 15,00 + 5,00 D = 0,00 165

6.. La fórmula para calcular decles El decl k parte desde límte superor del ntervalo anteror al que se encuentra dcho decl más un ncremento El ncremento esta dado por: Dk = Ls 1 + Incremento D k = Ls 1 (10%. k H + A h 1. ) Para expresar la fórmula en frecuencas absolutas tenemos que: D k = Ls 1 (10%. n. k F + A. f 1 ) Aplcando la fórmula al ejemplo 6..1, conclumos: D (0,00% 14,00%) = 15,00 + 10,00. 1,00% = 0,00 6.3 CUARTILES Para los decles, tomaremos el total de los datos dvddos en 4 partes guales. Denotaremos el cuartel como Q k. Q 1 = Valor de la varable que agrupa el 5% de los datos. Q = Valor de la varable que agrupa el 50% de los datos. Q 3 = Valor de la varable que agrupa el 75% de los datos. Q 4 = Valor de la varable que agrupa el 100% de los datos. 166

El hstograma de ejemplo con los cuartles dentfcados quedaría como sgue: Las equvalencas entre percentles, decles y cuartles son: P P P P 5 50 75 10 = Q 1 = D 5 = Q 3 = D 6.3.1 Ejemplo: Calculo de cuartles Calcular el cuartl 3. SOLUCIÓN f 0 18 16 14 1 10 8 6 4 0 Q 1 HISTOGRAMA Q 10 0 30 40 50 60 70 Varable: Edad 10 = Q = Q 4 = Me Número total de personas consultadas: 100 PASO 1: Localzar en cuál de los ntervalos de clase se encuentra el cuartl. El Cuartl 3 se encuentra en el qunto ntervalo, ya que este almacena hasta el 78% de datos. Q 3 P 78 Q 4 Nc Lm Ls f F h H 1 [ 5 15) 14 14 14,00% 14,00% [15 5) 1 6 1,00% 6,00% 3 [5 35) 0 46 0,00% 46,00% 4 [35 45) 18 64 18,00% 64,00% 5 [45 55) 14 78 14,00% 78,00% 6 [55 65) 1 90 1,00% 90,00% 7 [65 75] 10 100 10,00% 100,00% TOTAL 100 100,00% En el ntervalo 5 se encuentra el cuartl 3 167

PASO : Interpolar los datos para encontrar el cuartl. En resumen tenemos que: Límte H Superor 55,00 (Ls 5 ) 78,00% (H 5 ) 45,00 (Ls 4 ) 64,00% (H 4 ) Dferenca 10,00 14,00% Entre los dos límtes superores abarcan un total de 14% de los datos. S queremos llegar al 75% de los datos, debemos ncrementar el porcentaje acumulado en Ls 4 en un 11% 10,00 14,00% Incremento 11,00% 11,00% x10,00 Incremento = 14,00% = 7,86 Para llegar al 0% de los datos acumulados, el límte de 45,00 se debe aumentar en 7,86 undades. Q 3 = 45,00 + 7,86 Q = 5,86 3 6.3. La fórmula para calcular cuartles El cuartl k parte desde límte superor del ntervalo anteror al que se encuentra dcho decl más un ncremento El ncremento esta dado por: Qk = Ls 1 + Incremento Q k = Ls 1 (5%. k H + A h 1. ) Para expresar la fórmula en frecuencas absolutas tenemos que: Q k = Ls 1 (5%. n. k F + A. f 1 ) 168

Aplcando la fórmula al ejemplo 6.3.1, conclumos: Q (75,00% 64,00%) = 45,00 + 10,00. 14,00% 3 = 5,86 6.4 APLICACIÓN DE PERCENTILES Y CUARTILES EN EXCEL MS Excel dspone de las funcones PERCENTIL y CUARTIL creadas para determnar estos ndcadores de poscón en datos no agrupados. Copemos los sguentes datos sn agrupar en una nueva hoja de Excel. Empleemos ahora la funcón PERCENTIL desde la celda B8 para calcular el percentl 48. PERCENTIL: Calcula el percentl k de un conjunto de datos. (Sendo k un valor entre 0 y 1) Formato: PERCENTIL(matrz;k) Categoría: Estadístca Actvemos la fórmula y señalemos en la caslla matrz los datos dados en el ejemplo. 169

En el valor k colocaremos 0,48 (ya que acepta valores de 0 a 1, sendo 1 el equvalente al 100% de los datos acumulados). El percentl 48 es equvalente a 1,384. =PERCENTIL(B:G6;0,48) Para calcular los cuartles emplearemos la funcón CUARTIL con parámetros parecdos a la funcón PERCENTIL, solo que k representa un valor del 1 al 4 (se ncluye el 0 para dentfcar el valor mínmo de los datos). CUARTIL: Calcula el cuartl k de un conjunto de datos. (Sendo k un valor entre 0 y 4) Formato: CUARTIL(matrz;cuartl) Categoría: Estadístca 170

Hallemos el cuartl 3, el cual el representa el 75% de los datos acumulados. Desde la celda B9 actvemos la funcón señalando en la caslla matrz los datos del ejemplo. En la caslla cuartl escrbremos 3. El valor resultante es 14,4. =CUARTIL(B:G6;3) 6.5 LAS MEDIDAS DE POSICIÓN Y EL GRÁFICO DE OJIVA El gráfco de ojva es deal para mostrar las meddas de poscón, ya que esta regstra las frecuencas acumuladas, tanto absolutas como relatvas. Analcemos la sguente tabla de frecuenca con su respectvo gráfco de ojva: 171