ESTADISTICA DESCRIPTIVA CON EXCEL 2016 Y EL COMPLEMENTO MEGASTAT

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ESTADISTICA DESCRIPTIVA CON EXCEL 2016 Y EL COMPLEMENTO MEGASTAT"

Transcripción

1 ESTADISTICA DESCRIPTIVA CON EXCEL 016 Y EL COMPLEMENTO MEGASTAT DAGOBERTO SALGADO HORTA pág. 1

2 INTRODUCCIÓN Según Allen (1996), Chao (1996), Yule y Kendal (1986) y Rvas González (1993) la estadístca es una cenca (otros nvestgadores la consderan como un conjunto de métodos) que se encarga de la recoleccón, clasfcacón, presentacón, organzacón, análss e nterpretacón de un conjunto de fenómenos, (naturales, económcos, polítcos o socales) de manera metódca y numérca, que permtan extraer conclusones de un hecho, en un momento determnado y así poder tomar decsones valederas. De acuerdo con la defncón anteror la estadístca se encarga de la recoleccón, clasfcacón, análss e nterpretacón de un conjunto de datos en una nvestgacón determnada. Según, algunos nvestgadores la estadístca, es una rama de las matemátcas que se ocupa de reunr, organzar y analzar datos numércos y que ayuda a resolver problemas como el dseño de expermentos y la toma de decsones. Tambén, se puede decr que es una rama de las matemátcas que utlzando un conjunto de métodos y técncas se encarga de la recoleccón, organzar, presentacón, analzar e nterpretacón de datos naturales, económcos, polítcas, socales, etc, para presentar los resultados obtendos y sacar conclusones váldas basadas en dcho análss y así poder tomar una decsón. La funcón prncpal de la estadístca es elaborar prncpos y métodos que ayuden a tomar decsones frente a la ncertdumbre. En realdad, muchos autores defnen la estadístca actualmente como un método de toma de decsones frente a la ncertdumbre. La estadístca puede presentar conclusones referentes úncamente al grupo estudado, o puede generalzarlas para grupos mayores. La estadístca es una cenca que soporta la mayoría de estudos en cualquera de los campos partculares de la cenca. Decsones empresarales, son apoyadas el análss estadístco, nferencas en todo tpo nvestgacones de las dferentes áreas del conocmento y soporte de muchos análss fnanceros, son algunos de sus aportes. De la msma forma todas las cencas se benefcan del uso de la nformátca para tener mayor rapdez en el desarrollo de sus procesos, la estadístca como tal no se escapa de esta nfluenca por los grandes volúmenes de nformacón que se manejan y por ello en el mercado se presentan dferentes softwares estadístcos. No obstante, aun con la exstenca de muchos programas estadístcos, la gran mayoría presentan nconvenentes por altos costos en sus lcencas. Es por ello que se ha pensado en una herramenta de fácl acceso y manejo de datos como lo es la plantlla cálculo Excel 016 y el complemento Megastat programado por el Doctor Orrs para soluconar estos nconvenentes. El lbro explca detalladamente la utlzacón de plantllas de cálculo de Mcrosoft Excel en técncas estadístcas básca en la nvestgacón, como tambén el manejo de la macro Megastat como complemento a la msma hoja de cálculo. En la mayoría de las explcacones se toma como referenca la base de datos correspondente a una encuesta realzada a 500 trabajadores de una empresa que llamaremos ABC, y que se puede bajar en el sguente lnk: pág.

3 Esta base de datos contene nformacón de 500 empleados de la empresa ABC, en 10 varables como son: SEXO = sexo del empleado EDAD = edad del empleado, expresada en años EDUCACION = años de educacón FUNCION = funcón que ocupa dentro de la empresa SALARIO = salaro anual (mles de pesos) SERVICIO = años de servco EXPERIENCIA = experenca (años) ESTADO = estado cvl del empleado HIJOS = número de hjos del empleado ESTRATO = estrato socal del empleado pág. 3

4 1. CONCEPTOS FUNDAMENTALES 1.1 CONCEPTO DE ESTADÍSTICA Y SU CLASIFICACION Estadístca: se ocupa de los métodos y procedmentos para recoger, clasfcar, resumr, hallar regulardades y analzar los datos, sempre y cuando la varabldad e ncertdumbre sea una causa ntrínseca de los msmos; así como de realzar nferencas a partr de ellos, con la fnaldad de ayudar a la toma de decsones y en su caso formular predccones. Podríamos por tanto clasfcar la Estadístca en descrptva, cuando los resultados del análss no pretenden r más allá del conjunto de datos, e nferencal cuando el objetvo del estudo es dervar las conclusones obtendas a un conjunto de datos más amplo. Clasfcacón de la Estadístca Estadístca Estadístca descrptva Estadístca matemátca Estadístca no paramétrca Estadístca paramétrca Cenca que recoge y organza datos de forma sstemátca. Datos numércos sstemátcamente recolectados y organzados. Organzacón de los datos en tablas y gráfcas. Se encarga de establecer los parámetros que defnen una poblacón. Comparacón de meddas calculadas medante dstrbucones de probabldades: Pruebas estadístcas aplcadas cuando se supone que los datos "no" se dstrbuyen normalmente. Pruebas estadístcas aplcadas cuando se supone que los datos se dstrbuyen normalmente. Poblacón: Conjunto de ndvduos u objetos de nterés o meddas obtendas a partr de todos los ndvduos u objetos de nterés. pág. 4

5 Muestra: Porcón o parte de la poblacón de nterés. Tambén se puede decr que es una coleccón de undades de muestreo selecconados de un marco muestral o de varos marcos muestrales. Al número de elementos de la muestra se denota por n. Una muestra tene las sguentes característcas: a. Es representatva. b. Es adecuada. Para la determnacón del tamaño de muestra se utlzan técncas de muestreo donde dependendo de esta, se utlza correctamente las fórmulas adecuadas. Muestreo: Es una técnca estadístca por la cual se realzan nferencas o generalzacones para una poblacón examnando solo una muestra de ella. Es una técnca empleada para selecconar elementos de una poblacón. Su propósto es proporconar dferente tpo de nformacón estadístca de naturaleza cuanttatva o cualtatva. Por su gran mportanca los nvestgadores lo utlzan en los dferentes campos de saber y tambén lo usamos en la vda dara. Undad de estudo: Es el anmal persona o cosa de quen se dce algo. Es el elemento quen nos va a dar la nformacón. Es el ndvduo u objeto del cual se toman las medcones u observacones. Ejemplos: Un docente, un auxlar de educacón, un votante, una factura, una empresa, una botella de cerveza, una unversdad, una vaca, una gota de sangre, etc. Observacones: Estadístcamente son los datos que se recolectan para un estudo. Una observacón o dato es cuando una varable en sí toma un valor específco. Varables: Las varables son magntudes que pueden tener un valor cualquera de los comprenddos en un conjunto de valores de un estudo o nvestgacón determnada. Son todos aquellos datos u observacones que pueden ser expresados medante números, es decr, son característcas de una poblacón determnada, susceptble de medcón. Tpos de varables: Exsten dos tpos báscos de varables: 1) cualtatvas y ) cuanttatvas. Cuando la característca que se estuda es de naturaleza no numérca, recbe el nombre de varable cualtatva o atrbuto. Algunos ejemplos de varables cualtatvas son el sexo del empleado, funcón que ocupa dentro de la empresa, estado cvl del empleado, estrato socal del empleado. Cuando la varable que se estuda aparece en forma numérca, la varable se denomna varable cuanttatva. Ejemplos de varables cuanttatvas son edad del empleado expresada en años, años de educacón, salaro anual (mles de pesos), años de servco, experenca (años), número de hjos del empleado. Las varables cuanttatvas pueden ser dscretas o contnuas. Las varables dscretas adoptan sólo certos valores y exsten vacíos entre ellos. Ejemplos de varables dscretas son años de educacón, número de hjos del empleado. Las observacones de una varable contnua toman cualquer valor dentro de un ntervalo específco. Ejemplos de varables contnuas son edad del empleado expresada en años, salaro anual (mles de pesos), años de servco, experenca (años). pág. 5

6 Nveles de medcón: Los datos se clasfcan por nveles de medcón. El nvel de medcón de los datos rge los cálculos que se llevan a cabo con el fn de resumr y presentar los datos. Tambén determna las pruebas estadístcas que se deben realzar. Exsten cuatro nveles de medcón: nomnal, ordnal, de ntervalo y de razón. La medcón más baja, o más prmara, corresponde al nvel nomnal. La más alta, o el nvel que proporcona la mayor nformacón relaconada con la observacón, es la medcón de razón. En el caso del nvel nomnal de medcón, las observacones acerca de una varable cualtatva sólo se clasfcan y cuentan. No exste una forma partcular para ordenar las categorías. El nvel nmedato superor de datos es el nvel ordnal, sus categorías requeren de un orden, sn embargo, no es posble dstngur la magntud de las dferencas entre los grupos. El nvel de ntervalo de medcón es el nvel nmedato superor. Incluye todas las característcas del nvel ordnal, pero, además, la dferenca entre valores consttuye una magntud constante, la razón entre dos números no es sgnfcatva y el punto cero no tene sentdo. El nvel de razón es el más alto. Posee todas las característcas del nvel de ntervalo, aunque, además, el punto 0 tene sentdo y la razón entre dos números es sgnfcatva. pág. 6

7 . DISTRIBUCION DE FRECUENCIA El Análss Exploratoro de datos, antguamente llamado Estadístca Descrptva, consttuye lo que la mayoría de las personas entende como Estadístca, e nconscentemente se usa a daro. Consste en resumr y organzar los datos colectados a través de tablas, gráfcos o meddas numércas, y a partr de los datos resumdos buscar alguna regulardad o patrón en las observacones (nterpretacón de los datos)..1. Dstrbucón de Frecuencas Cuando la nformacón que se tene es un gran volumen, resulta muy convenente ordenar y agrupar los datos para manejarlos de acuerdo a la dstrbucón de frecuencas la cual consste en agrupar los datos por categorías para varables cualtatvas o en clases que estarán defndas por un límte mínmo y uno máxmo de varacón, mostrando en cada clase el número de elementos que contene o sea la frecuenca. La ordenacón de datos en cuadros estadístcos, denomnada forma tabular o tabulacón, están consttudos por datos cuanttatvos y éstos a su vez están en flas y columnas de acuerdo con las especfcacones de los datos. La tabulacón es una presentacón sstemátca de los datos estadístcos de una nvestgacón determnada, estos se presentan en forma resumda a través de las tablas o cuadros estadístcos. Cuadros estadístcos: Son esquemas organzados en los que se regstran los datos estadístcos en forma organzada con la frecuenca de cada uno de estos, los msmos se observan en columnas y flas con la fnaldad de presentar la nformacón recoplada de una nvestgacón o estudo determnado. Por lo tanto, los cuadros estadístcos es una ordenacón de datos numércos en flas y columnas con las especfcacones correspondentes acerca de la naturaleza de los datos. Consttuye una forma útl de presentar los datos estadístcos obtendos en una nvestgacón a través de cuadros, tablas y gráfcos. Esta puede presentar la nformacón para referencas generales o para un uso específco o partcular. Los cuadros estadístcos están compuestos por las sguentes partes: título: Qué son los datos ncludos en el cuerpo de la tabla?, Dónde está el área representada por los datos?, Cómo están los datos clasfcados?, Cuándo ocurreron los datos? Concepto o Columnas Matrz: La descrpcón en hlera de la tabla son llamados conceptos; y estos son colocados al lado zquerdo de la tabla. La naturaleza de las clasfcacones es ndcada por los encabezados de las columnas, ncluyendo la columna matrz. pág. 7

8 Cuerpo del cuadro: El cuerpo del cuadro es la parte que contene los datos estadístcos presentados en éste. Cada dato ndvdual ocupa en el cuadro un lugar que corresponde a la nterseccón de una fla y una columna dada; por tanto, el sgnfcado de los datos en un lugar está ndcado por las especfcacones o partdas combnadas de la columna y la fla que se nterceptan. Fuentes: Las fuentes de datos o smplemente fuentes, es usualmente escrta debajo de las notas de pe. S los datos fueron recoplados y presentados por la msma persona, es costumbre no establecer la fuente en la tabla. El objeto de la ndcacón de las fuentes de los datos es el de proporconar el debdo reconocmento a la persona u organsmo que recopló y /o publcó los datos, además de ndcar, a quenes deseen amplar la nformacón, el orgen de la msma... Representacón Gráfca El patrón de varacón de los datos puede aprecarse mejor representando gráfcamente la nformacón contenda en el cuadro. Son expresones en forma de fgura, de nformacón orgnada de un conjunto de datos estadístcos, que explcan un fenómeno determnado. Son descrpcones de operacones y demostracones que se representan por medo de fguras o sgnos, los msmos se realzan con los valores de los cuadros estadístcos. En otras palabras, es una representacón de la relacón entre varables, que se realza en un plano determnado. El fn que persgue todo gráfco es el de dar una dea rápda de la stuacón que en ese momento se está nvestgando. Por tal motvo, la presentacón de los datos por medo de gráfcos debe ser de una forma smple y de una compresón fácl. Es preferble construr un conjunto de gráfcos en donde cada uno de ellos presente un aspecto sencllo de una stuacón determnada, que presentar un solo gráfco en el cual se observen demasadas relacones que se haga dfícl estudar de una forma efectva. Por lo tanto, no debe sobrecargarse un gráfco para tratar de mostrar demasadas categorías, ya que, la smplcdad es una de la característca básca de estos. Partes de un gráfco estadístco Numeracón. Título: Aquí se señala la poblacón en estudo y la varable de nterés. Dagrama: está dado por el propo dbujo, el cual representa el comportamento de los datos. Escalas y/o leyendas: Son ndcadores donde se precsa la correspondenca entre los elementos del gráfco y la naturaleza de las meddas representadas. Fuente: Aquí se señala el cuadro de frecuencas que permtó obtener el respectvo gráfco. pág. 8

9 Crteros para construr gráfcos No exste una regla específca para la construccón de gráfcos, pero s es posble consderar algunas recomendacones o crteros. Se emplea una dversdad de gráfcos, cuya estructura o forma dependerá del tpo de varable que se está estudando. Este gráfco debe tener rasgos smples y de fácl comprensón. Exste una gran varedad de tpos de gráfcos entre los que se pueden menconar los pctogramas, cartogramas, de cuadrados, de trángulos y círculos proporconales, de sectores crculares, de barras, lneales, estereogramas, polares, etc., pero los más utlzados y de nterpretacón senclla son los: Los gráfcos de barras, los de sectores crculares y los lneales. Solo se estudarán las sguentes gráfcas: 1.- Dagrama de Líneas..- Dagrama de Barras. 3.- Dagrama Crcular o de Pastel. 4.- Hstograma. 5.- Polígono de Frecuenca. 6.- Polígono Acumulatvo (OJIVA). Los dagramas de líneas, el hstograma, el polígono de frecuenca y la ojva son gráfcos cartesanos porque para su construccón requeren del plano cartesano, a estos se le denomnan en térmnos generales gráfcos de líneas. El dagrama de barras y el de pastel se les denomna gráfcos de sectores, puesto que, no requeren del plano cartesano para su construccón. Cabe aclarar que tanto las tablas como los gráfcos deben acatar las órdenes según el tpo de norma con las que se trabaje, ya sea Icontec, Apa, Vancouver, etc. El objetvo que corresponde ahora es presentar los prncpales procedmentos de Análss Exploratoro de datos, en cuanto a su parte tabular y gráfca, para algunas de las dstntas varables de la base de datos menconada anterormente, tanto en la plantlla de cálculo Excel, como en el complemento Megastat. Los procedmentos fueron realzados utlzando Mcrosoft Excel 016, aunque son Muy parecdos a los de otras versones de esta hoja de cálculo de Mcrosoft Offce..3. Instruccones para las varables cualtatvas pág. 9

10 Cuando se quere realzar un análss descrptvo en donde úncamente se toman varables cualtatvas, lo más habtual es construr tablas de frecuenca para cada varable ndvdualmente, o tablas de contngenca relaconando dos varables. Los gráfcos pueden ser creados a partr de las tablas. Para las varables cualtatvas en Excel 016 necestamos utlzar las tablas dnámcas Tabla de frecuenca y gráfcos de la varable ESTADO (cualtatva nomnal) a) en la barra de menú seleccone nsertar Tabla dnámca, vea la Fgura 1. Fgura 1 Insertar Tabla dnámca b) escoja la opcón Tabla o rango y seleccone toda la base de datos (A1:J501) ncluyendo los nombres de las varables (etquetas). Fgura Fgura Crear Tabla dnámca pág. 10

11 c) Elja dónde desea colocar el nforme de tabla dnámca (nueva hoja de cálculo o hoja de cálculo exstente), por defecto escogemos hoja de cálculo exstente y seleccone aceptar, aparece la aparenca de la Fgura 3 Fgura 3 Campos de la Tabla dnámca Observe a la derecha los nombres de las varables exstentes en el archvo de datos, y que fueron selecconados en el paso anteror. Como exste nterés úncamente en la varable ESTADO debemos selecconarla e nmedatamente aparece en el campo FILA. Las otras varables no formarán parte de la tabla. Debemos arrastrar tambén la varable ESTADO para el campo VALORES. Eso es necesaro para especfcar la accón que la tabla deberá ejecutar. La accón a realzar es el conteo de los valores, tal como es mostrado en la Fgura 4. pág. 11

12 Fgura 4 Tabla dnámca de la varable ESTADO Cabe precsar que esta tabla como su nombre lo ndca queda de forma dnámca, de tal manera que selecconando la pestaña al lado derecho de la palaba ESTADO, podemos escoger las categorías que deseemos. Ahora s se quere a partr de ella generar una tabla más completa con sus respectvas frecuencas relatvas, la copamos y la pegamos en otro especo cualquera de la hoja de cálculo, y se procede a generar los porcentajes de la sguente forma: Selecconamos la tabla dnámca y la pegamos más abajo (en nuestro ejemplo a partr de la celda M18). Fgura 5, en las celdas N18 y O18, escrbmos respectvamente n (frecuenca absoluta) y h% (frecuenca relatva). Ahora en la celda O19 escrbmos la sguente formula: =N19/$N$4, y la copamos para las demás celdas hasta la O4. pág. 1

13 Fgura 5 Generacón Tabla de frecuencas varable ESTADO Fnalmente, la tabla de frecuencas para la varable nomnal ESTADO con su respectvo título será: Tabla No 1: Dstrbucón de frecuencas del estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. ESTADO n h% Casado 95 19% Separado 104 1% Soltero 105 1% Unón Lbre 93 19% Vudo 103 1% Total general % A partr de los resultados de la tabla dnámca, es posble tambén construr gráfcos. Para realzar esta actvdad, se seleccona la tabla dnámca, parándose en la celda donde está la palabra ESTADO. En la barra de menú selecconamos nsertar Columna en -D, y en el cuadro de desplegue selecconamos el gráfco adecuado (en nuestro caso las barras smples) Fgura 6. Parados en la gráfca se puede r a dseño rápdo y mejorarla. Tambén se puede modfcar una sere de aspectos en su pág. 13

14 aparenca, tales como escala, colores, títulos, entre otras. Se puede cambar el tpo de gráfco selecconando el msmo y escogendo la herramenta Cambar tpo de gráfco (por ejemplo, por un dagrama de sectores. Los gráfcos generados son los mostrados en la fgura 6 y 7. Fgura 6 Generacón de gráfcos varable ESTADO Grafca No 1: Dagrama de barras del estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. pág. 14

15 Grafca No : Dagrama crcular del estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. Se puede de esta forma generar nterpretacones de la varable ESTADO. Por ejemplo: Cas en proporcones guales, el estado cvl de los empleados de la empresa ABC, se encuentra repartdo para cada una de las dferentes categorías..3.. Tabla de frecuenca y gráfcos de la varable ESTRATO (cualtatva ordnal) Sguendo los msmos pasos de la varable ESTADO, y tenendo cudado en ordenar las categorías (bajo-medo-alto), se tabula y grafca la varable ESTRATO, la únca dferenca es que la tabla de dstrbucón de frecuenca tene dos nuevas columnas (N y H%), frecuenca absoluta acumulada y frecuenca relatva acumulada respectvamente. Para generar N, nos ubcamos para nuestro caso en la celda P1, y colocamos la fórmula: =N1, luego desde la celda P, escrbmos: =P1+N, y arrastramos esta celda hasta la últma frecuenca absoluta acumulada (P3), de gual forma para generar H%, nos ubcamos en la celda Q1, y colocamos la fórmula: =O1, luego desde la celda Q, escrbmos: =Q1+O, y arrastramos esta celda hasta la últma frecuenca relatva acumulada (Q3). Ver Fgura 7 pág. 15

16 Fgura 7 Generacón Tabla de frecuencas varable ESTRATO La tabla de frecuencas para la varable nomnal ESTRATO con su respectvo título será: Tabla No : Dstrbucón de frecuencas del estrato socal de 500 empleados de la empresa ABC. Ibagué agosto 016. ESTRATO n h% N H% Bajo 160 3% 160 3% Medo % % Alto % % Total general % Grafca No 3: Dagrama de barras para el estrato socal de 500 empleados de la empresa ABC. Ibagué agosto 016. pág. 16

17 Alto Bajo Medo Grafca No 4: Dagrama de sectores para el estrato socal de 500 empleados de la empresa ABC. Ibagué agosto 016. Interpretacón: Un 37% (184) de los 500 empleados de la empresa ABC de la cudad de Ibagué, pertenecen al estrato medo, mentras que aproxmadamente por proporcones guales, los demás empleados pertenecen a los estratos bajo y alto. En cuanto a las frecuencas acumuladas podemos decr que 344 empleados que corresponde a un 69%, tene un estrato socal bajo o medo. pág. 17

18 .3.3. Tabla de frecuenca y gráfcos de la varable EDUCACION (cuanttatva dscreta) S la varable a analzar es dscreta, por ejemplo, Años de Educacón (EDUCACION) en la planlla base de datos, el procedmento puede ser semejante al utlzado para la varable ESTRATO, sn embargo, al construr la tabla dnámca, Excel rá a selecconar Suma de EDUCACION como accón (porque los valores de la varable son números), y se necestará modfcar eso para conteo de los valores, en confguracón de campo de valor: Cuenta de EDUCACION, sguendo el procedmento que se lustró en la Fgura 4. Luego de realzar los ajustes necesaros, se obtendrá la sguente tabla dnámca: Cuenta de EDUCACION EDUCACION Total Total general 500 Y la sguente tabla de dstrbucón de frecuencas: Tabla No 3: Dstrbucón de frecuencas de 500 empleados de la empresa ABC, según los años que se han educado. Ibagué agosto 016. EDUCACION n h% N H% % % % % % 61 5.% % % % % % % % % % % 0 0.4% % % % Total general % pág. 18

19 Las gráfcas adecuadas para una varable cuanttatva dscreta son el dagrama de líneas vertcales para las frecuencas no acumuladas (n y h%), y el dagrama de líneas horzontales para las frecuencas acumuladas (N y H%). En el caso del dagrama de líneas vertcales, se puede generar un dagrama de barras smples, como se explcó para las anterores varables, pero por opcones de sere, llevar el ancho del ntervalo al máxmo que es del 500%. Grafca No 5: Dagrama líneas vertcales para los años de educacón de 500 empleados de la empresa ABC. Ibagué agosto 016. Excel no tene la opcón de grafcar el dagrama de líneas horzontales para las frecuencas acumuladas, pero aprovechando, la opcón de bordes, un buen acercamento a este grafco es el sguente: Grafca No 6: Dagrama líneas horzontales para los años de educacón de 500 empleados de la empresa ABC. Ibagué agosto 016. pág. 19

20 Interpretacón: Esta varable nos puede nformar por ejemplo que el 40.%, correspondente a 01 empleados han tendo 1 años de educacón, y tan solo el 6.% (31 empleados), han estudado entre 19 y 1 años. En cuanto a las frecuencas acumuladas, por ejemplo, el 93.8% (469 empleados), tenen máxmo 18 años de educacón Tabla de frecuenca y gráfcos de la varable EDAD (cuanttatva contnua) La dsposcón tabular de los datos estadístcos se encuentra ordenados en clases y con la frecuenca de cada clase; es decr, los datos orgnales de varos valores adyacentes del conjunto se combnan para formar un ntervalo de clase. No exsten normas establecdas para determnar cuándo es apropado utlzar datos agrupados en clases o datos no agrupados en clases; sn embargo, se sugere que cuando el número total de datos (n) es gual o superor 50 y además el rango o recorrdo de la sere de datos es mayor de 0, entonces, se utlzará la dstrbucón de frecuenca para datos agrupados en clases, tambén se utlzará este tpo de dstrbucón cuando se requera elaborar gráfcos lneales como el hstograma, el polígono de frecuenca o la ojva. La razón fundamental para utlzar la dstrbucón de frecuenca de clases es proporconar mejor comuncacón acerca del patrón establecdo en los datos y facltar la manpulacón de los msmos. Los datos se agrupan en clases con el fn de sntetzar, resumr, condensar o hacer que la nformacón obtenda de una nvestgacón sea manejable con mayor facldad. Este tpo de dstrbucón se basa en el prncpo de que una observacón no puede consderarse dferente de otra por presentar pequeñas dferencas cuanttatvas, como por ejemplo el sueldo mensual de dos empleados que dferan en 500 pesos, de dos edades de personas adultas que dferan en un año, dos alturas de un edfco que dferan en un metro, el costo de autos nuevos que dferan en 5000 pesos, etc. Al agrupar los datos en una dstrbucón de frecuenca de clase se perde parte de la nformacón. La reduccón o agrupamento a que son sometdos los datos de una sere de valores cuando exsten muchos valores dferentes, orgnan los denomnados errores de agrupamento; sn embargo, estos errores son en general muy pequeños, razón por la cual la dstrbucón de frecuenca de clase tene una valdez estadístca práctca. pág. 0

21 Componentes de una dstrbucón de frecuenca de clase 1.- Rango o Ampltud total (recorrdo): Es el límte dentro del cual están comprenddos todos los valores de la sere de datos, en otras palabras, es el número de dferentes valores que toma la varable en un estudo o nvestgacón dada. Es la dferenca entre el valor máxmo de una varable y el valor mínmo que ésta toma en una nvestgacón cualquera. El rango es el tamaño del ntervalo en el cual se ubcan todos los valores que pueden tomar los dferentes datos de la sere de valores, desde el menor de ellos hasta el valor mayor estando ncludos ambos extremos. El rango de una dstrbucón de frecuenca se desgna con la letra R. Para obtener el rango, se tenen que dentfcar los extremos del conjunto de datos, o sea, sus valores máxmo y mínmo. Se ncará por el mínmo. Seleccone una celda donde desea que el resultado sea colocado: por ejemplo, la celda L. Seleccone esta celda con el cursor. Observe que en la barra de herramentas de Excel hay un botón llamado Insertar funcón, vea la Fgura 8. Fgura 8. Barra de herramentas de Excel: Insertar funcón S presona surgrá la pantalla vsta en la Fgura 9. pág. 1

22 Fgura 9. Funcones dsponbles en Excel Se puede selecconar una categoría, y en la parte nferor se encuentran las funcones dsponbles, con una breve descrpcón de cada una de ellas. Una de las categorías se llama: Usadas recentemente, que regstra las últmas funcones aplcadas por el usuaro, en cualquer planlla. Estamos especalmente nteresados en las categorías Matemátcas y trgonométrcas, Lógcas y, obvamente Estadístcas. Las funcones MAX y MIN se encuentran en esta últma categoría. Selecconando Estadístcas vamos a obtener el resultado de la Fgura 10. Fgura 10. Funcones Estadístcas Luego de selecconar Estadístca, basta buscar la funcón MIN: y observe la descrpcón en la parte nferor. Tambén se puede pedr ayuda a Excel sobre la pág.

23 descrpcón detallada de las funcones. Buscando detendamente, se encontrarán otras funcones estadístcas muy útles en el análss de una varable cuanttatva. Una vez selecconada la funcón y escogda la varable EDAD, (B1:B501), basta presonar ACEPTAR y para el caso de MIN se tendrá: Fgura 11. Funcón MIN El msmo resultado podría ser obtendo smplemente dgtando la fórmula drectamente en la celda: =MIN(E:E475). Pueden ser utlzadas mayúsculas o mnúsculas. Para encontrar el valor máxmo se puede realzar un proceso análogo utlzando la funcón MAX, pero colocando el resultado en otra celda, L3 por ejemplo. Para calcular el rango se puede colar una fórmula en la celda L4, hacendo la sustraccón entre máxmo y mínmo. Los resultados pueden observarse a contnuacón: EDAD Mínmo Máxmo Rango Fgura 1. Rango de la varable EDAD La menor edad es 9,84 y la mayor de 71,87, resultando en un rango de 4,03 aproxmando a dos decmales. Este rango es el que se necesta para la construccón de la dstrbucón en clases del conjunto de datos. pág. 3

24 .- Dvdr el rango en un número convenente de clases: Usualmente se defne el número de clases (m), utlzando la ecuacón de Sturges, m = * log10 (n), como en nuestro caso n = 500 empleados, tenemos que el número de clases es aproxmadamente gual a 10. De acuerdo a esto, la ampltud (o ancho de clase) sería gual al cocente entre el rango y el número de clases (R/m), dando como resultado, A = 4,03, esta ampltud la aproxmamos a dos decmales (con este formato se está trabajando) por exceso, es decr, 4,1. Inmedatamente y para corregr dcha aproxmacón, redefnmos el rango, el mínmo y el máxmo de la sguente manera: R = A x m = 4,1 x 10 = 4,1 R R = 4,1 4,03 = 0,07 Esta dferenca la dvdmos en dos números los más equtatvos, pero con dos decmales, para mantener el formato, es decr 0,03 y 0,04, uno de estos números lo restamos del mínmo y el otro se lo sumamos al máxmo, lo cual quedaría: Mínmo redefndo = 9,84 0,03 =9,81 Máxmo redefndo = 71,87 + 0,04 =71, Generacón de ntervalos, marca de clase y frecuencas: Ahora en Excel Colocamos las convencones que aparecen en la tabla. Para ello escogemos unas celdas vacías, por ejemplo, de K13 a Q13. Fgura 14 L: Ls: Y: n: h%: N: H%: Límte nferor Límte superor Marca de clase Frecuenca absoluta Frecuenca relatva Frecuenca absoluta acumulada Frecuenca relatva acumulada En K14, colocamos el mínmo redefndo (9,81) y en L14, escrbmos la fórmula =K que es el valor de la ampltud, luego en la celda K15 escrbmos =L14, posterormente arrastramos las celdas K15 y L15, hasta K3 y L3, completando de esta manera las dez clases donde se dstrburán las edades de los 500 empleados. Ahora las marcas de clase utlzan la sguente fórmula: Y = (L + Ls)/. Desde la celda M14, escrbmos: =(K14+L14)/, y ubcados en la msma celda, la arrastramos Hasta M3. pág. 4

25 Fgura 1. Funcón frecuenca Para la frecuenca absoluta (n), se seleccona el rango desde la celda N14 a N3, se presona y surgrá la pantalla vsta en la Fgura 1. Escogemos la funcón frecuencas, y damos aceptar. Aparece el cuadro de la fgura 13 Argumentos de funcón. Fgura 13. Argumentos de la funcón frecuenca En datos selecconamos la varable EDAD (B1:B501), y en grupos el rango de los límtes superores del ntervalo (L14:L3), no oprmmos aceptar, se oprmen las teclas CTRL+MAYÚS+Entrar a la vez, de lo contraro solo se mostrará el valor de la celda N14. El msmo resultado podría ser obtendo smplemente dgtando la fórmula pág. 5

26 drectamente en la celda: =FRECUENCIA(B1:B501;L14:L3), preva seleccón del rango desde la celda N14 a N3. Pueden ser utlzadas mayúsculas o mnúsculas. Para las demás frecuencas se repte el msmo procedmento de la varable dscreta. Fgura 14. Generacón Tabla de frecuencas varable EDAD Fnalmente, la tabla de dstrbucón de frecuencas con su respectvo título será: Tabla No 4: Dstrbucón de frecuencas de 500 empleados de la empresa ABC, según la edad en años. Ibagué agosto 016. L Ls Y n h% N H% % % % % % % % % % % % % % % % % % % % % TOTAL % pág. 6

27 Esta tabla puede ser usada para construr un hstograma. Selecconando los ntervalos de la tabla, pero cada ntervalo en una sola celda, la frecuenca absoluta (n), escogendo el gráfco de columnas, y reducendo el ancho del ntervalo a cero, entre otros ajustes, tal como se muestra en la Fgura 15. Intervalos n Fgura 15. Tabla para generar el hstograma de la varable EDAD Grafca No 7: Hstograma de frecuencas para los años de educacón de 500 empleados de la empresa ABC. Ibagué agosto 016. S se seleccona el grafco y se escoge la opcón Dseño Cambar tpo de gráfco Gráfcos recomendados Línea, se puede obtener el polígono. Fgura 15 pág. 7

28 Fgura 16. Generacón del polígono de frecuencas para la varable EDAD Grafca No 8: Polígono de frecuencas para los años de educacón de 500 empleados de la empresa ABC. Ibagué agosto 016. Ahora con la tabla que se muestra en la Fgura 17, se puede construr la ojva. Selecconando los ntervalos de la tabla, pero cada ntervalo en una sola celda, la frecuenca absoluta acumulada (N), escogendo el gráfco de líneas con marcadores, y realzando los ajustes necesaros. pág. 8

29 Intervalos N Fgura 17. Tabla para generar la ojva de la varable EDAD Grafca No 9: Ojva de frecuencas para los años de educacón de 500 empleados de la empresa ABC. Ibagué agosto 016. Algunas nterpretacones: 14 empleados que corresponden al 8.4%, tene una edad comprendda entre 34,0 y 38,3 años, con un promedo de 36,13 años. 393 empleados que corresponden al 78.6%, tene una edad máxma de 55,07 años Tabla de frecuenca bdmensonal (contngenca) y gráfco de la varable FUNCION vs ESTADO ( varables cualtatvas) pág. 9

30 El procedmento es smlar al descrto en el ncso.3.1, pero ahora serán utlzadas dos varables, tenendo como propósto construr una tabla de contngenca. Las nstruccones descrtas en las lterales a) a la c) del ncso.3.1 pueden ser repetdas lteralmente. Las dferencas comenzan a aparecer cuando se hace el dseño de la tabla. Se arrastra una de las dos varables a FILAS, la otra a COLUMNAS, y cualquera de las dos a VALORES, como lo ndca la fgura 18. Fgura 18. Tabla dnámca de contngenca para las varables FUNCION vs ESTADO La tabla de frecuencas absoluta bdmensonal con su respectvo título será: Tabla No 5: Dstrbucón de frecuencas de la funcón de desempeño vs el estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. Cuenta de FUNCION ESTADO FUNCION Casado Separado Soltero Unón Lbre Vudo Total general Gerenca Ofcna Servcos Generales Total general S cada celda se dvde por el tamaña de muestra (500), y se le da el formato porcentaje, se obtene la tabla de frecuencas relatva bdmensonal. pág. 30

31 Tabla No 6: Dstrbucón de frecuencas porcentual de la funcón de desempeño vs el estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. ESTADO FUNCION Casado Separado Soltero Unón Lbre Vudo Total general Gerenca 1.8% 4.8% 3.6% 4.0% 3.4% 17.6% Ofcna 15.8% 14.6% 16.0% 13.8% 16.8% 77.0% Servcos Generales 1.4% 1.4% 1.4% 0.8% 0.4% 5.4% Total general 19.0% 0.8% 1.0% 18.6% 0.6% 100% Grafca No 10: Dagrama de barras compuestas de la funcón de desempeño vs el estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. Grafca No 11: Dagrama de barras apladas de la funcón de desempeño vs el estado cvl de 500 empleados de la empresa ABC. Ibagué agosto 016. pág. 31

32 Algunas nterpretacones: De los 500 empleados de la empresa ABC, 80 que corresponden al 16%, trabajan en ofcna y son solteros. De los 500 empleados de la empresa ABC, 17 que corresponden al 3.4%, son gerentes y actualmente se encuentran vudos..4. Ejerccos 1. Elaborar las tablas y grafcas con sus respectvos títulos e nterpretacones, de las sguentes varables, correspondentes a la plantlla base de datos. SEXO, = edad del empleado, expresada en años FUNCION = funcón que ocupa dentro de la empresa SALARIO = salaro anual (mles de pesos) SERVICIO = años de servco EXPERIENCIA = experenca (años) ESTRATO = estrato socal del empleado Para el caso bdmensonal, cruce las varables FUNCION vs ESTRATO. Clasfca las sguentes varables como cualtatvas o cuanttatvas, y a estas últmas como contnuas o dscretas. Identfque su escala de medcón. a) Intencón de voto de un colectvo b) Nº de cartas que se escrben en un mes c) Número de calzado pág. 3

33 d) Nº de Km. recorrdo en un fn de semana e) Marcas de cerveza f) Nº de empleados de una empresa g) Altura h) Temperatura de un enfermo 3. Muchas de las personas que nverten en bolsa lo hacen para consegur benefcos rápdos, por ello el tempo en que mantenen las accones es relatvamente breve. Preguntada una muestra de 40 nversores habtuales sobre el tempo en meses que han mantendo sus últmas nversones se recogeron los sguentes datos Construye una tabla de frecuencas que recoja adecuadamente esta nformacón, y haz tambén alguna representacón gráfca. 4. Investgados los precos por habtacón de 50 hoteles de una cudad se han obtendo los sguentes resultados Determínese: a) La dstrbucón de frecuencas de los precos. b) Porcentaje de hoteles con un preco superor a 750. c) Cuántos hoteles tenen un preco mayor o gual que 500 pero menor o gual a d) Representar gráfcamente dchas dstrbucones. pág. 33

34 5. El goberno desea saber s el número medo de hjos por famla ha descenddo respecto a la década anteror. Para ello ha encuestado a 50 famlas respecto al número de hjos y ha obtendo los sguentes datos: a) Construye la tabla de frecuencas a partr de estos datos. b) Cuántas famlas tenen exactamente tres hjos? c) Qué porcentaje de famlas tenen exactamente 3 hjos? d) Qué porcentaje de las famlas de la muestra tenen más de dos hjos? Y menos de 3? e) Construye el grafco que consderes más adecuado con las frecuencas no acumuladas f) Construye el gráfco que consderes más adecuado con las frecuencas acumuladas. 6. En un hosptal se desea hacer un estudo sobre los pesos de los recén nacdos. Para ello, se recogen los datos de 40 bebes y se tene: Se pde: a) Construr la tabla de frecuencas b) S sabemos que los bebes que pesan menos de 3 klos nacen prematuramente Qué porcentaje de nños prematuros han nacdo entre estos 40? c) Normalmente los nños que pesan más de 3 klos y medo no necestan estar en la ncubadora Puedes decrme que porcentaje de nños están en esta stuacón? d) Representa gráfcamente la nformacón recogda 7. En una fnca de apartamentos en el Tolma, se reúne la comundad de vecnos para ver s contratan una persona que les lleve la contabldad. El resultado de la votacón es el sguente: 5 vecnos a favor de la contratacón, pág. 34

35 15 vecnos en contra y 5 vecnos se abstenen. Construye la tabla de frecuencas para estos datos y representa gráfcamente la nformacón recogda medante un dagrama de sectores. pág. 35

36 3. ESTADISTICOS Son meddas de resumen que se calculan dentro de las muestras. Se clasfcan en: a) Meddas de poscón b) Meddas de dspersón c) Meddas de forma d) Meddas de concentracón 3.1. Meddas de poscón: El análss estadístco de una sere de datos se elabora medante el cálculo de dferentes estadístcos. Después que los datos han sdo reundos y tabulados, se nca el análss con el fn de calcular un número únco, que represente o resuma todos los datos. Por lo general, las frecuencas de los ntervalos centrales de una sere de datos son mayores que el resto, ese número se le denomna medda de poscón. Una medda de poscón es un número que se escoge como orentacón para hacer mencón a un grupo de datos. Uno de los problemas fundamentales que presenta un análss estadístco, es el de buscar el valor más representatvo de una sere de valores. El prmer paso que hay que realzar para que se entenda una larga sere de valores u observacones, es el de resumr los datos en una dstrbucón de frecuenca; esto no es sufcente para fnes practco, puesto que a menudo es necesaro una sola medda descrptva, y en especal cuando se requere comparar dos o más sere estadístcas. Es necesaro contnuar el proceso de reduccón hasta susttur todos los valores observados por uno solo que sea representatvo, de tal forma que permta una nterpretacón global del fenómeno en estudo; para que ese valor sea representatvo debe reflejar la tendenca de los datos ndvduales de la sere de valores. Un valor o dato de la sere con estas característcas recbe el nombre de promedo, meda o medda de poscón, esto es debdo a su ubcacón en la zona central de la dstrbucón. Las meddas de poscón son de gran mportanca en el resumen estadístco, ya que representan un gran número de valores ndvduales por uno solo. El valor más representatvo de un conjunto de datos por lo general no es el valor más pequeño n el más grande, es un número cuyo valor se encuentra en un punto ntermedo de la sere de datos. Por lo tanto, un promedo es con frecuenca un valor referdo que representará la medda de poscón de la sere de valores. Las meddas de poscón se emplean con frecuenca como mecansmo para resumr un gran número de datos o cantdades con la fnaldad de obtener un valor que sea representatvo de la sere. Las Prncpales Meddas de Poscón son: a) La Meda Artmétca, b) La Medana, c) La Moda, d) Los cuartles, e) Los Decles y f) Los Percentles Característcas de las meddas de poscón Deben ser defndas rgurosamente y no ser susceptbles de dversas nterpretacones. pág. 36

37 Deben depender de todas las observacones de la sere, de lo contraro no sería una característca de la dstrbucón. No deben tener un carácter matemátco demasado abstracto. Deben ser susceptbles de cálculo algebraco, rápdo y fácl Meda artmétca: La meda artmétca ( X ) o smplemente la meda es el parámetro de poscón de más mportanca en las aplcacones estadístcas. Se trata del valor medo de todos los valores que toma la varable estadístca de una sere de datos. Por lo tanto, la medda posconal más utlzada en los estudos estadístcos vene a ser la meda. Por su fácl cálculo e nterpretacón, es la medda de poscón más conocda y más utlzada en los cálculos estadístcos. La meda es el valor más representatvo de la sere de valores, es el punto de equlbro, es el centro de gravedad de la sere de datos. La meda artmétca por lo general se le desgna con. La meda artmétca de una sere de N valores de una varable X1, X, X3; X4,...Xn, es el cocente de dvdr la sumatora de todos los valores que toma la varable X, entre el número total de ellos. La fórmula se puede expresar así: n X X 1 X. N Desvacones o desvíos. - Son dferencas algebracas entre cada valor de la sere o cada punto medo y la meda artmétca de dcha sere, o un valor cualquera tomado arbtraramente. Los desvíos o desvacón se desgnan con la letra d. Dado una sere de valores X1, X, X3,...Xn, se llama desvío a la dferenca entre un valor cualquera X de la sere y un valor ndcado k de esa msma sere. S el valor ndcado k de la sere corresponde precsamente a la meda artmétca de esos valores dados, se dce entonces que los desvíos son con respecto a la meda artmétca. En símbolo: d ( X X ). Propedades de la meda artmétca 1. La suma de las desvacones con respecto a la meda artmétca es gual a cero. d 0.. La suma de las desvacones al cuadrado de los dversos valores con respecto a la meda artmétca es menor que la suma de las desvacones al cuadrado de los dversos valores con respecto a cualquer punto K, que no sea la meda artmétca. X X X K. 3. La meda artmétca total o conjunta de dos o más sere de datos, se puede calcular en funcón de las medas artmétcas parcales y del número de datos de cada una de ellas, medante la sguente formula: pág. 37

38 n1 X1 n X n3 X 3... nk X X k 1 X X 3 X k X t..., N n1 n n3 nk Donde: N n n n... n, en esta n1, n, n3 y nk es el número de datos de cada 1 3 k sere. Además, X 1..,. X.,.,.. X 3.,., y.. X k.,.. son las medas de cada una de las seres. 4. La meda del producto de una constante por una varable, es gual al producto de la constante por la meda de la varable. KX KX X KX. N N 5. La meda de la suma de una constante más una varable, es gual a la meda de X K X K la varable más la constante. X X K X K.., de n n n la msma forma se cumple esta propedad para la resta. Característcas prncpales de la meda artmétca 1. El valor de la meda depende de cada una de las meddas que forman la sere de datos, y se halla afectada excesvamente por los valores extremos de la sere de datos.. La meda se calcula con facldad y es únca para cada caso y permte representar medante un solo valor la poscón de la sere de valores. 3. La meda es una medda de poscón que se calcula con todos los datos de la sere de valores y es susceptble de operacones algebracas. Cálculo de la meda para datos no agrupados Para calcular la meda de datos no agrupados en clases se aplca la sguente formula: X X. En donde N es el número total de datos y X son los valores de N la varable. Ejemplo: Calcule la meda artmétca de los sguentes valores: X 5,.7,.8,.9.,11.,.14 pág. 38

39 X X 9. Por lo tanto, la meda es 9. N 6 6 Cálculo de la meda para datos agrupados Cuando se construye una dstrbucón de frecuenca, los datos se agrupan en clases defndas por unos límtes. Cuando se trabaja con la dstrbucón de frecuenca se parte del supuesto de que todos los datos comprenddos en un ntervalo de clase se dstrbuyen unformemente a lo largo de este, entonces se puede tomar la marca de clase o punto medo ( X ) del ntervalo como adecuada representacón de los valores que conforman el menconado ntervalo. El punto medo se desgna con la letra X. Para calcular la meda en estas condcones se pueden utlzar los pasos a sguentes: Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos medos de cada clase y se colocan en sus respectvas columnas, se determnan las frecuencas de cada clase y se ubcan en sus respectvas columnas. Se multplcan los puntos medos de cada clase por sus respectvas frecuencas, luego se obtene la sumatora de las frecuencas (f) multplcadas por el punto medo ( X ) así: f X. Luego se calcula la meda artmétca aplcando la fórmula: f X f X X... Donde.. N es gual al número total de datos. f representa f N N la frecuenca absoluta, que en el capítulo de dstrbucones de frecuencas se ha denotado como n. Ejemplo: Calcule la meda de la sguente dstrbucón de frecuenca correspondente al peso en Kg de un grupo de obreros. Realce los cálculos respectvos para completar el sguente cuadro. CLASES f f N =360 pág. 39

40 CLASES X f f X TOTAL f N =360 Aplcando la formula se tene: 380 f X X Kg N 360 f X La medana: La medana (Md) es una medda de poscón que dvde a la sere de valores en dos partes guales, un cncuenta por cento que es mayor o gual a esta y otro cncuenta por cento que es menor o gual que ella. Es por lo tanto, un estadístco que está en el medo del ordenamento o arreglo de los datos organzados, entonces, la medana dvde la dstrbucón en una forma tal que a cada lado de la msma queda un número gual de datos. Para encontrar la medana en una sere de datos no agrupados, lo prmero que se hace es ordenar los datos en una forma crecente o decrecente y luego se ubca la poscón que esta ocupa en esa sere de datos; para ello hay que determnar s la sere de datos es par o mpar. S el número N de datos es mpar, entonces la N 1 poscón de la medana se determna por la fórmula: p Md, luego el número que se obtene ndca el lugar o poscón que ocupa la medana en la sere de valores. Para obtener la poscón de la medana en una sere de datos no agrupados, N en donde el número N de datos es par, se aplca la formula P Md El resultado obtendo, es la poscón que ocupara la medana, pero en este caso se ubca la poscón de la medana por ambos extremos de la sere de valores y los dos valores que se obtengan se le saca la meda y esta será la medana buscada, por lo tanto la medana, en este caso, es un número que no se encuentra dentro de la sere de datos dados. Ejemplos: Sean los sguentes datos, 5, 1, 7, 8, 10, 6, y 9, los años de servcos de un grupo de trabajadores. Determne la medana. Lo prmero que se hace es ordenar los datos en forma crecente o decrecente; luego se aplca la formula P N 1 Md, para ubcar la poscón de la medana. Los datos ordenados quedaran así: 5, 6, 7 1 7, 8, 9, 10, 1. La poscón pmd 4. Esto ndca que la medana ocupa la pág. 40

41 poscón 4 en la sere de valores y por lo tanto esa poscón corresponde a los números 8 y 9 que en este caso ocupan la poscón por la zquerda y por la derecha, 8 9 por lo tanto la Md vene a ser la semsuma de ambas poscones 8.5 en este caso 8.5 es la medana. Cuando los valores de los datos brutos de un conjunto de datos se agrupan en una dstrbucón de frecuenca de clase, cada valor perde su dentdad, por tal motvo la medana obtenda de una dstrbucón de frecuenca de datos puede no ser la msma que la medana obtenda de los datos sn arreglar en clases, pero el resultado será una aproxmacón. Cuando se obtene la medana para datos agrupados se utlza el método de nterpolacón. La nterpolacón parte del supuesto de que los datos de cada ntervalo de la dstrbucón están gualmente dstrbudos. Pasos para determnar la medana en datos agrupados Se elabora la tabla de frecuenca de datos con sus dferentes ntervalos de clases, se ubcan las frecuencas f (n) y se calculan las frecuencas acumuladas Fa (N)de esa dstrbucón. Se determna la ubcacón o poscón de la medana en el ntervalo de la N dstrbucón de frecuenca, medante la fórmula P Md. El resultado obtendo determnará la clase donde se encuentra ubcada la medana, lo cual se consegurá en la clase donde la frecuenca acumulada Fa sea gual o superor a este resultado. N Faa Luego se aplca la fórmula: Md L Ic, en esta fórmula Md es la fm medana, L es el límte real nferor de la clase donde se encuentra ubcada la medana, Faa es el valor de la frecuenca acumulada anteror a la clase donde se encuentra la medana, fm es el valor de la frecuenca f de la clase donde se encuentra la medana, Ic es el valor o longtud del ntervalo de clase y N es el número total de datos de la dstrbucón en estudo. Ejemplo: Dada la sguente dstrbucón de frecuenca referda a las horas extras laboradas por un grupo de obreros. Calcule la medana. Realce los cálculos respectvos para completar el sguente cuadro. N de horas Extras Obreros CLASES f pág. 41

42 N = 13 Cuadro con las frecuencas acumuladas: N de horas Extras Obreros Obreros CLASES f fa N = 13 N Faa Ahora se aplca la fórmula: Md L Ic fm N 13 N = 13, 66, luego la medana se encuentra en la clase , por lo tanto el lmte real nferor de esa clase es 69.5 = L. La frecuenca f de esa clase es 50 = fm, Faa = 44 y el Ic = 5. Aplcando la formula se tene: Md Luego la medana de esa dstrbucón es Esto quere decr que un 50 % de los obreros trabajaron horas extras por debajo de horas y el otro 50 % trabajaron horas extras por encma de horas. Característcas de la medana La medana no es afectada por los valores extremos de una sere de valores, puesto que la msma no es calculada con todos los valores de la sere. La medana no está defnda algebracamente, ya que para su cálculo no ntervenen todos los valores de la sere. La medana en algunos casos no se puede calcular exactamente y esto ocurre cuando en una sere de valores para datos no agrupados el número de datos es par, en este caso la medana se calcula aproxmadamente. pág. 4

43 La medana se puede calcular en aquellas dstrbucones de frecuenca de clases aberta, sempre y cuando los elementos centrales puedan ser determnados. La suma de los valores absolutos de las desvacones de los datos ndvduales con respecto a la medana sempre es mínma La moda: La moda es la medda de poscón que ndca la magntud del valor que se presenta con más frecuenca en una sere de datos; es pues, el valor de la varable que más se repte en un conjunto de datos. De las medas de poscón la moda es la que se determna con mayor facldad, ya que se puede obtener por una smple observacón de los datos en estudo, puesto que la moda es el dato que se observa con mayor frecuenca. La moda se desgna con las letras Mo. En las representacones gráfcas la moda es el punto más alto de la gráfca. La obtencón de la moda para datos agrupados no es un valor exacto, ya que varía con las dferentes formas de agrupar una dstrbucón de frecuenca. En algunas dstrbucones de frecuencas o sere de datos no agrupados o agrupados se presentan dos o más modas, en esta casa se habla de sere de datos bmodales o multmodales, según sea el caso. Estos tpos de dstrbucones o seres de valores se deben a la falta de homogenedad de los datos. Cuando una sere de valores es smétrca, la meda, la medana y el modo concden, y s la asmetría de la sere es moderada, la medana estará stuada entre la meda y el modo con una separacón de un terco entre ambas. Tomando en cuenta esta relacón, cuando se tengan dos de esta meddas se puede determnar la tercera; sn embargo es convenente utlzar esta relacón para calcular solamente la moda ya que para calcular la meda y la medana exsten fórmulas matemátcas que dan resultados más exactos; la fórmula matemátca para calcular la moda por medo de Mo X 3 X Md. la relacón antes menconada es: Para calcular la moda en datos agrupados exsten varos métodos; cada uno de los métodos puede dar un valor dferente de la moda: Aquí se dará un método el cual se puede consderar uno de los más precsos en el cálculo de esta. Es un método matemátco que consste en la nterpolacón medante la sguente formula: 1 Mo L. Ic, en donde Mo es la moda, L es el límte real de la clase 1 que presenta el mayor número de frecuenca; la clase que presenta el mayor número de frecuencas f se le denomna clase modal y a las frecuencas de esa clases se les denomna frecuenca modal fm, 1 es la dferenca entre la frecuenca de la clase modal ( fm) y la frecuenca de la clase anteror a la modal, la cual se desgna con fa, entonces, 1 ( fm fa) ; es la dferenca entre la frecuenca pág. 43

44 de la clase modal (fm) y la frecuenca de la clase sguente a la modal, esta se desgna con fs, entonces, ( fm fs). Ejemplo: Dada la sguente dstrbucón de frecuenca correspondente al peso en Kg de un grupo de trabajadores de una empresa, calcule la moda. CLASES f TOTAL La clase modal es , entonces L = 79.5 y su fm = 16, fa = 1 y fs =, Ic 10, entonces: f f 161 4;.. f f m a 1 m s Aplcando la formula se tene: Mo L Mo Este resultado de la moda se nterpreta así: La mayoría de los trabajadores tene un peso aproxmadamente de Kg. Característcas de la moda El valor de la moda puede ser afectado grandemente por el método de elaboracón de los ntervalos de clases. El valor de la moda no se halla afectado por la magntud de los valores extremos de una sere de valores, como sucede en la meda artmétca. La moda se puede obtener en una forma aproxmada muy fáclmente, puesto que la obtencón exacta es algo complcado. La moda tene poca utldad en una dstrbucón de frecuenca que no posea sufcentes datos y que no ofrezcan una marcada tendenca central. No es susceptble de operacones algebracas posterores. La moda se utlza cuando se trabaja con escalas nomnales, aunque se puede utlzar con las otras escalas. pág. 44

45 La moda es útl cuando se está nteresado en tener una dea aproxmada de la mayor concentracón de una sere de datos Otras meddas poscónales: Cuando se estudó la medana se pudo detectar que esta dvde la sere de valores en dos partes guales, una generalzacón de esta medda da orgen a unas nuevas meddas de poscón denomnadas: Cuartles, Decles y Percentles. Estas nuevas meddas de poscón surgen por la necesdad de requerr de otras meddas que expresen dferentes stuacones de orden, aparte de las señaladas por la medana. Por lo tanto, es nteresante ubcar otras meddas que fracconen una sere de datos en dferentes partes. Es bueno destacar que los cuarteles, los Decles y los Percentles son unas varantes de la medana: De la msma forma los percentles abarcan tanto a los cuarteles como a los Decles. Los cuartles: Son meddas poscónales que dvden la dstrbucón de frecuenca en cuatro partes guales. Se desgna por el símbolo Qa en la que a corresponde a los valores 1, y 3., que vene a ser el número de Qa que posee una dstrbucón de frecuenca de clase. El Q1 dvde la dstrbucón de frecuenca en dos partes, una corresponde a 5 % que está por debajo de Q1 y el otro 75 % por encma de Q1. El Q dvde la dstrbucón de frecuenca en dos partes guales, un 50 % que está por debajo de los valores de Q y otro 50 % que está por encma del valor de Q. El Q es gual a la medana. Cálculo de los cuartles: Para datos no agrupados no tene nnguna utldad práctca calcular los cuartles. Para el cálculo de los cuartles en datos agrupados en una dstrbucón de frecuenca exste un método por análss gráfco y otro por determnacón numérca, por fnes práctcos en esta cátedra se utlzará el últmo método. Para calcular los cuartles por el método numérco se procede de la sguente manera: Se localza la poscón del cuartl solctado aplcando la fórmula de poscón: an P Qa, en donde a vene a ser el número del cuartl solctado, N 4 corresponde al número total de datos de la dstrbucón y 4 corresponde al número de cuartles que presenta una dstrbucón de frecuenca. Luego se aplca la fórmula para determnar un cuartl determnado, así: an Faa Q L 4 a. Ic. En esta fórmula, Qa = El cuartl solctado, en esta a fm corresponde al número del cuartl solctado; L = Lmte real nferor de la clase donde se encuentra ubcado el cuartl; Faa = Frecuenca acumulada anteror a la clase donde se encuentra el cuartl; fm = Frecuenca f que posee el ntervalo de pág. 45

46 clase donde se encuentra el cuartl; an P Qa 4 = Poscón que ocupa el cuartl en la dstrbucón de frecuenca, este resultado obtendo determnará la clase donde se encuentra ubcado el cuartl, el msmo se encontrará en la clase donde la frecuenca acumulada Fa sea gual o superor a este resultado. Los decles: Son meddas de poscón que dvden la dstrbucón de frecuenca en dez partes guales y estas van desde el número uno hasta el número nueve. Los decles se les desgna con las letras Da, sendo a, el número de los dferentes decles, que en este caso son nueve. El D es el punto debajo del cual se encuentran ubcados el 0 % de los valores de la dstrbucón o tambén el punto por sobre el cual se encuentra el 80 % de los valores de la sere de datos. La medana es gual al D5, puesto que este decl dvde la dstrbucón en dos partes guale tal como lo hace la medana, de la msma forma el decl cnco es gual al cuartl dos. Cálculo de los decles: El cálculo de los decles es smlar al cálculo de los cuartles, solo que en estos varía la poscón, la msma se calcula con la fórmula: an P Da, en esta a corresponde al número del decl que se desea calcular, N 10 equvale al número de datos de la dstrbucón y 10 corresponde a las dez partes en la que se dvde la sere de valores de la dstrbucón. an Faa La fórmula para su cálculo es: D a L 10. Ic. En este caso se aplca la fm fórmula de la msma manera que se hzo para calcular los cuartles, solo que en esta fórmula vara la poscón de ubcacón de la clase donde se encuentra ubcado el decl. Los percentles: Son meddas poscóneles que dvden la dstrbucón de frecuenca en 100 partes guales. Con estos se puede calcular cualquer porcentaje de datos de la dstrbucón de frecuenca. Los percentles son las meddas más utlzadas para propóstos de ubcacón de valor de una sere de datos ubcados en una dstrbucón de frecuenca. El número de percentles de una dstrbucón de frecuenca es de 99. El percentl 50 es gual a la medana, al decl 5 y al cuartl, es decr: Md Q. D5 P50 50% por encma y 50 % por debajo de los datos de la dstrbucón. Cálculo de los percentles: es smlar al cálculo de los cuartles y los decles con una varante en la poscón de ubcacón de estos, que vene expresada por la sguente formula: an an Faa P Pa. Con esta poscón se aplca la fórmula: P a L 100. Ic. 100 fm pág. 46

47 Ejemplo: Dada la sguente dstrbucón correspondente al salaro semanal en dólares de un grupo de obreros de una empresa petrolera trasnaconal. Calcule: a) Q1, b) Q, c) Compare los resultados con la medana D3, d) D5, e) P5, f) P50, g) P7 SALARIO EN $ f Fa Totales = N 463 a) Para calcular Q1, se determna prmero la poscón así: P 1 x Q PQ1 = Con ese valor de la poscón encontrado se busca en las frecuencas acumuladas para ver cuál de esas contene ese valor. Observando las frecuencas acumuladas se puede detectar que la poscón se encuentra en la clase , por lo tanto, el L = 99.5, fm = 90, y la Faa = 85 y Ic = 100, aplcando la formula se tene: Q Este valor de Q1 ndca que el 5 % de los obreros en estudo, devengan un salaro semanal por debajo de $ y el 75 % restante gana un salaro por encma de $ b) Para calcular Q=Md se determna prmero la poscón de este así. 463 P x Q 31.5, ahora se ubca esta poscón en las frecuencas acumulados 4 para determnar la poscón de Q, se puede observar en la dstrbucón que esta poscón de Q está ubcada en la clase , entonces, L = 399.5, fm = 10, Faa = 175 y Ic = 100, aplcando la formula se tene: Q Este resultado de Q establece que el 50 % de los obreros de este estudo, devengan un salaro semanal por debajo de $ y el otro 50 % devenga un sueldo por encma de $ Calcule la medana y compárela con este resultado. pág. 47

48 c) Para determnar D3 = P30 hay prmero que calcular la poscón de este así: P 3 x D 138.9, ahora se ubca esta poscón en las frecuencas acumuladas 10 para determnar la poscón de D3, en la tabla de la dstrbucón de frecuenca se observa que D3 se encuentra en la clase , luego, L = 99.5, fm = 90, Faa = 85 y Ic = 100, aplcando la formula se tene: D Esto ndca que un 30 % de los obreros ganan un salaro semanal por debajo de $ y el 70 % restante devenga un sueldo por encma de $ d) Calcular, D5 = Q = P50, además P5 = Q1, la comprobacón de estos resultados se le deja como practca al estudante. g) Para calcular P70 lo prmero que se hace es determnar la poscón, 70x463 P P Ahora se ubca este resultado en la columna de frecuencas 100' acumuladas para encontrar la poscón de P70 en la dstrbucón de frecuenca. Como se puede observar en la tabla de dstrbucón de frecuenca, P70 se encuentra ubcado en la clase , entonces, L = 499.5, fm = 70, Faa = 95 y Ic = 100, aplcando la formula se tene: P Esto ndca que el 70 % de los obreros devengan un sueldo semanal que está por debajo de $ y que el 30 % de los restantes obreros, ganan un salaro por encma de $ Porcentajes de valores que están por debajo o por encma de un valor determnado: Muchas veces necestamos conocer el porcentaje de valores que están por debajo o por encma de un valor determnado; lo que representa un tpo de problema contraro al estudado anterormente, esto es, dado un certo valor en el eje de abscsa (X) del plano cartesano, determnar en la ordenada (Y) el tanto por cento de valores nferores y superores al valor dado. Operacón que se resuelve utlzando la sguente fórmula matemátca: p faa f ( P L 100, donde: I N c p porcentajeque se quere buscar. P Valor dado en el eje de las X (valor que se ubca en las clases). faa Frecuenca acumulada de la clase anteror a la clase donde se encuentra ubcado P. f Frecuenca de la clase donde se encuentra ubcada P. L Límte nferor de la clase donde se encuentra ubcada P. Ic Intervalo de clase. N = Número total de datos o total de frecuencas. pág. 48

49 Ejemplo: Utlzando los datos de la dstrbucón de frecuenca anteror, Determne qué porcentaje de obreros ganan un salaro semanal nferor a $ 450. Solucón: Datos: p? P 450 faa 175 L I c N = 463 Ahora se aplca la fórmula: f ( P L 100 p faa, Susttuyendo valores se tene: I N c 10( p p 463 De acuerdo con el resultado se puede afrmar que el % de los obreros devengan un salaro nferor a $ 450 y el 49.5 % de los obreros ganan un salaro superor a $ Meddas de dspersón: Las meddas de poscón central son los valores que de una manera condensada representan una sere de datos, pero realmente no son sufcentes para caracterzar una dstrbucón de frecuenca. Para descrbr una dstrbucón de frecuenca o sere de datos es necesaro, por lo menos otra medda que ndque la dspersón o varabldad de los datos, es decr, su alejamento de las meddas de poscón central. Estas meddas de poscón central no tenen nngún valor s no se conoce como se acercan o se alejan esos valores con respecto al promedo, en otras palabras, es conocer cómo se dspersan o varían esos valores con respecto al promedo de una dstrbucón de frecuenca. La dspersón o varabldad: se entende como el hecho de que los valores de una sere dferan uno de otro, es decr, como se están dspersando o dstrbuyendo en la dstrbucón. De acuerdo con esto es necesaro encontrar una medda que ndque hasta qué punto los valores de una varable están dspersos en relacón con el valor típco. Las meddas de varabldad son números que expresan la forma en que los valores de una sere de datos camban alrededor de una medda de poscón central la cual por lo general es la meda artmétca. pág. 49

50 La dspersón puede ser mayor o menor, tomando en cuenta esas dferencas. La varabldad es la esenca de la estadístca, puesto que las varables y atrbutos se caracterzan sempre por dferencas de valores entre observacones ndvduales. Cas sempre en una dstrbucón de frecuenca el promedo obtendo dfere de los datos de la sere; por esto es mportante determnar el grado de varacón o dspersón de los datos de una sere de valores con respecto al promedo. Las meddas de dspersón se clasfcan en dos grandes grupos: a) Las Meddas de Dspersón Absolutas y las Relatvas; las Relatvas, venen expresadas en las msmas meddas que se dentfcan la sere de datos, las msmas son: 1) El Recorrdo, ) La Desvacón cuartlca, 3) La Desvacón Semcuartlca, 4) La desvacón Meda, 5) La Desvacón Típca o Estándar 6) La varanza. Las Meddas de Dspersón relatva. Son relacones entre meddas de dspersón absolutas y meddas de tendenca central multplcadas por 100, por lo tanto, venen expresadas en porcentaje, su funcón es la de encontrar entre varas dstrbucones la dspersón exstente entre ellas. La medda de dspersón relatva de mayor mportanca es el Coefcente de Varacón. Se llama Varacón o Dspersón de los datos, el grado en que los valores de una dstrbucón o sere numérca tende a acercarse o alejarse alrededor de un promedo. Cuando la dspersón es baja ndca que la sere de valores es relatvamente homogénea mentras que una varabldad alta ndca una sere de valores heterogénea. Cuando los valores observados de una sere están muy concentrados alrededor del promedo, se dce que ese promedo es o será muy representatvo; pero s están muy dspersos con relacón al promedo, es decr muy esparcdos con respecto al promedo, entonces ese promedo es poco representatvo de la sere o dstrbucón, puesto que no representan adecuadamente los datos ndvduales de esa dstrbucón. Es mportante obtener una medda que ndque hasta qué punto las observacones de una sere de valores están varando en relacón con el valor típco de la sere Rango o Recorrdo (R): Es la prmera medda de dspersón, no está relaconada con nngún promedo en partcular, ya que este se relacona con los datos msmos, puesto que su cálculo se determna restándole al dato mayor de una sere el dato menor de la msma. El rango es el número de varables dferentes que posee una sere de valores. Su fórmula se calcula así: Rango(R) = Dato mayor (XM)Dato Menor (Xm) R = XM Xm. El rango es la medda de dspersón más senclla e nexacta dentro de las meddas de dspersón absoluta. pág. 50

51 3... Desvacón íntercuartlca (DC): La desvacón íntercuartlca es la dferenca que exste entre el cuartl tres (Q3) y el cuartl uno (Q1) de una dstrbucón de frecuenca y se expresa así: DC = Q3 Q desvacón sem-íntercuartlca (DSC): La desvacón sem-íntercuartlca es la dferenca entre el Q3 y el Q1 dvddo entre dos: Q 3 Q DSC 1. S los valores de la DC o DSC son pequeños ndca una alta concentracón de los datos de la dstrbucón en los valores centrales de la sere de datos. Estas meddas se utlzan para comparar los grados de varacón de los valores centrales en dferentes dstrbucones de frecuencas. Los msmos no son afectados por los valores extremos, no se adaptan a la manpulacón algebraca, por tal motvo son de poca utldad Desvacón meda: La desvacón meda de un conjunto de N observacones x1, x, x3,...xn, es el promedo de los valores absolutos de las desvacones (d) con respecto a la meda artmétca o la medana. S se denomna como DM a la desvacón meda, entonces su fórmula matemátca será la sguente: DM N X X 1 1 N N N d Esta fórmula es para datos no agrupados. Se toma el valor absoluto en la ecuacón, debdo a que la prmera propedad de la meda artmétca establece que los desvíos (d) de una sere con respecto a la meda artmétca sempre son guales a cero, es decr: d = 0. Cuando los datos están en una dstrbucón de clases o agrupados se aplca la sguente formula: DM N 1 X X N f N 1 f N d En esta fórmula X es el punto medo de cada clase y f es la frecuenca de cada clase. La Desvacón Meda a pesar de que para su cálculo se toman todas las observacones de la sere, por el motvo de no tomar en cuenta los sgnos de las desvacones (d), es de dfícl manejo algebraco. Su utlzacón en estadístca es muy reducda o cas nula, su mportanca es meramente hstórca, ya que de esta fórmula es la que da orgen a la desvacón típca o estándar. pág. 51

52 3..5. Desvacón típca o Estándar: Es la medda de dspersón más utlzada en las nvestgacones por ser la más estable de todas, ya que para su cálculo se utlzan todos los desvíos con respecto a la meda artmétca de las observacones, y, además, se toman en cuenta los sgnos de esos desvíos. Se le desgna con la letra castellana S cuando se trabaja con una muestra y con la letra grega mnúscula (Sgma) cuando se trabaja con una poblacón. Es mportante destacar que cuando se hace referenca a la poblacón él número de datos se expresa con N y cuando se refere a la muestra él número de datos se expresa con n. La desvacón típca se defne como: La raíz cuadrada postva del promedo artmétco de los cuadrados de los desvíos de las observacones con respecto a su meda artmétca. La desvacón típca es una forma refnada de la desvacón meda. Característcas de la Desvacón Típca: La desvacón típca se calcula con cada uno de los valores de una sere de datos. La desvacón típca se calcula con respecto a la meda artmétca de las observacones de una sere de datos, y mde la varacón alrededor de la meda. La desvacón típca es susceptble de operacones algebracas, puesto que para su cálculo se utlzan los sgnos postvos y negatvos de los desvíos de todas las observacones de una sere de valores, por lo tanto, es una medda completamente matemátca. Es una medda de bastante precsón, que se encarga de medr el promedo de la dspersón de las observacones de una muestra estadístca. Las nfluencas de las fluctuacones del azar, al momento de selecconar la muestra la afectan muy poco. Le da gran sgnfcacón a la meda artmétca de la sere de valores. Es sempre una cantdad postva. Interpretacón de la desvacón típca: La desvacón típca como medda absoluta de dspersón, es la que mejor nos proporcona la varacón de los datos con respecto a la meda artmétca, su valor se encuentra en relacón drecta con la dspersón de los datos, a mayor dspersón de ellos, mayor desvacón típca, y a menor dspersón, menor desvacón típca. pág. 5

53 Su mayor utldad se presenta en una dstrbucón normal, ya que en dcha dstrbucón en el ntervalo determnado por se encuentra el 68. 7% de los datos de la sere; en el ntervalo determnado por la se encuentra el 95,45% de los datos y entre la se encuentra la cas totaldad de los datos, es decr, el 99,73% de los datos; además, exste una regla general de gran utldad para la comprobacón de los cálculos que dce: una osclacón gual a ses veces la, centrada en la meda comprende aproxmadamente el 99% de los datos. Ver fgura 19. X 3 X X 68,7% 95,45% 99,73% Meda Fgura 19. Porcentajes característcos de la dstrbucón normal A la zona lmtada por la X conoce bajo el nombre de zona normal, ya que se consdera a los datos que caen dentro de esa zona, datos normales en relacón con el grupo estudado; los datos que estén por encma o por debajo de dcho ntervalo se consderan supranormales e nfranormales. Cálculo de la Desvacón Típca: La desvacón típca para calcularla se procede de dos formas: a) Para datos no agrupados en clases, b) Para datos agrupados en clases. a) Para datos no Agrupados.- Las fórmulas para determnar la desvacón típca de una S y de una son: 1.. S ( X n 1 X ) d n 1 pág. 53

54 pág. 54 Es mportante recordar que cuando se trabaja con la formula para datos no agrupados y se trata de una muestra se utlzará como denomnador n1, para corregr el sesgo. Para caular la desvacán tpca de una poblacán para datos no agrupados, se utlzan las sguentes formulas: Método para calcular la Desvacón Típca en datos no agrupados: Se calcula la meda artmétca. Se calculan los desvíos (d) de la sere de valores X, con respecto a la meda artmétca. Se elevan al cuadrado cada una de las desvacones (d), y se determna la sumatora de esos. De la msma forma se elevan al cuadrado cada uno de los X y se calcula la sumatora de estos; de gual manera se calcula la sumatora de los X y se elevan al cuadrado. Despues de hacer todos estos cálculos se elabora un cuadro estadístco con estos cálculos. 1) ( ) ( 1 ) (. 3. n n X X N n n X X S ) (.. X X d N d N X X ) ( X N X N X N X

55 Fnalmente se aplca la formula de la desvacón típca para datos no agrupados de la muestra o de la poblacón, según el caso. Ejemplo: Los sguentes valores corresponden a la edad de ñños de una muestra tomada de una poblacón: X = 3, 4, 5, 6, 7. Determne la desvacón típca. X X n X ( X X) d d = = = = = 4 X 5 d 0 d 10 Este problema se resolverá utlzando la meda artmétca y sn utlzar la meda, para ello se utlzarán las formulas 1 y S d n n X. S n( n 1) X 5( (4) Interpretacón: El resultado obtendo con las formulas 1 y 3 ndcan que en promedo, las edades de los ñños de esa muestra se desvan o varan con respecto a la meda artmétca en una cantdad gual a 1.58 años. S este problema se resuelve ahora, consderando los datos como s fueran de una poblacón y se aplca la formula 4 y 5, entonces se tene: pág. 55

56 4.. N d N X X N En la solucón del problema con las formula 4 y 5 de la poblacón se observa que la de la poblacón es menor que la S de la muestra, esto es debdo a que la S de la muestra utlzó n-1, para corregr el error producto del sesgo, y la de la poblacón no lo utlzó. b) Para datos Agrupados en Clases.- Para calcular la desvacón típca en datos agrupado exsten varos crteros en relacon a la correccón del sesgo que se produce al tomar una muestra, en este estudo se consderará la formula que corrge el sesgo de aquellas muestras en estudo; sn embargo, cuando n sea mayor que 50, no es necesaro tal correccón.. Exsten muchas formulas matemátcas para calcular la desvcón típca, queda a juco del estudante utlzar la formula que él consdere más fácl, sempre y cuando su aplcacón sea valedera. Formulas Para calcular la muestra y la poblacón de una desvacón típca con datos agrupados en clases: 1.. S ( X X ) n 1 f d f n 1 pág. 56

57 pág. 57 Para calcular la S de la fórmula 1 es necesaro calcular el punto medo de cada una de las clases de la dstrbucón, calcular la meda artmétca y luego calcular los desvíos de los puntos medos con respecto a la meda artmétca. En la formula no es necesaro calcular la meda. En la fórmula 3, X a es un valor arbtraro que se toma de los X de la dstrbucón, es recomrndable que se escoja el X lo más central posble para así facltar los calculos posterores. El térmno K, en esta formula, vene a ser un desvío arbtraro con respecto a una mda arbtrara X a.entonces, ) X (X K a. Este método para calcular S en datos agrupados, se fundamenta en la propedad de la desvacón típca que establece: s a cada una de los valores de una sere de datos se le suma una constante, la desvacón típca no se altera en sus resultados. 1.. n n f X f X S 1 n n ) X (X f ) X (X f.s 3. a a 1 n n K f K f N d f N X X f ) ( X N X f. 6. N X f N X f

58 7.. f (X N X a ) f X N f K N f K N Método para calcular la Desvacón Típca en datos Agrupados Se calcula la Se calcula el X X de cada una de las clases que ntegran la dstrbucón de frecuenca, se determnan los desvíos d de los luego se elevan al cuadrado los d y se multplcan por f, f d Se calcula la. f X, luego se determna la X f X con respecto a la Se elabora un cuadro estadístco y se llevan a este todos los datos calculados. Se aplca la formula necesara para calcular la desvacón típca.. X y se calcula la, Ejemplo: Los sguentes datos corresponden a las horas extras trabajadas por los obreros de la empresa FATEXTOL, en un mes (se resolverá consderando los datos como de una S y ). CLASES f X f X d = X X f d f X f X =7730 d d 1. 8 f = f X = Para resolver el problema lo prmero que se debe hacer es calcular la meda artmétca así: pág. 58

59 X f X n Ahora se calculan los dferentes, para determnar los otros parámetros necesaros (es recomendable que se realce todos los cálculos) para resolver el problema planteado, en el cuadro de arrba se colocaron los cálculos realzados que son necesaros para resolver el msmo; este se resolverá aplcando las formulas 1,, y 3 de la S, consderando los datos como los de una muestra. 1. S n f d S f X f X 7730 n 1 n Para aplcar la fórmula 3 se toma una meda arbtrara X a que en este caso la más céntrca es 57, luego se calculan los desvíos de los puntos medos con respecto a la así: K = ( X a X X a ) se elabora un cuadro estadístco para resumr los datos y fnalmente se procede a buscar la desvacón f X ( X X a ) =K f. K f (k) f 135 f K 35 f K 3075 pág. 59

60 3.. f K fk 35 N N Interpretacón: Los resultados obtendos con las formulas 1,, y 3, ndcan que los promedos de las horas extras laboradas por los trabajadores se desvían o varían con respecto a su meda artmétca en una cantdad gual a 4.78 y 4.76 respectvamente. La msma nterpretacón se obtene con los resultados obtendos con las formulas 4, 5 y f N d f X 5.. X N , f N X f X N La aplcacón de la fórmula 7 se deja para que el partcpante la aplque y resuelva el msmo problema, el cual tendrá resultados déntcos a los anterores. pág. 60

61 Propedades de la Desvacón Típca La desvacón típca de una constante k es cero. S se parte de que la meda artmétca de una constante es gual a la constante, esto es así, debda a que al ser todos los datos guales no habrá dspersón en la sere de datos con respecto a la meda artmétca, por lo tanto (k) = 0. S a cada uno de los valores de una sere de varables se le suma o se le resta una constante K, la desvacón típca no se altera. Esta se apoya en la propedad de la meda artmétca que establece s a cada valor de la sere se le suma una constante, la meda de la nueva sere es gual a la meda de la sere orgnal más la constante, gual sucede con la resta, la nueva meda vendrá dsmnuda en el valor de dcha constante. S a cada uno de los térmnos de la sere de valores se le multplca por una constante K, la desvacón típca de la sere quedará multplcada por K, y la nueva desvacón típca será gual a la constante K tomada en valor absoluto por la desvacón típca orgnal. Esta propedad se apoya en la propedad del producto de la meda artmétca ( X K ) ( X ). K.. ( X ). ( X. K ) Para dstrbucones normales sempre se cumple que: 68.7 % de los datos se encuentran en el ntervalo ( X ) % de los datos se encuentran en el ntervalo ( X ) % de los datos se encuentran en el ntervalo ( X 3). Estos valores se cumplen con bastante aproxmacón, para dstrbucones que son Normales y para las que son lgeramente asmétrcas. Para dos seres de valores, de tamaño n1 y n, con varacones S 1 y S, respectvamente, la varanza S T n1s n 1 1 n n S Varanza: Es otra de las varacones absolutas y la msma se defne como el cuadrado de la desvacón típca; vene expresada con las msmas letras de la desvacón típca pero elevadas al cuadrado, así S y. Las fórmulas para calcular la varanza son las msmas utlzadas por la desvacón típca, exceptuando las 1.. ( X N ).., para. datos. no. agrupados. pág. 61

62 respectvas raíces, las cuales desaparecen al estar elevados el prmer membro al cuadrado... f ( X N )..,. para. datos. agrupados. La varanza general de la muestra se expresa así: 3.. S ( X n 1 X )..,. para. datos. no. agrupados. ( f X 4.. S n 1 X )..,. para. datos. agrupados Dspersón relatva: Las meddas de varabldad, estudadas hasta ahora, solo permtían medr las dspersones absolutas de los térmnos de la muestra. Las meddas, tomadas en esas condcones, serán de utldad, solo cuando se trata de analzar una sola muestra; pero, cuando hay que establecer comparacones entre dstntas muestras, será necesaro expresar tales meddas en valores relatvos, que pueden ser proporcones o porcentajes. Las meddas de dspersón relatvas permten comparar grupos de seres dstntas en cuanto a su varacón, ndependentemente de las undades en que se mdan las dferentes característcas en consderacón. Generalmente las meddas de dspersón relatvas se expresan en porcentajes, facltando así el estudo con meddas procedentes de otras seres de valores La dspersón relatva vene a ser gual a la dspersón absoluta dvdda entre el promedo. Exsten varas meddas de dspersón relatva, pero, la más usada es el coefcente de varacón de Pearson, este es un índce de varabldad sn dmensones, lo que permte la comparacón entre dferentes dstrbucones de frecuencas, meddas en dferentes undades. El coefcente de varacón de Pearson se desgna con las letras CV. La fórmula matemátca es: CV x100. X pág. 6

63 Ejemplo: La venta en el mercado de tres productos, varía de acuerdo al sguente cuadro. Determne el CV de cada uno y dga cuál de ellos presenta mayor varacón y cuál la menor. Producto X S Undades CV Bs % Bs % Bs % Para resolver el problema se calcula el CV de cada producto y luego sé determna cuál presenta mayor o menor varacón CV = Sx100/ X CV1 = 5x100/45 = %. CV = 40x100/450 = 8.87 %. CV3 = 350x100/4500 = 7.78 %. Se puede observar que la menor dspersón la presenta el producto 3, por lo tanto, de los 3 productos el que menos vara es ese; por otro lado, el de mayor dspersón o varabldad es el producto Meddas de forma: Hasta ahora, hemos estado analzando y estudando la dspersón de una dstrbucón, pero parece evdente que necestamos conocer más sobre el comportamento de una dstrbucón. En esta parte, analzaremos las meddas de forma, en el sentdo de hstograma o representacón de datos, es decr, que nformacón nos aporta según la forma que tengan la dsposcón de datos. Las meddas de forma de una dstrbucón se pueden clasfcar en dos grandes grupos o bloques: meddas de asmetría y meddas de curtoss. pág. 63

64 Smetría: Según el Dcconaro de la Real Academa Española es la Regulardad en la dsposcón de las partes o puntos de un cuerpo o fgura, de modo que posea un centro, un eje o un plano de referenca. Es por lo tanto la armonía de poscón de las partes o puntos smlares uno respecto de otros y con referenca a puntos, líneas o planos determnados. Se puede generalzar dcendo que es una proporcón de las partes entre sí y con el todo. En estadístca se dce que una dstrbucón de datos es smétrca s se le puede doblar a lo largo de un eje vertcal de una manera tal que concdan los dos lados de la dstrbucón. Las dstrbucones que no tenen smetría con respecto al eje vertcal se les llama sesgada o asmétrca. Una dstrbucón sesgada a la derecha tene una cola prolongada del lado derecho de la dstrbucón y una cola más corta del lado zquerdo de la msma; esta asmetría se le denomna postva, cuando la cola de la dstrbucón del lado zquerdo es más larga que la del lado derecho, entonces la asmetría es negatva. En una dstrbucón smétrca la meda, la medana y la moda son guales. La smetría se mde por medo del coefcente de asmetría. Una dstrbucón smétrca tene un coefcente de asmetría gual a cero. Cuando una dstrbucón de frecuenca es asmétrca, la meda, la medana y la moda se alejan una de otra, es decr, las tres meddas de poscón son dferente; mentras más se separe la meda de la moda, mayor es la asmetría. S la dstrbucón de frecuenca es asmétrcamente negatva, la cola de la curva de dstrbucón se encuentra haca los valores más pequeños de la escala de las X y s la dstrbucón es asmétrcamente postva la cola de la dstrbucón se ubca haca los valores más grandes de la escala de las X. Karl Pearson un estudoso de la estadístca desgno el coefcente de asmetría con las letras SK y determnó la fórmula para su cálculo, al cual se le denomnó prmer coefcente de asmetría de Pearson SK 1 ( X Mo) S Esta fórmula se puede transformar por medo de la relacón: X Md Mo X 3X Md X Mo 3X. Mo X 3 Md X Mo 3 X Md, s ahora se susttuye 3( X - Md) en el prmer coefcente de asmetría de Pearson, se tene otro coefcente de asmetría utlzando la medana que se le denomna segundo coefcente de asmetría de Pearson, este es más precso que el prmero SK 3( X Md) S pág. 64

65 Arthur Bowley otro estudoso de la estadístca determnó que el coefcente de asmetría se podía calcular por medo de los cuartles y utlzó el coefcente de asmetría por medo de cuartles (skq), y la formula es SK q Q 1 Q3 Q 3 Q 1 Q En donde, Q1, Q y Q3 son los cuartles 1, y 3 respectvamente. El valor de SKq varía entre 1 y 1; según Bowley una dstrbucón de frecuenca con un coefcente de asmetría gual a 0.1, se consdera como lgeramente asmétrca y con un valor mayor 0.3 se le consdera marcadamente asmétrca. El coefcente de asmetría se puede calcular tambén en funcón de los momentos, sendo el momento m3 el parámetro utlzado para tal efecto. El coefcente de asmetría según los momentos se desgna con las letras SKm y sé calcula medante m SK m S la fórmula 3 3 En esta fórmula m3 es el momento tres con respecto a la meda artmétca y S 3 es la desvacón típca elevada a la potenca tres. Este coefcente es el más confable de todos los antes descrtos, así que para cualquer cálculo se debería utlzar este, ya que es un parámetro que utlza todos los datos de la sere de valores. X S en una sere de valores la Md Mo, entonces la dstrbucón de frecuenca presenta una curva asmétrca postva; s la = Md = Mo = 0, la curva de la dstrbucón es smétrca y s la dstrbucón presenta una curva en la que el Mo Md X, entonces se dce que la curva de la dstrbucón asmétrca negatva. Sí la curva de una dstrbucón de frecuenca es sesgada, la meda tratara de ubcarse haca el extremo o lado opuesto, de la sere de valores, donde se concentran los datos. Es bueno hacer referenca que en una asmetría postva la X Md y en una asmetría negatva la X Md. S en una dstrbucón de frecuenca, los ntervalos de las clases que la conforman presentan frecuencas balanceadas en cada uno de ellos y no presentan nnguna aglomeracón especal en los extremos y, además, presenta una concentracón de los datos en el centro de la dstrbucón, entonces se dce que la dstrbucón de frecuenca es smétrca. Cuando la curva de una dstrbucón de datos es smétrca el SK = 0, esta es una de las característcas de la curva Normal o Campana de Gauss. X pág. 65

66 S la mayoría de los datos de una sere de valores están ubcados en el centro de la dstrbucón y, además exste una dspersón medanamente haca los extremos mayores o menores de las varables, entonces se afrma que la curva de la dstrbucón es Lgeramente Asmétrca. Ejemplo: CLASES 1 f1 CLASES f TOTAL 10 TOTAL 10 En este ejemplo la dstrbucón 1 es lgeramente asmétrca postva y la dstrbucón es lgeramente asmétrca negatva. La mayoría de las dstrbucones de casos reales por lo general son lgeramente asmétrcas. Una dstrbucón de datos es marcadamente asmétrca s la mayoría de los datos de la msma se encuentran ubcados en los extremos mayores o menores de las varables que conforman la dstrbucón. S la mayoría de los de los datos de una sere de valores se encuentra stuados en el extremo de las clases menores de la dstrbucón, entonces la curva de la dstrbucón de frecuenca presenta una asmetría postva, sendo en este caso el SK 0; y s por el contraro esa mayoría se encuentra en los extremos de las clases mayores de las varables, entonces la sere de valores presenta una curva con una asmetría negatva, luego el Coefcente de asmetría será mayor que cero, es decr, SK0 Ejemplo: CLASES 3 f3 CLASES 4 f TOTAL 170 TOTAL 170 pág. 66

67 En la dstrbucón 3 los datos presentan una curva marcadamente asmétrca postva y el caso 4 la curva de la dstrbucón es marcadamente asmétrca negatva. Exsten dstrbucones de frecuencas que presentan curvas fuertemente marcadamente asmétrcas y otras que las curvas son lgeramente asmétrcas. Consderar la asmetría de una curva de frecuenca marcadamente o lgeramente asmétrca, es un asunto de crtero del nvestgador, puesto que no exsten reglas rígdas establecdas que determnen las líneas dvsoras o parámetros entre lgeramente o marcadamente asmétrca; Sn embargo cuando la mayoría de los datos de una dstrbucón de frecuenca se ubcan en los extremos mayores o menores de las varables se puede afrmar con certeza que la curva de la dstrbucón es marcadamente asmétrca. Algunos nvestgadores como Arthur Bowley determnaron que s se aplca el SKq y ese coefcente de asmetría obtendo es menor que 0.3 (sn consdera el sgno) se puede afrmar que la curva de la dstrbucón es lgeramente asmétrca, en caso contraro la curva de la dstrbucón sería marcadamente asmétrca. Otros nvestgadores utlzan el coefcente de asmetría según los momentos (SKm) para tales efectos, pero no exste crtero en cual ha de ser el coefcente especfco que marque el límte entre lgera y marcadamente. Sn embargo, en este estudo se consderará que un coefcente de asmetría según los momentos comprenddo entre 0.30 SKm 0.30, sería un buen límte para consderar una curva de dstrbucón como lgeramente asmétrca, de lo contraro sería marcadamente asmétrca. El SKm es el coefcente de asmetría de mayor precsón y confabldad, puesto que este, utlza para su cálculo todos los valores de la sere de datos. Es bueno afrmar que cuando el coefcente de asmetría de una curva de dstrbucón es marcadamente asmétrco no se puede utlzar la meda artmétca como medda de tendenca central, puesto que esta es afectada altamente por los valores extremos de una sere de datos, en su lugar es recomendable utlzar la medana como medda de poscón Kurtoss (Curtoss): Es el grado de apuntamento o altura de la curva de una dstrbucón de frecuenca. La fnaldad de la Kurtoss es determnar s la dstrbucón de los térmnos de una sere de valores responde a una curva normal o no. Se utlza para observar el promedo o poscón de la dstrbucón, así como la meda, la medana y la moda, se puede en esta observar la asmetría, el grado de concentracón de los datos, en fn, para observar en forma general el comportamento de una sere de datos en una dstrbucón de frecuenca. Por medo de la Kurtoss se determnará s la dstrbucón de frecuenca es demasado puntaguda, normal o muy achatada. El grado de apuntamento o altura de una curva de dstrbucón se determna por medo del coefcente de Kurtoss, el cual se calcula utlzando el momento cuatro de una sere de valores con respecto a su meda artmétca. La Kurtoss se desgna con la letra K4 y la fórmula de cálculo es: pág. 67

68 K 4 m S 4 4 En esta fórmula m4 es el momento cuatro con respecto a la meda artmétca y S 4 es la desvacón típca elevada a la cuarta potenca, K4 es el coefcente de Kurtoss. Tomando en cuenta la Kurtoss el k4 de una curva de dstrbucón puede ser: Mesocurtca, Platcurtca y Leptocurtca. Mesocurtca: Es aquella curva de una dstrbucón de frecuenca que no es n muy alta n muy achatada, es la llamada curva normal. La curva Mesocurtca tene un coefcente de Kurtoss gual a tres, es decr, K4 = 3. Leptocurtca: Es aquella curva de la dstrbucón que presenta un apuntamento o altura relatvamente más alta que la curva Mesocurtca, en esta los datos se encuentran más concentrados alrededor del máxmo valor. El coefcente de Kurtoss para curva Leptocurtca es mayor de tres, es decr, K4 3. Platcurtca: Es la curva de una dstrbucón de frecuenca que presenta un achatamento más pronuncado que la Mesocurtca, encontrándose los datos más dspersos alrededor del máxmo valor de la dstrbucón. En esta curva el coefcente de Kurtoss es menor de tres, es decr, K4 3. En la Fgura 0 de Kurtoss se pueden observar los tres tpos de Kurtoss antes descrtos, sendo la prmera curva Platcurtca (azul), la segunda Mesocurtca (roja) y la últma es Leptocurtca (amarlla): pág. 68

69 KURTOSIS 1 PLATIKURTICA MESOKURTICA 3 LEPTOKURTICA Fgura 0. Curvas según su curtoss Ejemplo: En la sguente dstrbucón de frecuenca, determne el coefcente de asmetría utlzando los métodos de Pearson, de Bowley y el de los momentos, nterprete los resultados y haga un análss de los dferentes resultados y dga cuál es el resultado más recomendado en este caso; encuentre la Kurtoss e nterprete los resultados. CLASES f Solucón: Para resolver el problema lo prmero que hay que hacer es calcular la X y determnar los desvíos d con respecto a la meda, luego se elabora un cuadro estadístco con el resumen de los cálculos necesaros para determnar la asmetría pág. 69

70 y la curtoss. Además, se tendrá que calcular la medana, la moda, el Q1 el Q3, y después de realzar todos esos cálculos se procede a buscar la asmetría y la curtoss con las formulas respectvas. En el sguente cuadro se encuentran resumdos la mayoría de los cálculos necesaros, el resto se calcularán aparte. CLASES f X f X d f.d f.d f.d 3 f.d Se recomenda realzar los cálculos de los parámetros, ya que solo aparecen sus resultados X = 1.07, Mo = 0.0, Q1 = 18.71, Q = Md = 0.49, Q3 = 3.55, S = 4.41, S = 19.46, S 3 = 85.8, S 4 = 378,8. X Mo SK S El resultado ndca que la curva de dstrbucón es lgeramente asmétrca postva. SK 3( X Md) 3( ) 1.74 S El resultado ndca que la curva de la dstrbucón es marcadamente asmétrca postva. SK q Q1 Q Q Q Q (0.49) o.6. El resultado ndca que la curva es lgeramente asmétrca postva. pág. 70

71 Para calcular el coefcente de asmetría según los SKm se cálcula prmero el m3 así: m f d n SK m S m El coefcente SKm ndca que la curva de la dstrbucón es marcadamente asmétrca postva. S se observan los dferentes coefcentes de asmetría se puede notar que el SK y el SKm son marcadamente asmétrcos y los otros son lgeramente asmétrcos, esto es así por cuanto él valor obtendo con el SK y el SKm son más precsos que los otros, lo que ndca que se debe preferr el resultado de estos últmos por razones obvas. Sempre el SKm será más precso que cualquer otro coefcente de asmetría, Por qué? Los resultados obtendos con los dferentes coefcentes de asmetría ndcan que esta es postva, es decr, con un sesgo haca la cola de la derecha. Para calcular el K4 se calcula el m4 así: m f d n Ahora se procede a calcular el K4 aplcando la formula K S m El resultado ndca que el apuntamento de la curva es achatado, la prmera curva (de color verde), es decr, la curva es platcurtca. Observe la Fgura 1, donde se puede ver la curva normal (de color rojo) y se puede observar la kurtoss y la smetría. La asmetría postva se puede observar en la parte derecha de la gráfca. pág. 71

72 60 KURTOSIS Y ASIMETRÍA d ASIMETRÍA CURVA NORMAL Fgura 1. Curtoss y Asmetra Ejemplo: En la sguente dstrbucón de frecuenca determne el SK1, SK, SKq y el skm, nterprete los resultados y dga cuál es el más recomendado; encuentre la curtoss e nterprete el resultado. CLASES f Solucón.- Para resolver este problema se debe calcular la X y los desvíos d con respecto a esta, tambén es necesaro calcular la Md, el Mo, el Q1, el Q3, la S, el m3, el m4, elaborar un cuadro estadístco y fnalmente aplcar las formulas respectvas. pág. 7

73 En el sguente cuadro se resumen los cálculos para tales efectos. Se recomenda al estudante realzar todos los cálculos pertnentes. CLASES f X f X d f.d f.d f.d 3 f.d Los resultados obtendos de los dferentes cálculos son: X = 18.93, Mo = 0.0, Q1 = 16.45, Q = Md = S = 3.99, S 3 = 63.40, S 4 = 5.80, m3 = 0.48, m4 = 7.63 Ahora se procederá a calcular los dferentes coefcentes de asmetría así: SK X Mo S ( X Md) 3( ) 1.74 SK S 3, S observa puede ver que este problema es cas déntco al anteror, solo las m SK m 0.3 S frecuencas fueron cambadas de la parte alta de las varables haca la parte baja de Q1 Q3 Q (19.51) 1.8 SK q 0.6 Q3 Q las msmas, por tal razón todos sus cálculos son déntcos en valor absoluto al pág. 73

74 anteror, lo que ndca que ahora la asmetría obtenda es negatva, es decr, con sesgo haca la zquerda. Para calcular la Kurtoss se procede así: K S m La curva de la dstrbucón es platkurtca. La nterpretacón es déntca a la del problema anteror. Se puede ver que la curva más alta es la normal (roja) o Mesocurtca y la más achatada es la curva de la dstrbucón en estudo, y en este caso es platkurtca Meddas de concentracón: Las meddas de concentracón tratan de poner de releve el mayor o menor grado de gualdad en el reparto del total de los valores de la varable, son por tanto ndcadores del grado de dstrbucón de la varable. Denomnamos concentracón a la mayor o menor equdad en el reparto de la suma total de los valores de la varable consderada (renta, salaros, etc.). Las nfntas posbldades que pueden adoptar los valores, se encuentran entre los dos extremos: Concentracón máxma, cuando uno solo percbe el total y los demás nada, en este caso, nos encontraremos ante un reparto no equtatvo. Concentracón mínma, cuando el conjunto total de valores de la varable está repartdo por gual, en este caso dremos que estamos ante un reparto equtatvo De las dferentes meddas de concentracón que exsten nos vamos a centrar en dos: Índce de Gn: Coefcente, por tanto, será un valor numérco. Curva de Lorenz: gráfco, por tanto, será una representacón en ejes coordenados. Sea una dstrbucón (x, n ) de la que formaremos una tabla con las sguentes columnas: Los productos x n, que nos ndcarán la totaldad percbda por los n frecuencas de valores ndvduales x. Las frecuencas absolutas acumuladas N. Los totales acumulados u que se calculan de la sguente forma: pág. 74

75 u 1 = x 1 n 1 u = x 1 n 1 + x n u 3 = x 1 n 1 + x n + x 3 n 3 u 4 = x 1 n 1 + x n + x 3 n 3 + x 4 n 4 u n = x 1 n 1 + x n + x 3 n 3 + x 4 n x n n n Por tanto podemos decr que u n n 1 x n La columna total de frecuencas acumuladas relatvas, que expresaremos en tanto por cento y que representaremos como p y que vendrá dada por la sguente notacón p N n 100 La renta total de todos los rentstas que será u n y que, dada en tanto por cento, la cual representaremos como q y que responderá a la sguente notacón: u q u n 100 Por tanto, ya podemos confecconar la tabla que será la sguente: x n x n N u N u p n u q p - q n x 1 n 1 x 1 n 1 N 1 u 1 p 1 q 1 p 1 - q 1 x n x n N u p q p - q x n n n x n n n N n u n p n q n p n - q n pág. 75

76 Como podemos ver la últma columna es la dferenca entre las dos penúltmas, esta dferenca sera 0 para la concentracón mínma ya que p = q y por tanto su dferenca sera cero. S esto lo representamos gráfcamente obtendremos la curva de concentracón o curva de Lorenz. La manera de representarlo será, en el eje de las X, los valores p en % y en el de las Y los valores de q en %. Al ser un %, el gráfco sempre será un cuadrado, y la gráfca será una curva que se unrá al cuadrado, por los valores (0,0), y (100,100), y quedará sempre por debajo de la dagonal. La manera de nterpretarla será: cuanto más cerca se stúe esta curva de la dagonal, menor concentracón habrá, o más homogenedad en la dstrbucón. Cuanto más se acerque a los ejes, por la parte nferor del cuadrado, mayor concentracón. Los extremos son: Fgura. Valores extremos de la concentracón Analítcamente calcularemos el índce de Gn el cual responde a la sguente ecuacón I G k1 1 k1 p q 1 p Este índce tomara los valores de I G = 0 cuando p = q concentracón mínma y de I g = 1 cuando q = 0 Esto lo veremos mejor con un ejemplo: pág. 76

77 Frecuenca marca x n S u n p = (N/n) 100 q = (u /u n ) 100 p - q L -1 - L x n N ,85 1,48 7, ,54 15,38 1, ,38 35,33 5, ,85 56,95 1, ,15 67,95 18, ,3 73,6 15, ,6 85,33 9, ,31 9,08 5, ,3 97,55 1, ,00 100,00 0, ,15 15,48 Se pde Índce de concentracón y Curva de Lorenz correspondente a) Índce de concentracón de GINI I G k1 p 1 k1 1 q p 15,48 651,15 0,193, Observamos que hay poca concentracón por encontrarse cerca del 0. b) Curva de Lorenz La curva la obtenemos cerca de la dagonal, que ndca que hay poca concentracón: pág. 77

78 Fgura 3. Curva de Lorenz 3.5. Ejerccos 1. En un estudo de mercado se ordena encuestas a 0 personas de determnada poblacón. Se medrá un conjunto de varables entre las cuales fgura el ngreso mensual (I) en mles de pesos y el nvel socoeconómco (NSE) que se supone fuertemente relaconado con la varable anteror. Los datos obtendos se muestran en la sguente tabla: Encuesta Sexo Edad Ingreso NSE 1 M C4 M C 3 F C 4 F C3 5 F C4 6 F E 7 M C1 pág. 78

79 8 F C3 9 M C 10 M C4 11 M AB 1 F C4 13 M C4 14 F C 15 F C3 16 F C1 17 F E 18 F C 19 F C4 0 M E a) Clasfque las varables del estudo. b) En que subpoblacón, mujeres u hombres, los datos de ngreso mensual son más homogéneos.. Se conocen los puntajes que un grupo de postulantes, no así las dentfcacones de los msmos. Uno de ellos, Andrés quere conocer su puntaje y le han dcho que es mayor que el promedo y menor que el percentl 75 Los puntajes son los sguentes a) Obtenga los posbles puntajes de Andrés. b) De entre los valores calculados en a), el puntaje de Andrés es aquel que, al calcular la desvacón estándar de los 14 restantes, produce la mayor varabldad Cuál es el puntaje de Andrés? pág. 79

80 3. S se conoce que el salaro medo mensual de 5 hermanos, es de $10.000, y la medana es de $ a) Cuánto dnero llevan mensualmente a la casa los cnco hermanos? b) S Juan, el mejor pagado de los cnco recbe un aumento de $10.000; cuál es la nueva meda y cuál es la nueva medana. 4. Un grupo de 80 estudantes se compone de 35 hombres. En un test, el puntaje medo de las mujeres fue de 70 puntos y del grupo completo fue 66.5 puntos. a) Determne el puntaje medo de los hombres. b) S se camba la escala de puntajes medante la transformacón Y X ( X : puntaje antguo, Y puntaje nuevo), determne el nuevo puntaje medo de hombres, mujeres y el grupo completo. c) Compruebe que s se aplca la transformacón al puntaje medo del grupo total (66.5) se obtene el msmo resultado que s se calcula el puntaje medo del grupo total transformado, como promedo ponderado de los puntajes transformados de hombres y mujeres (trate de comprobar esta propedad en forma general). 5. En una dstrbucón smétrca de 7 ntervalos de gual ampltud se conocen los sguentes datos: A 10; n 1 8 ; Y 3 n3 160; n n5 6; h ; H a) Complete la nformacón. b) Calcule el promedo bajo la transformacón lneal y 3x En un banco comercal se desea estudar el tempo de atencón necesaro para que un clente realce una transaccón entre las 1:00 horas y las 14:00 horas. Durante una semana se tomaron los tempos de atencón de 10 clentes daramente, obtenéndose los sguentes datos tabulados: Tempo de atencón (mn.) Cantdad de Clentes pág. 80

81 Total 50 a) Determne qué porcentaje de clentes demoraron a lo más 3 mnutos en su atencón. b) Determne cuántas horas a lo más demorará en su transaccón el 84% de los clentes. c) Construya un gráfco adecuado que permta mostrar (aproxmadamente) la ubcacón de la Medana y el Percentl La dstrbucón de frecuencas observadas, de los sueldos para los trabajadores del departamento de produccón de dos empresas, A y B, para dos muestras se da a conocer la sguente tabla: Sueldo (UF) na nb Total a) Calcular en cada muestra las meddas de tendenca central. pág. 81

82 b) Compare la homogenedad de los datos a partr de los sueldos de la empresa. 8. Los sguentes datos corresponden a los tempos (en mnutos) que duran 40 llamadas telefóncas recbdas por una central: a) Construya una tabla de frecuencas con ses ntervalos de gual ampltud. b) Construya un hstograma de frecuencas relatvas porcentuales. x s; x s. c) Qué porcentaje de llamadas se encuentran en el ntervalo 9. La meda de un grupo de facturas es de $150 y la desvacón $0. Utlzando la regla empírca, construya un ntervalo donde se encuentre el 99,7% del monto de las facturas. 10. Una compañía produce lotes de tubos para gas con un dámetro promedo de 14 mlímetros y una desvacón de 0,1 mlímetros. El gerente de control de caldad de la compañía pensa que los tubos que no tengan dámetros entre 13,8 y 14, mlímetros no deben ser puestos a la venta. Usando la regla empírca, aproxmadamente qué porcentaje de tubos se encuentra apto para la venta? 11. Para cada uno de los ejerccos sguentes, determne: la desvacón estándar, la varanza, el coefcente de varacón y el coefcente de asmetría. Establezca, así msmo, al menos una conclusón acerca de la dspersón y otra acerca de la asmetría. a) La produccón dara de dos plantas de ensamblado de vehículos se muestra a contnuacón. Planta A pág. 8

83 Planta B b) A contnuacón se presentan las notas de un examen de estadístca (sobre 100 puntos) c) La sguente es una muestra de los aportes realzados por un grupo de empleados al seguro socal. Cantdad (mles de$) Número de empleados En un barro de una gran cudad se ha constatado que las famlas resdentes se han dstrbudo, según su composcón, de la sguente forma: Composcón Famlas a) Cuál es el número medo de personas por famla? b) Cuál es el tpo de famla más usual? c) S sólo hubera plazas de aparcamento para el 50% de las famlas, y éstas se atenderan de mayor a menor número de membros, Cuántos componentes debería tener una famla para entrar en el cupo? d) S el coefcente de varacón de Pearson de otro barro de la msma cudad es 1,8, cuál de los dos barros puede ajustar mejor sus prevsones en base al dferente número de membros de las famlas que lo habtan? e) S el ayuntamento concede una ayuda de ptas. fjas por famla, más ptas. por cada membro de la undad famlar, determnar el mporte medo por famla y la desvacón típca. f) Número de membros que tenen como máxmo el 85% de las famlas menos numerosas. pág. 83

84 13. Las sguentes tablas corresponden a dos muestras representatvas de los crédtos conceddos, en mllones de pesos, por dos agencas de una entdad bancara en el últmo ejercco. Comparar la concentracón y la homogenedad de ambas dstrbucones. Agenca A Agenca B Valor crédto Nº crédtos Nº crédtos 0-0, , pág. 84

85 4. ESTADÍSTICOS EN EXCEL 016 Aunque podríamos utlzar fórmulas de Excel para obtener nformacón como el valor máxmo, el mínmo, la meda, la suma, etc., podremos obtener toda esa nformacón con solo utlzar la herramenta Estadístca descrptva. El prmer paso es pulsar el botón Análss de datos de la fcha Datos y selecconar la opcón Estadístca descrptva. Fgura y 3. Opcón Datos y Análss de datos Al pulsar el botón Aceptar se mostrará un nuevo cuadro de dálogo que nos permtrá hacer las confguracones necesaras para obtener los datos estadístcos de nuestra nformacón. pág. 85

86 Fgura 4. Estadístca descrptva Las opcones dentro de este cuadro de dálogo a las que se debe prestar especal atencón son las sguentes: Rango de entrada: La columna que contene los datos numércos de los cuales se obtendrán los datos estadístcos. Agrupado por: Indca la orentacón del rango de entrada. Para el ejemplo los datos están en una columna. Rótulos en la prmera columna: S dentro del rango de entrada está ncluda la celda que contene el título de la columna, entonces debes marcar esta caja de seleccón. Opcones de salda. Podrás elegr tres posbles opcones de salda: elegr un rango dentro de la msma hoja donde se colocarán los resultados, o elegr que los resultados se coloquen en una hoja nueva o en un lbro nuevo. Resumen de estadístcas. Es necesaro que esta opcón esté selecconada para obtener los datos estadístcos que necestamos. Una vez que has hecho las confguracones necesaras en el cuadro de dálogo Estadístca descrptva pulsa el botón Aceptar para ver los resultados. En muchas ocasones al pulsar Datos, no aparece la opcón de Análss de datos (Fgura 4), esto se debe a que esta opcón es un complemento de Excel, y en ese momento no está actvado o nstalado. pág. 86

87 Fgura 5. Opcón Datos sn Análss de datos Para actvarlo, se selecconan la sguente secuenca de comandos: Archvo Opcones Complementos Ir Herramentas para análss. Como lo muestran las fguras de la 6 a la 30 Fgura 6. Comando archvo Fgura 7. Comando opcones pág. 87

88 Fgura 8. Comando complementos Fgura 9. Comando r pág. 88

89 Fgura 30. Comando herramentas para análss Ejemplo: Calcular las meddas de resumen de la varable EDAD, correspondente a la plantlla: base de datos. Fgura 31. Resumen de estadístcas para la varable EDAD pág. 89

90 EDAD Meda Error típco Medana Moda Desvacón estándar Varanza de la muestra Curtoss Coefcente de asmetría Rango Mínmo Máxmo Suma Cuenta 500 Fgura 31. Meddas de resumen para la varable EDAD Excel maneja las sguentes expresones para la asmetría y la curtoss: CURTOSIS se defne como sgue: ecuacón para la ASIMETRÍA es la sguente: Como se puede observar la curtoss en su fórmula resta una expresón al lado derecho relaconada con el número 3, luego su nterpretacón se hace con referenca al número 0. CURTOSIS > 0 Leptocurtca CURTOSIS < 0 Platcurtca pág. 90

91 CURTOSIS = 0 Mesocurtca Otra medda que se puede generar a partr de la tabla de la Fgura 3, es el coefcente de varacón, dvdendo la desvacón estándar entre la meda y expresándola en formato porcentual. Su resultado es: C.V. = 6.53%. Los cuartles, decles, percentles, se pueden generar desde cada celda, medante las sguentes expresones: =CUARTIL(B:B6;1) para el cuartl 1 =CUARTIL(B:B6;) para el cuartl =CUARTIL(B:B6;3) para el cuartl 3 =PERCENTIL(B1:B501;0.7) para el decl 7 =PERCENTIL(B1:B501;0.89) para el percentl 89 Cuartíl Cuartíl Cuartíl Decl Percentl Fgura 3. Cuartles, Decl y Percentl para la varable EDAD Interpretacón: La edad promedo de los 500 empleados de la empresa ABC, es aproxmadamente de 44, 08 años. Un 50% de estos empleados tenen una edad máxma de 38,85 años. La mayoría de los empleados tenen una edad aproxmada de 38,41 años. La dstrbucón de la varable edad es platcurtca y asmétrca postva. La edad mínma es de 9,84 y la máxma de 71,87. La varable edad presenta una leve heterogenedad. El 5% de los empleados tene una edad máxma de 35,54 años, el 75% una edad máxma de 5,5 años, el 70% una edad máxma de años, y el 89% una edad máxma de 6,8 años. Ejercco: 1. Calcule e nterprete las dferentes meddas de resumen para las sguentes varables de la plantlla base de datos EDUCACION = años de educacón SALARIO = salaro anual (mles de pesos) SERVICIO = años de servco EXPERIENCIA = experenca (años) pág. 91

92 . Calcule e nterprete las dferentes meddas de resumen para el ejercco 8 del capítulo 3. pág. 9

93 5. DIAGRAMAS COMPLEMENTARIOS PARA EL ANALISIS EXPLORATORIO DE DATOS 5.1. Dagrama de tallo y hojas: Un procedmento sem-gráfco de presentar la nformacón para varables cuanttatvas, que es especalmente útl cuando el número total de datos es pequeño (menor que 50), es el dagrama de tallo y hojas de Tukey. Los prncpos para constturlo son: Redondear los datos a dos o tres cfras sgnfcatvas, expresándolos en undades convenentes. Dsponerlos en una tabla con dos columnas separadas por una línea como sgue: a) Para datos con dos dígtos, escrbr a la zquerda de la línea los dígtos de las decenas (forma el tallo), y a la derecha las undades (hojas). b) Para datos con tres dígtos el tallo estará formado por los dígtos de las centenas y decenas, que se escrbrán a la zquerda, separados de las undades. Cada tallo defne una clase, y se escrbe sólo una vez. El número de hojas representa la frecuenca de dcha clase. Ejemplo: 1. Datos recogdos en cm: 11,357; 1,54; 11,384; 1,431; 14,1: 15,13; 13,300; 11,300; 17,06; 1,710; 13,455; 16,143; 1,16; 1,71; 13,40; 14,698.. Datos redondeados expresados en mm: 114; 15; 114; 14; 14; 15; 133; 113; 17; 17; 135; 161; 1, 17; 134; Dagrama de tallo y hojas, datos en mm: decenas undades pág. 93

94 Cuando el prmer dígto de la clasfcacón varía poco, la mayoría de los datos tenden agruparse alrededor de un tallo y el dagrama resultante tene poco detalle. En ese caso es convenente subdvdr cada tallo en dos o más partes ntroducendo algún sgno arbtraro, como se ndca: Las pulsacones por mnuto de un grupo de 40 personas se han representado en el dagrama de tallo y hojas sguente: Podemos obtener más detalle subdvdendo cada tallo en dos partes guales: en una colocaremos las hojas 0 a 4 y lo representamos por ( * ) y en la otra las hojas de 5 a 9 y lo representaremos por (. ), obtenendo el dagrama: 5 *. 6 6 * * * *. Observemos que todos los datos son múltplos de 4, lo que hace sospechar que se han obtendo mdendo las pulsacones cada 15 segundos y multplcando por cuatro. pág. 94

95 5.. Dagrama de cajas y bgotes: Los dagramas de Caja-Bgotes (boxplots o box and whskers) son una presentacón vsual que descrbe varas característcas mportantes, al msmo tempo, tales como la dspersón y smetría. Para su realzacón se representan los tres cuartles y los valores mínmo y máxmo de los datos, sobre un rectángulo, alneado horzontal o vertcalmente. Una gráfca de este tpo consste en una caja rectangular, donde los lados más largos muestran el recorrdo ntercuartílco. Este rectángulo está dvddo por un segmento vertcal que ndca donde se poscona la medana y por lo tanto su relacón con los cuartles prmero y tercero (recordemos que el segundo cuartl concde con la medana). Esta caja se ubca a escala sobre un segmento que tene como extremos los valores mínmo y máxmo de la varable. Las líneas que sobresalen de la caja se llaman bgotes. Estos bgotes tenen tenen un límte de prolongacón, de modo que cualquer dato o caso que no se encuentre dentro de este rango es marcado e dentfcado ndvdualmente. S la dstrbucón es aproxmadamente normal, se declaran puntos extremos (outlers) aquellos que caen por fuera del ntervalo X.7*S ya que P (-.7*S < X < +.7*S) = S la dstrbucón es asmétrca, se acostumbra dvdr la sere en áreas o segmentos como se muestra en la sguente gráfca, llamada gráfca de Box and Whsker o caja esquemátca o dagrama de bgotes: Donde: 1: Q1 3xRq : Q1 1.5xRq 3: Q xRq 4: Q3 + 3.xRq Obsérvese que los puntos a dstancas menores de la representacón 1 o mayores de la representacón 4, son altos extremos. Los puntos entre la representacón 3 y 4 y entre 1 y se consderan como puntos de advertenca o bajos extremos; los puntos entre la representacón y 3 se consderan como puntos normales. pág. 95

96 Cuando la caja es contrecha, se puede determnar homogenedad en la varable, en caso contraro heterogenedad. S el bgote derecho es más largo que el zquerdo, se puede determnar asmetría postva, en caso contraro asmetría negatva Dagrama de cajas y bgotes en Excel: Para construr un boxplot necestamos determnar el valor del prmer y el tercer cuartl, el valor del a medana, y los valores mínmo y máxmo de la varable analzada. Todos estos estadístcos son provstos por la opcón de estadístca descrptva del menú de Análss de Datos de Excel, con excepcón del prmer y tercer cuartl. Ejemplo: Vamos a elaborar un dagrama de cajas y bgotes, para la varable EDAD, de la base de datos. Calculamos los estadístcos que aparecen en la Fgura 33: Fgura 33. Algunos estadístcos para la varable EDAD Seleccone el rango de celda M0 a N4 y luego usando el botón derecho del ratón seleccone la alternatva Copar. Mantenendo el rango selecconado M0 a N4 dríjase al menú prncpal y elja Edcón/Pegado especal. En el cuadro de dálogo que aparece seleccone la opcón valores, como se muestra en la fgura 34. pág. 96

97 Fgura 34. Pegado especal - Valores Presone el botón Aceptar y verá que aparentemente no se opera cambo alguno. En realdad, acaba de convertr las fórmulas ntroducdas en el paso anteror en valores que pueden usarse para cálculos posterores. Seleccone el rango M0 a N4 y luego del menú prncpal elja Insertar/Gráfco. En tpo de gráfco seleccone Líneas y en subtpo de gráfco Línea con marcadores en cada valor, generándose el grafco de la fgura 34. Se puede agregarle un título al gráfco Fgura 35. Dagrama de líneas Parados en la línea azul de la fgura 35, damos botón derecho y escogemos selecconar datos. Fgura 36 pág. 97

98 Fgura 36. Selecconar datos Selecconamos el botón Cambar fla/columna que aparece en la fgura 37 Fgura 37. Cambar fla/columna El gráfco resultante deberá tener el sguente aspecto: Fgura 38. Cambar fla/columna pág. 98

99 Título del eje Fgura 39. Agregar elemento de gráfco Dseño rápdo En dseño rápdo selecconamos Dseño 1, y en Agregar elemento de gráfco, selecconamos Líneas Líneas de máxmos y mínmos y Barras ascendentes y descendentes. Fgura 40. Fgura 40. Líneas máxmos y mínmos Líneas ascendentes y descendentes Fnalmente, el dagrama de cajas y bgotes, con sus respectvos ajustes será: Dagrama de cajas y bgotes para la EDAD Prmer cuartl Mínmo Medana Máxmo Tercer cuartl Fgura 41. Dagrama de cajas y bgotes para la varable EDAD pág. 99

100 6. ESTADISTICA DESCRIPTIVA MEDIANTE EL COMPLEMENTO MEGASTAT 6.1. Que es Megastat: Es un complemento de Mcrosoft Excel. Creado por J. B. Orrs en la Unversdad de Butler. Hasta la versón 9.1 era de uso lbre, sn embargo, hoy en día es dstrbudo por la edtoral McGraw-Hll. MegaStat ofrece herramentas para efectuar estadístca descrptva, cálculos probablístcos, estmacón por ntervalos, prueba de hpótess, seres de tempo y control de caldad. MegaStat 10.3 Release 3. y versones posterores se ejecutarán en 3 bts o 64 bts Excel 010, 013, y 016. Las versones anterores se pueden ejecutar sólo en 3 bts de Excel. MegaStat 10. ha sdo probado con las versones de 3 bts de Mcrosoft Excel 010, 013, y 016. MegaStat 10. y versones anterores pueden ejecutarse en Excel 007, MegaStat trabajará con 3 y 64 bts de Wndows 10, Wndows 8, Wndows 7, y Wndows Vsta Servce Pack. Según sea el sstema operatvo o la versón de Excel, el ejecutable de Megastat se puede bajar del sguente lnk: pág. 100

101 6.. Instalacón y actvacón de Megastat: Por ser un complemento de Excel, el ejecutable de Megastat, debe ser descomprmdo en la carpeta Lbrary o en la carpeta AddIns, según la versón de Excel. Para r en busca de cualquera de estas dos rutas, sga las sguentes nstruccones: Abra Excel, y sga la sguente ruta: Archvo Opcones Complementos Ir - Examnar Fgura 4. Ruta para el copado de Megastat Cope la ruta que aparece en la Fgura 43 pág. 101

102 Fgura 43. Carpeta del complemento Megastat La ruta defntva para este PC que tene nstalado el Excel 016, es la sguente: C:\Users\DAGO\AppData\Roamng\Mcrosoft\AddIns. Cope esta dreccón en cualquer carpeta del explorador, y pegue la versón adecuada del Megastat, descomprméndola. Fgura 44. Pegado y descomprensón de Megastat pág. 10

103 Una vez realzado el paso anteror, vuelva y abra la ruta de la Fgura 4 y actve Megastat, como lo ndca la Fgura 45, fnalmente oprma Aceptar Fgura 45. Actvacón de Megastat Fgura 46. Megastat Actvado 6.3. Confguracón del punto como separador de decmales: Algo muy mportante para trabajar con Megastat, es la confguracón del punto y como tal la coma, por ser una macro programada en otra regón. Para ello se abre el Panel de control del PC, y se realza lo sguente: Escogemos Reloj, doma y regón Regón y Confguracón adconal Fgura 47. pág. 103

104 Fgura 47. Confguracón adconal del Panel de control En Símbolo decmal, escogemos punto., y en Símbolo de separacón de mles, escogemos coma,, y damos Aceptar Aceptar. Fgura 48. Fgura 48. Confguracón del punto y la coma pág. 104

105 6.4. Confguracón de rangos en Excel: Una forma para facltar el trabajo en Megastat, es confgurar los rangos de cada una las varables. Esto se realza de la sguente forma: se seleccona toda la varable, ncluyendo su etqueta, por ejemplo, en el caso de la varable SEXO, se sombrea desde A1 a A501, y en el cuadro de nombres, reemplazamos su contendo por el nombre de la varable (para nuestro ejemplo SEXO. Fgura 49. De la msma forma se hace el procedmento para el resto de varables. Fgura 49. Rangos para las varables 6.5. Tabulacón y grafcacón varable cualtatva nomnal con Megastat (ESTADO): a) En la opcón Datos Fltro, se puede vsualzar las dferentes categorías y el formato de las msmas, para cada varable. En el caso de la varable ESTADO, se pude observar que exsten 5 categorías: Casado, Separado, Soltero, Unón Lbre, Vudo. Fgura 50 pág. 105

106 Fgura 50. Fltro para vsualzar categorías de las varables b) En un área lbre de la base de datos, por ejemplo, de L3 a L7, se colocan las dferentes categorías de la varable, respetando el formato orgnal, es decr, tenendo en cuenta la escrtura orgnal en la base datos (respetando mayúsculas y mnúsculas). Fgura 51. Fgura 51. Categorías de la varable ESTADO pág. 106

107 c) Se elge la ruta: Complementos Megastat Freqency Dstrbutons Qualtatve, como la ndca la Fgura 5. Fgura 5. Seleccón del comando Qualtatve d) Inmedatamente después, aparece un cuadro de dalogo como el de la Fgura 53, donde en la opcón InputRange, se escrbe el nombre de la varable defnda en el rango que se confguro anterormente (seccón 6.4), o se oprme la pestaña encerrada en el ovalo azul, selecconando el rango de la varable ($H$1:$H$501), y en la opcón specfcaton range, se ubca el rango de las categorías ($L$3:$L$7). Escogemos la opcón hstogram, para que se genere la gráfca, que no es un hstograma sno un dagrama de barras Fgura 53. Seleccón del rango y las categorías de la varable ESTADO El resultado obtendo se muestra en la Fgura 54, en una hoja nueva del lbro Excel, llamada Output. pág. 107

108 Fgura 54. Output de la varable ESTADO e) Por últmo, se edta la tabla y las gráfcas como en el apartado Tabulacón y grafcacón varable cualtatva ordnal con Megastat (ESTRATO): a) Se repten los ncsos del a) al d), de la seccón anteror 6.5, tenendo en cuenta que las categorías que deben r en el área en blanco de la base de datos son: Bajo, Medo y Alto. Estas categorías deben de tener un orden establecdo, por ser una varable Ordnal. b) Se edta la tabla y las gráfcas de la msma forma que en el apartado Tabulacón y grafcacón varable cuanttatva dscreta con Megastat (EDUCACION): a) Se repten los ncsos del a) al d), de la seccón 6.5, tenendo en cuenta que las categorías que deben r en el área en blanco de la base de datos son los números: Estos números deben de r en pág. 108

109 orden por ser una varable Dscreta. Se aclara que la varable EDUCACION, es una varable dscreta, pero para el tratamento en Megastat, optamos por la opcón del apartado 6.5. b) Se edta la tabla y las gráfcas de la msma forma que en el apartado Tabulacón y grafcacón varable cuanttatva contnua con Megastat (EDAD): Tenendo en cuenta los ncsos del 1 al 3 del apartado , para el cálculo de la ampltud (4,1) y el mínmo redefndo (9,81), se realzan los sguentes pasos: a) Se elge la ruta: Complementos Megastat Freqency Dstrbutons Quanttatve, como la ndca la Fgura 55. Fgura 55. Seleccón del comando Quanttatve b) Aparece un cuadro de dalogo como el de la Fgura 56, donde en la opcón InputRange, se escrbe el nombre de la varable defnda en el rango que se confguro anterormente (seccón 6.4), o se oprme la pestaña encerrada en el ovalo azul, selecconando el rango de la varable ($B$1:$B$501). En nterval wdth, escrbmos la ampltud (4,1) y en lower boundary of frst nterval, el límte nferor del prmer ntervalo (9,81). Selecconamos las tres gráfcas para las frecuencas acumuladas y las no acumuladas Hstogram, Polygon y Ogve y damos OK. pág. 109

110 Fgura 56. Seleccón del rango, ampltud y límte nferor del prmer ntervalo de la varable EDAD El resultado obtendo se muestra en la Fgura 57, en una hoja nueva del lbro Excel, llamada Output. Fgura 57. Output de la varable EDAD c) Por últmo, se edta la tabla y las gráfcas con las convencones como en el apartado.3.4. pág. 110

111 pág. 111

112 6.9. Estadístcos y análss exploratoro de datos con Megastat pág. 11

INTRODUCCIÓN. Técnicas estadísticas

INTRODUCCIÓN. Técnicas estadísticas Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad

Más detalles

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos. ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:

Más detalles

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS. 5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS. Para organzar los datos a medda que el número de observacones crece, es necesaro condensar más los datos en tablas apropadas, a fn de presentar, analzar e nterpretar

Más detalles

ESTADÍSTICA. Definiciones

ESTADÍSTICA. Definiciones ESTADÍSTICA Defncones - La Estadístca es la cenca que se ocupa de recoger, contar, organzar, representar y estudar datos referdos a una muestra para después generalzar y sacar conclusones acerca de una

Más detalles

Descripción de una variable

Descripción de una variable Descrpcón de una varable Tema. Defncones fundamentales. Tabla de frecuencas. Datos agrupados. Meddas de poscón Meddas de tendenca central: meda, medana, moda Ignaco Cascos Depto. Estadístca, Unversdad

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para el conocmento

Más detalles

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1 Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para

Más detalles

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa. MEDIDA DE DIPERIÓ A. Una pregunta muy partcular que se puede hacer a una dstrbucón de datos es de qué magntud es es la heterogenedad que se observa. FICHA º 18 Las meddas de dspersón generalmente acompañan

Más detalles

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística ESTADISTÍCA. Poblacón, muestra e ndvduo Las característcas de una dstrbucón se pueden estudar drectamente sobre la poblacón o se pueden nferr a partr de l estudo de una muestra. Poblacón estadístca es

Más detalles

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA. LA MEDIANA: Es una medda de tendenca central que dvde al total de n observacones debdamente ordenadas

Más detalles

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION 1. DEFINICION: Las meddas estadístcas

Más detalles

Organización y resumen de datos cuantitativos

Organización y resumen de datos cuantitativos Organzacón y resumen de datos cuanttatvos Contendos Organzacón de datos cuanttatvos: dagrama de tallos y hojas, tablas de frecuencas. Hstogramas. Polígonos. Ojvas ORGANIZACIÓN Y RESUMEN DE DATOS CUANTITATIVOS

Más detalles

Tema 1: Análisis de datos unidimensionales

Tema 1: Análisis de datos unidimensionales Tema : Análss de datos undmensonales. Varables estadístcas undmensonales. Representacones gráfcas.. Característcas de las dstrbucones de frecuencas undmensonales.. Varables estadístcas undmensonales. Representacones

Más detalles

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso. CARTAS DE CONTROL Las cartas de control son la herramenta más poderosa para analzar la varacón en la mayoría de los procesos. Han sdo dfunddas extosamente en varos países dentro de una ampla varedad de

Más detalles

Medidas de centralización

Medidas de centralización 1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN La estadístca tene por objeto el desarrollo de técncas para el conocmento numérco

Más detalles

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos:

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos: UNIDAD 2: Gráfcos estadístcos Los gráfcos muestran vsualmente y de forma rápda la dstrbucón de los datos y sus prncpales característcas, consttuyen un mportante complemento en la presentacón de la nformacón.

Más detalles

ESTADÍSTICA. x es el cociente entre la frecuencia absoluta del valor

ESTADÍSTICA. x es el cociente entre la frecuencia absoluta del valor el blog de mate de ada: ESTADÍSTICA pág. 1 ESTADÍSTICA La estadístca es la cenca que permte acer estudos de grandes poblacones escogendo sólo un pequeño grupo de ndvduos, lo que aorra tempo y dnero. Poblacón

Más detalles

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas... TEMA. ESTADÍSTICA DESCRIPTIVA.. Concepto y orgen de la estadístca..... Conceptos báscos..... Tablas estadístcas: recuento..... Representacón de grafcas.... 6.. Varables cualtatvas... 6.. Varables cuanttatvas

Más detalles

Cálculo y EstadísTICa. Primer Semestre.

Cálculo y EstadísTICa. Primer Semestre. Cálculo y EstadísTICa. Prmer Semestre. EstadísTICa Curso Prmero Graduado en Geomátca y Topografía Escuela Técnca Superor de Ingeneros en Topografía, Geodesa y Cartografía. Unversdad Poltécnca de Madrd

Más detalles

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 4: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION. DEFINICION Las meddas estadístcas son meddas de resumen

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA Estadístca descrptva. ESTADÍSTICA DESCRIPTIVA POBLACIÓN Y MUESTRA. VARIABLES ESTADÍSTICAS DISTRIBUCIÓN DE FRECUENCIAS DE UNA MUESTRA AGRUPACIÓN DE DATOS REPRESENTACIONES GRÁFICAS DE LAS MUESTRAS PRINCIPALES

Más detalles

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme Una hpótess estadístca es una afrmacón con respecto a una característca que se desconoce de una poblacón de nterés. En la seccón anteror tratamos los casos dscretos, es decr, en forma exclusva el valor

Más detalles

Elaboración de Tablas ó Cuadros. La elaboración de tablas o cuadros, facilita el análisis y la presentación de la información.

Elaboración de Tablas ó Cuadros. La elaboración de tablas o cuadros, facilita el análisis y la presentación de la información. Elaboracón de Tablas ó Cuadros La elaboracón de tablas o cuadros, faclta el análss la presentacón de la nformacón. Para elaborar los cuadros, se debe, antes que todo, dentfcar las varables, característcas

Más detalles

EJERCICIOS RESUELTOS TEMA 2

EJERCICIOS RESUELTOS TEMA 2 EJERCICIOS RESUELTOS TEMA.1. La Moda, para el grupo de Varones de la Tabla 1, es: A) 4,5; B) 17; C) 60.. Con los datos de la Tabla 1, la meda en para las Mujeres es: A) gual a la meda para los Varones;

Más detalles

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 0 INSTITUTO NACIONAL DE ESTADÍSTICAS 03 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE INTERURBANO DE PASAJEROS POR CARRETERA.

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva Descrpcón de datos: Estadístca descrptva undmensonal Estadístca descrptva Objetvos: Ordenar, clasfcar, resumr grandes conjuntos de datos de modo que puedan ser fáclmente nterpretables Defncones báscas:

Más detalles

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

Medidas de Tendencia Central y de Variabilidad

Medidas de Tendencia Central y de Variabilidad Meddas de Tendenca Central y de Varabldad Contendos Meddas descrptvas de forma: curtoss y asmetría Meddas de tendenca central: meda, medana y moda Meddas de dspersón: rango, varanza y desvacón estándar.

Más detalles

ESTADÍSTICA (GRUPO 12)

ESTADÍSTICA (GRUPO 12) ESTADÍSTICA (GRUPO 12) CAPÍTULO II.- ANÁLISIS DE UNA CARACTERÍSTICA (DISTRIBUCIONES UNIDIMENSIONALES) TEMA 7.- MEDIDAS DE CONCENTRACIÓN. DIPLOMATURA EN CIENCIAS EMPRESARIALES UNIVERSIDAD DE SEVILLA 1.

Más detalles

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad.

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad. Nombre: Mecansmo: PROYECTO DE TEORIA DE MECANISMOS. Análss cnemátco y dnámco de un mecansmo plano artculado con un grado de lbertad. 10. Análss dnámco del mecansmo medante el método de las tensones en

Más detalles

2 Dos tipos de parámetros estadísticos

2 Dos tipos de parámetros estadísticos Dos tpos de parámetros estadístcos Págna 198 1. Calcula la meda, la medana y la moda de cada una de estas dstrbucones estadístcas: a) 4, 5, 6, 6, 6, 6, 7, 11, 1, 17 b), 1, 6, 9,, 8, 9,, 14, c), 3, 3, 3,

Más detalles

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma Estadístca Tema 1: Estadístca Descrptva Undmensonal Undad 2: Meddas de Poscón, Dspersón y de Forma Área de Estadístca e Investgacón Operatva Lceso J. Rodríguez-Aragón Septembre 2010 Contendos...............................................................

Más detalles

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

Media es la suma de todas las observaciones dividida por el tamaño de la muestra. Estadístcos Los estadístcos son valores calculados con los datos de una varable cuanttatva y que mden alguna de las característcas de la dstrbucón muestral. Las prncpales característcas son: tendenca central,

Más detalles

TÍTULO I Aspectos Generales TÍTULO II Alcance TÍTULO III Metodología de Cálculo de FECF... 3

TÍTULO I Aspectos Generales TÍTULO II Alcance TÍTULO III Metodología de Cálculo de FECF... 3 PROCEDIMIENTO DO DESEMPEÑO DEL CONTROL DE FRECUENCIA EN EL SIC DIRECCIÓN DE OPERACIÓN ÍNDICE TÍTULO I Aspectos Generales... 3 TÍTULO II Alcance... 3 TÍTULO III Metodología de Cálculo de FECF... 3 TÍTULO

Más detalles

MUESTREO EN POBLACIONES FINITAS

MUESTREO EN POBLACIONES FINITAS MUESTREO EN POBLACIONES FINITAS Antono Morllas A.Morllas: Muestreo 1 MUESTREO EN POBLACIONES FINITAS 1. Conceptos estadístcos báscos. Etapas en el muestreo 3. Tpos de error 4. Métodos de muestreo 5. Tamaño

Más detalles

Modelos triangular y parabólico

Modelos triangular y parabólico Modelos trangular y parabólco ClassPad 0 Prof. Jean-Perre Marcallou INTRODUCCIÓN La calculadora CASIO ClassPad 0 dspone de la Aplcacón Prncpal para realzar los cálculos correspondentes a los modelos trangular

Más detalles

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis Tema. Estadístcos unvarados: tendenca central, varabldad, asmetría y curtoss 1. MEDIDA DE TEDECIA CETRAL La meda artmétca La medana La moda Comparacón entre las meddas de tendenca central. MEDIDA DE VARIACIÓ

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL La estadístca undmensonal trata de resumr la nformacón contenda en una tabla que contene nformacón de una sola varable en unos pocos números. Las meddas de poscón pueden ser:

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

Pronósticos. Humberto R. Álvarez A., Ph. D.

Pronósticos. Humberto R. Álvarez A., Ph. D. Pronóstcos Humberto R. Álvarez A., Ph. D. Predccón, Pronóstco y Prospectva Predccón: estmacón de un acontecmento futuro que se basa en consderacones subjetvas, en la habldad, experenca y buen juco de las

Más detalles

Tema 8: Estadística en una variable (unidimensional)

Tema 8: Estadística en una variable (unidimensional) Matemátcas aplcadas a las Cencas Socales I lasmatematcas.eu Tema 8: Estadístca en una varable Tema 8: Estadístca en una varable (undmensonal) 1. Introduccón Se desconocen con exacttud los orígenes de la

Más detalles

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES Documento Preparado para la Cámara de Fondos de Inversón Versón 203 Por Rodrgo Matarrta Venegas 23 de Setembre del 204 2 Análss Industral

Más detalles

1. ESTADÍSTICA DESCRIPTIVA.

1. ESTADÍSTICA DESCRIPTIVA. Departamento de Matemátcas http://www.colegovrgendegraca.org/eso/dmate.htm Estadístca descrptva 1. ESTADÍSTICA DESCRIPTIVA. 1.1. Introduccón. En general, cuando se va a estudar un determnado colectvo,

Más detalles

DESEMPEÑO DEL CONTROL DE FRECUENCIA PROCEDIMIENTO DO

DESEMPEÑO DEL CONTROL DE FRECUENCIA PROCEDIMIENTO DO Clascacón: Emtdo para Observacones de los Coordnados Versón: 1.0 DESEMPEÑO DEL CONTROL DE FRECUENCIA PROCEDIMIENTO DO Autor Dreccón de Operacón Fecha Creacón 06-04-2010 Últma Impresón 06-04-2010 Correlatvo

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Introduccón La estadístca es una rama de las matemátcas que trata de la recogda, ordenacón, análss y presentacón adecuada de datos recogdos sobre certa poblacón (no necesaramente

Más detalles

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk www.apuntesmareaverde.org.es

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk www.apuntesmareaverde.org.es 4ºB ESO Capítulo 1: Estadístca 350 Índce 1. POBLACIÓ Y MUESTRA. VARIABLES ESTADÍSTICAS 1.1. POBLACIÓ 1.. MUESTRA 1.3. IDIVIDUO 1.4. VARIABLE ESTADÍSTICA. TABLAS DE FRECUECIAS.1. FRECUECIA ABSOLUTA.. FRECUECIA

Más detalles

La adopción y uso de las TICs en las Microempresas Chilenas

La adopción y uso de las TICs en las Microempresas Chilenas Subdreccón Técnca Depto. Investgacón y Desarrollo Estadístco Subdreccón de Operacones Depto. Comerco y Servcos INFORME METODOLÓGICO DISEÑO MUESTRAL La adopcón y uso de las TICs en las Mcroempresas Clenas

Más detalles

Estadística Descriptiva Análisis de Datos

Estadística Descriptiva Análisis de Datos El concepto de Estadístca Estadístca Descrptva Análss de Datos 8.1 INTRODUCCION El orgen de la Estadístca se remonta a dos tpos de actvdades humanas: los juegos de azar y las necesdades de los Estados:

Más detalles

TEMA 10: ESTADÍSTICA

TEMA 10: ESTADÍSTICA TEMA 10: La Estadístca es la parte de las matemátcas que se ocupa de recoger, organzar y analzar grandes cantdades de datos para estudar alguna característca de un colectvo. 1. VARIABLES S UIDIMESIOALES

Más detalles

Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel. Números Índices

Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel. Números Índices Estadístca Descrptva y Analss de Datos con la Hoja de Cálculo Excel úmeros Índces úmeros Índces El número índce es un recurso estadístco para medr dferencas entre grupos de datos. Un número índce se puede

Más detalles

DATOS AGRUPADOS POR INTERVALOS DE CLASE

DATOS AGRUPADOS POR INTERVALOS DE CLASE 3. Datos agrupados por ntervalo (Varable contnua) Generalmente los datos se agrupan por medo de ntervalos de clase, los cálculos son una aproxmacón a la realdad, se faclta los cálculos. En la agrupacón

Más detalles

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de: Varables Aleatoras Varables Aleatoras Objetvos del tema: Concepto de varable aleatora Al fnal del tema el alumno será capaz de: Varables aleatoras dscretas y contnuas Funcón de probabldad Funcón de dstrbucón

Más detalles

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza Maestría en Admnstracón Meddas Descrptvas Formularo e Interpretacón Dr. Francsco Javer Cruz Arza A contnuacón mostramos el foco de atencón de las dstntas meddas que abordaremos en el presente manual. El

Más detalles

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS SUBDIRECCIÓN TÉCNICA DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO ÁREA DE ANÁLISIS ESTADÍSTICAS ECONÓMICAS METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS Santago, Enero de 2008. Departamento

Más detalles

1. Lección 7 - Rentas - Valoración (Continuación)

1. Lección 7 - Rentas - Valoración (Continuación) Apuntes: Matemátcas Fnanceras 1. Leccón 7 - Rentas - Valoracón (Contnuacón) 1.1. Valoracón de Rentas: Constantes y Dferdas 1.1.1. Renta Temporal y Pospagable En este caso, el orgen de la renta es un momento

Más detalles

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales:

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales: VECTOES 1.- Magntudes Escalares y Magntudes Vectorales. Las Magntudes Escalares: son aquellas que quedan defndas úncamente por su valor numérco (escalar) y su undad correspondente, Eemplo de magntudes

Más detalles

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES PRONÓSTICOS PREDICCIÓN, PRONÓSTICO Y PROSPECTIVA Predccón: estmacón de un acontecmento futuro que

Más detalles

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1). TRABAJO 1: Varables Estadístcas Undmensonales (Tema 1). Técncas Cuanttatvas I. Curso 2016/2017. APELLIDOS: NOMBRE: GRADO: GRUPO: DNI (o NIE): A: B: C: D: En los enuncados de los ejerccos que sguen aparecen

Más detalles

el blog de mate de aida CSI: Estadística unidimensional pág. 1

el blog de mate de aida CSI: Estadística unidimensional pág. 1 el blog de mate de ada CSI: Estadístca undmensonal pág. ESTADÍSTICA La estadístca es la cenca que permte hacer estudos de grandes poblacones escogendo sólo un pequeño grupo de ndvduos, lo que ahorra tempo

Más detalles

1.- Objetivo Alcance Metodología...3

1.- Objetivo Alcance Metodología...3 PROCEDIMIENTO DO PARA EL CÁLCULO DEL FACTOR DE DESEMPEÑO DEL CONTROL DE FRECUENCIA (FECF) EN EL SIC DIRECCIÓN DE OPERACIÓN ÍNDICE 1.- Objetvo...3 2.- Alcance...3 3.- Metodología...3 3.1.- Cálculo de la

Más detalles

EL ANÁLISIS DE LA VARIANZA (ANOVA) 2. Estimación de componentes de varianza

EL ANÁLISIS DE LA VARIANZA (ANOVA) 2. Estimación de componentes de varianza EL ANÁLSS DE LA VARANZA (ANOVA). Estmacón de componentes de varanza Alca Maroto, Rcard Boqué Grupo de Qumometría y Cualmetría Unverstat Rovra Vrgl C/ Marcel.lí Domngo, s/n (Campus Sescelades) 43007-Tarragona

Más detalles

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA E.U.I.T.I. Blbao Asgnatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA E.U.I.T.I. Blbao Asgnatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA TEMA 2: ESTADÍSTICA DESCRIPTIVA 1. RESUMEN Métodos para resumr y descrbr

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

ESTADÍSTICA 4º ESO A) INICIACIÓN A LA ESTADÍSTICA 1.- QUÉ ES LA ESTADÍSTICA?

ESTADÍSTICA 4º ESO A) INICIACIÓN A LA ESTADÍSTICA 1.- QUÉ ES LA ESTADÍSTICA? ESTADÍSTICA 4º ESO A) INICIACIÓN A LA ESTADÍSTICA 1.- QUÉ ES LA ESTADÍSTICA? La Estadístca es la rama de las Matemátcas que se ocupa del estudo de una determnada característca en una poblacón, recogendo

Más detalles

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos: MEDIDAS DE POSICIÓN Y DISPERSIÓN Estadístca En la clase anteror vmos como resumr la nformacón contenda en un conjunto de datos medante tablas y gráfcos. En esta clase vamos a ver como resumrlos medante

Más detalles

Capítulo III Medidas de posición y de dispersión

Capítulo III Medidas de posición y de dispersión Capítulo III Meddas de poscón y de dspersón Introduccón Hasta ahora, para descrbr un conjunto de datos, se han empleado tablas y gráfcos. Estos son útles para dar rápdamente una vsón general del comportamento

Más detalles

Regresión y Correlación Métodos numéricos

Regresión y Correlación Métodos numéricos Regresón y Correlacón Métodos numércos Prof. Mguel Hesquo Garduño. Est. Mrla Benavdes Rojas Depto. De Ingenería Químca Petrolera ESIQIE-IPN hesquogm@yahoo.com.mx mbenavdesr5@gmal.com Regresón lneal El

Más detalles

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c. Estadístca robablístca 6. Tablas de contngenca y dagramas de árbol. En los problemas de probabldad y en especal en los de probabldad condconada, resulta nteresante y práctco organzar la nformacón en una

Más detalles

ESTADISTICA DESCRIPTIVA COMPETENCIAS

ESTADISTICA DESCRIPTIVA COMPETENCIAS ESTADISTICA DESCRIPTIVA COMPETENCIAS Descrbe e nterpreta las propedades de estadístca descrptva en problemas reales. Es asertvo con su opnón. Partcpa actvamente en forma ndvdual y grupal. SESIÓN 16 E S

Más detalles

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Tabla de contendos Ap.A Apéndce A: Metodología

Más detalles

Métodos específicos de generación de diversas distribuciones discretas

Métodos específicos de generación de diversas distribuciones discretas Tema 3 Métodos específcos de generacón de dversas dstrbucones dscretas 3.1. Dstrbucón de Bernoull Sea X B(p). La funcón de probabldad puntual de X es: P (X = 1) = p P (X = 0) = 1 p Utlzando el método de

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

UNIVERSIDAD DE SONORA

UNIVERSIDAD DE SONORA UNIVERSIDAD DE SONORA Dvsón de Cencas Exactas y Naturales Departamento de Matemátcas Estadístca Aplcada a las Lcencaturas: Admnstracón, Contaduría e Inormátca Admnstratva. Fascículo II: Estadístca Descrptva

Más detalles

Tema 1.3_A La media y la desviación estándar

Tema 1.3_A La media y la desviación estándar Curso 0-03 Grado en Físca Herramentas Computaconales Tema.3_A La meda y la desvacón estándar Dónde estudar el tema.3_a: Capítulo 4. J.R. Taylor, Error Analyss. Unv. cence Books, ausalto, Calforna 997.

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

Tema 1. Conceptos generales

Tema 1. Conceptos generales Análss de Datos I Esquema del Tema Tema. Conceptos generales. COCEPTOS PREVIOS. DEFIICIÓ DE MEDICIÓ 3. DEFIICIÓ DE ESCALAS DE MEDIDA 4. VARIABLES CLASIFICACIÓ Y OTACIÓ REGLAS DEL SUMATORIO 5. EJERCICIOS

Más detalles

Mª Dolores del Campo Maldonado. Tel: :

Mª Dolores del Campo Maldonado. Tel: : Mª Dolores del Campo Maldonado Tel: : 918 074 714 e-mal: ddelcampo@cem.mtyc.es Documentacón de referenca nternaconalmente aceptada ISO/IEC GUIDE 98-3:008 Uncertanty of measurement Part 3: Gude to the n

Más detalles

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS P L V S V LT R A BANCO DE ESPAÑA OPERACIONES Gestón de la Informacón ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS El proceso de ntegracón fnancera dervado de la Unón Monetara exge la

Más detalles

ANÁLISIS EXPLORATORIO DE DATOS

ANÁLISIS EXPLORATORIO DE DATOS ANÁLISIS EXPLORATORIO DE DATOS 1. INTRODUCCIÓN HISTÓRICA 2 1.1 La Estadístca como cenca 2 1.2 Algunos problemas que resuelve la Estadístca 2 2. INTRODUCCIÓN A LA ESTADÍSTICA 3 2.1. Concepto y Objetvo de

Más detalles

Hidrología superficial

Hidrología superficial Laboratoro de Hdráulca Ing. Davd Hernández Huéramo Manual de práctcas Hdrología superfcal 7o semestre Autores: Héctor Rvas Hernández Juan Pablo Molna Agular Rukmn Espnosa Díaz alatel Castllo Contreras

Más detalles

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)}

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)} Capítulo 4 1 N-cubos 4.1. Representacón de una funcón booleana en el espaco B n. Los n-cubos representan a las funcones booleanas, en espacos n-dmensonales dscretos, como un subconjunto de los vértces

Más detalles

SISTEMA DIÉDRICO I Intersección de planos y de recta con plano TEMA 8 INTERSECCIONES. Objetivos y orientaciones metodológicas. 1.

SISTEMA DIÉDRICO I Intersección de planos y de recta con plano TEMA 8 INTERSECCIONES. Objetivos y orientaciones metodológicas. 1. Objetvos y orentacones metodológcas SISTEMA DIÉDRICO I Interseccón de planos y de recta con plano TEMA 8 Como prmer problema del espaco que presenta la geometría descrptva, el alumno obtendrá la nterseccón

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA Estadístca www.aulatecnologa.com 1 ETADÍTICA DECRIPTIVA Lo prmero que buscamos con la Estadístca es el tratamento matemátco a partr de una nformacón epermental. Cuando queremos observar la evolucón de

Más detalles

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA . El Método de Dferencas Fntas El Método consste en una aproxmacón de las dervadas parcales por expresones algebracas con los valores de

Más detalles

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias Ejemplo: Consumo - Ingreso Ingreso Consumo Poblacón 60 famlas ( YX ) P = x [ YX ] E = x Línea de regresón poblaconal 80 60 Meda Condconal 40 20 00 [ X = 200] EY o o o o [ X = 200] EY 80 o o o 60 o 40 8

Más detalles

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA ANÁLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS () Contendos TEMA 4.4. Introduccón 4.5. Dstrbucones de frecuencas de varables cuanttatvas (datos agrupados) 4.6. Propedades de las dstrbucones de varables

Más detalles

Regresión Lineal Simple y Correlación

Regresión Lineal Simple y Correlación 4 Regresón Lneal Smple y Correlacón 4.1. Fundamentos teórcos 4.1.1. Regresón La regresón es la parte de la estadístca que trata de determnar la posble relacón entre una varable numérca, que suele llamarse

Más detalles

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas IES Menéndez Tolosa (La Línea) Físca y Químca - 1º Bach - Gráfcas 1 Indca qué tpo de relacón exste entre las magntudes representadas en la sguente gráfca: La gráfca es una línea recta que no pasa por el

Más detalles

Tema 8: DESIGUALDAD, Xisco Oliver Economía del Bienestar (2º GECO)

Tema 8: DESIGUALDAD, Xisco Oliver Economía del Bienestar (2º GECO) Tema 8: DESIGUALDAD, REDISTRIBUCIÓN Y POBREZA Xsco Olver 20610 - Economía del Benestar (2º GECO) Motvacón Benestar: el objetvo últmo del Estado es maxmzar el benestar El benestar se obtene a partr de las

Más detalles

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1 Reconocmento de Locutor basado en Procesamento de Voz ProDVoz Reconocmento de Locutor Introduccón Reconocmento de locutor: Proceso de extraccón automátca de nformacón relatva a la dentdad de la persona

Más detalles

6 Impacto en el bienestar de los beneficiarios del PAAM

6 Impacto en el bienestar de los beneficiarios del PAAM 6 Impacto en el benestar de los benefcaros del PAAM Con el fn de evaluar el efecto del PAAM sobre sus benefcaros, se consderó como hpótess que el Programa ha nfludo en el mejoramento de la caldad de vda

Más detalles

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo Evaluacón Económca de Proyectos de Inversón 1 ANTECEDENTES GENERALES. La evaluacón se podría defnr, smplemente, como el proceso en el cual se determna el mérto, valor o sgnfcanca de un proyecto. Este proceso

Más detalles

3. VARIABLES ALEATORIAS.

3. VARIABLES ALEATORIAS. 3. VARIABLES ALEATORIAS. Una varable aleatora es una varable que toma valores numércos determnados por el resultado de un epermento aleatoro (no hay que confundr la varable aleatora con sus posbles valores)

Más detalles

MEDIDAS DESCRIPTIVAS

MEDIDAS DESCRIPTIVAS Tema 2: MEDIDAS DESCRIPTIVAS DE LOS DATOS 1. MEDIDAS DE CETRALIZACIÓ: Meda Medana Moda Cuantles Otras 2. MEDIDAS DE DISPERSIÓ: Desvacón típca Varanza Rango Otras 3. MEDIDAS DE FORMA: Asmetría Apuntamento

Más detalles

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada. Introduccón a la Estadístca Empresaral Capítulo - Análss conjunto de dos varables Jesús ánchez Fernández CAPITULO - AÁLII COJUTO DE DO VARIABLE Presentacón de los datos Tablas de doble entrada En el capítulo

Más detalles

Estadística. Problemas de Estadística 1º Ciclo ESO Departamento de Matemáticas Raúl González Medina

Estadística. Problemas de Estadística 1º Ciclo ESO Departamento de Matemáticas  Raúl González Medina 1 Estadístca 01.- Indca que varables son cualtatvas y cuales cuanttatvas: a) Comda Favorta. b) Profesón que te gusta. c) Número de goles marcados por tu equpo favorto en la últma temporada. d) Número de

Más detalles

Unidad Nº III Unidad Aritmética-Lógica

Unidad Nº III Unidad Aritmética-Lógica Insttuto Unverstaro Poltécnco Santago Marño Undad Nº III Undad Artmétca-Lógca Undad Artmétca-Lógca Es la parte del computador que realza realmente las operacones artmétcas y lógcas con los datos. El resto

Más detalles

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Muestra: son datos de corte transversal correspondientes a 120 familias españolas. Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta

Más detalles