MEDIDA DE DIPERIÓ A. Una pregunta muy partcular que se puede hacer a una dstrbucón de datos es de qué magntud es es la heterogenedad que se observa. FICHA º 18 Las meddas de dspersón generalmente acompañan a las meddas de tendenca central por una razón básca: la meda artmétca nforma sobre cuál es el centro de gravedad pero qué tan homogénea es la dstrbucón. Conceptualmente, la pregunta por una estmacón de la heterogenedad está en la base de los estudos de desgualdad en la dstrbucón del ngreso, de benes culturales, del acceso a servcos socales. La comparacón de las meddas de desgualdad entre dos colectvos (por ejemplo, desgualdad de aprendzajes entre escuelas; ngresos entre países; de ngresos entre años dstntos) consttuye un enfoque problema de nvestgacón que se pregunta en qué dferen dos casos de nterés. Por lo general, las meddas de dspersón se utlzan conjuntamente con las meddas de tendenca central. De hecho, en algunas de las fórmulas para su cálculo se emplea drectamente la meda artmétca como referenca de dspersón. La dferenca entre las meddas obedece a una pregunta: mayor o EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ menor dspersón respecto de qué?. Las meddas que se han do desarrollando consttuyen sofstcacones matemátcas a las sucesvas respuestas dadas a esta pregunta. Por prncpo, las meddas de dspersón ubcan su referente de dspersón en la propa dstrbucón observada de los datos y no en relacón de un parámetro deal o deseable. Este no es el caso en todas las meddas de desgualdad. En el caso del índce de Gn para medr concentracón y desgualdad, su referente es deal: una dstrbucón completamente democrátca. B. Las meddas de dspersón más frecuentemente utlzadas son el rango, la varanza y el desvío estándar. Una medda smple que se podría proponer para analzar la dspersón es el rango. Éste se defne la dstanca entre el valor mínmo y el máxmo observados. Esta medda permtría observar qué tan ampla es la dstrbucón. Una medda mportante por ejemplo, cuando se comparan tamaños de hogares en dstntos países o regones de Amérca Latna. Tene un nconvenente mportante: el rango puede tomar valores máxmos y mínmos que son atípcos (con una frecuenca smple de 1, por ejemplo) o muy desvados o out-layers (valores extremadamente altos o extremadamente bajos en comparacón del resto de los valores). tro nconvenente es que dos dstrbucones pueden tener el msmo rango pero s se grafca la dstrbucón, se observaría dferencas muy mportantes. EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ La varanza es un estadístco que nforma sobre cuál es la dstanca promedo de las observacones a la meda artmétca de una dstrbucón. El desvío estándar se defne como la raíz cuadrada de la varanza y suele ser más utlzada para fnes descrptvos por razones de practcdad se utlza más frecuentemente. En el campo de la estadístca nferencal el desvío estándar presenta dfcultades por lo que por lo general se usa en su la varanza. C. La varanza y el desvío estándar se calculan sguendo la msma dea de encontrar un promedo en las dspersones de los valores observados respecto a su meda. La varanza se defne como el promedo de los cuadrados de las desvacones a la meda artmétca y se expresa algebracamente en la sguente forma: ( x x) El desvó o desvacón estándar es la raíz cuadrada de la varanza. Como se aprecará en el cuadro 18.1, sus valores son sensblemente más reducdos y por tanto manpulables. EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ ( x x) D. Algunas característcas de la varanza y del desvío son: Los símbolos utlzados para dentfcar a la varanza pueden ser dstntos según el contexto estadístco en que se los está utlzando: ) Las letra grega F " (sgma) se utlza para ndcar que la varanza ha sdo calculada en una poblacón (regstrada en un censo). ) ) Las letras latnas mayúscula y s mnúscula se emplean por lo general para referrse a las varanzas y tambén los desvíos pero sn el cuadrado) que se calculan en una muestra. En tal caso, se drá que la varanza calculada en una muestra ( s ) es un estmador de la varanza poblaconal ( F " ). Tambén puede representarse con la letra V. La varanza nunca tendrá valores negatvos. Esto se derva de la propa fórmula, donde cualquera sea el sgno de las desvacones a la meda, al elevarse al cuadrado tomarán valores postvos (esta es la prmera propedad de la varanza). Formalmente: 0 EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ la varanza toma valor 0, entonces se trata de una varable que toma el msmo valor en todas las undades. Es decr, se trata de una constante. se recuerda que una de las propedades de la meda artmétca nforma que la meda de la constante es gual a la constante, formalmente se tene que: ( k) ( k k) 0 0 Es de observarse que la anteror es la segunda propedad de la varanza. La varanza es sensble a la presenca de valores extremos, tal como lo es la meda artmétca, aunque es más estable que esta. En el cuadro sguente se ha presentado el msmo ejemplo de la Fcha nº17, y se ha calculado la varanza para cada una de las tres regones. E. guendo a Cortés (000:159 y ss) dstnguremos las sguentes otras cuatro propedades de la varanza. Tercera propedad: al sumar una constante a los valores orgnales de la varable, la varanza no se modfca. ) Formalmente: ( K + X) ( X) ) En el cuadro anteror, la columna que dentfca a la regón D presenta una dstrbucón del ngreso con los msmos valores que en la regón A pero se le han agregado 100U$ a cada hogar. se observa la EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ meda se ha ncrementado en 100 U$ (tercera propedad de la meda, Fcha nº17) pero la varanza y el desvío no se han modfcado. ) e demuestra que: ( K + X) Re ordenando: ( K + X K + X) ( X X + K K) ( K + X) ( X X) ( K + X) ( K + X) ( X) Cuarta propedad: s se multplcan los valores de la varable por una constante, la varanza de la nueva varable resultante será gual a la varanza orgnal por la constante. ) Formalmente: ) ( K* X) K * ( X) Por las propedades de la meda, se recuerda que en este caso la meda de la nueva varable será gual a la meda orgnal por la constante. De aquí que: EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ ( K* X) Re ordenando: ( K* X K* X) ( K* X) [ K( X X)] ( K* X) K ( X X) ( K* X) K * ( X) EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ Cuadro 18.1 mulacón de ngresos de los hogares en tres regones (Valores en dólares) Ingreso en la Regón A Ingreso en la Regón B Ingreso en la Regón C Ingreso en la Regón D Ingreso en la Regón E Hogar 1 88, 88, 88, 98. 88.0 Hogar 675,0 675,0 675,0 775.0 6750.0 Hogar 3 603,3 603,3 603,3 703.3 6033.3 Hogar 4 804,8 804,8 804,8 904.8 8047.5 Hogar 5 400,0 400,0 400,0 500.0 4000.0 Hogar 6 1066,7 1066,7 1066,7 1166.7 10666.7 Hogar 7 145,0 145,0 145,0 45.0 1450.0 Hogar 8 635,5 635,5 635,5 735.5 6355.0 Hogar 9 760,5 760,5 760,5 860.5 7605.0 Hogar 10 55,0 55,0 55,0 65.0 550.0 Hogar 11 1731, 1731. 1731, 1831. 17311.7 Hogar 1 79,0 79.0 79,0 379.0 790.0 Hogar 13 75,0 75.0 75,0 375.0 750.0 Hogar 14 48,6 48.6 483,0 58.6 485.8 Hogar 15 475, 475. 475, 575. 4751.7 Hogar 16 333,3 333,3 333,3 433.3 3333.3 Hogar 17 55,0 55,0 55,0 65.0 550.0 Hogar 18 781,8 781,8 781,8 881.8 7818.3 Hogar 19 99,3 99,3 99,3 109.3 99.5 Hogar 0 7,7 7,7 7,7 8.7 76.7 Hogar 1 65,0 650,0 6,5 75.0 650.0 Hogar 174,3 1743,0 17,4 1374.3 1743.3 Hogar 3 1373,5 13735,0 137,4 1473.5 13735.0 Meda artmétca 796,9 076,96 668,5 896.9 796.95 Varanza 15490.70 1399,5 360,75 15490.70 1549069.56 Desvío estándar 464.1 3731,34 485,8 464.1 464.10 Fuente: los valores para la regón A han sdo tomados de la Encuesta Contnua de Hogares (ECH) del Uruguay para el año 001 y corresponden a 3 hogares tomados de un departamento del Interor. EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ Qunta propedad: s los valores orgnales de uan varable se multplcan por una constante (K 1 ) y luego se le suma otra constante (K ), la varanza de la nueva varable será gual al cuadrado de la constante K 1 por la varanza orgnal. ) e demuestra que es una combnacón de las dos anterores ( K + K * X) 1 ( K + K * X) 1 ( K + K * X) 1 ( K + K * X) 1 propedades: [( K + K * X) ( K + K * X)] [( K K ) + ( K * X) ( K * X)] [( K * X) ( K * X)] [ K ( X X)] K ( X X)] ( K1 + K * X) ( K + K * X) K * ( X) 1 1 1 1 1 exta propedad: la varanza de un conjunto de observacones clasfcadas según las categorías de otra varable (nomnal u ordnal) es gual a la suma de la ntervaranza y la ntravaranza. ) La propedad se conoce tambén con el nombre de descomposcón de la varanza y es muy recurrda en dstntas aplcacones estadístcas. EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ ) ) v) Varable Z A pesar de que en su demostracón están nvolucradas dos varables (la varable de nterés, X, y la varable categórca, Z), en este caso puntual no se trata de una forma de análss bvarado, aunque luego dará lugar a una técnca específca: el análss de varanza. En el cuadro 18. se presenta esquemátcamente la propedad. La varanza de X en cada categoría de Z, ( j), se denomna varanzas nternas; el promedo ponderado de éstas genera la ntravaranza ( w). La varanza que se calcula a partr de las medas artmétcas de cada una de las categorías de Z, se denomna ntervaranza ( B). Cuadro 18. Esquema de la descomposcón de la varanza úmero de casos de X en cada categoría de Z (n ) Promedos para X en cada categoría de Z Varanzas de X en cada categoría de Z Categoría A a 0 a a Categoría B b 0 b b Categoría C c 0 c c............ Categoría J j 0 j j Total 0 EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández
MEDIDA DE DIPERIÓ v) Formalmente, la propedad establece que: + T B W v) Donde: W * B ( Y Y) EL CLEGI DE MÉXIC - CETR DE ETUDI CILÓGIC Programa de Doctorado en Cenca ocal : Estadístca I (003-004) oc. Tabaré Fernández