ESTADÍSTICA DESCRIPTIVA Grado de ADE. Prmer curso Raquel Mª Álvarez Esteba
Descrpcó umérca de ua varable Objetvo: Resumr dsttos aspectos de las dstrbucoes de frecuecas Iterés de los resúmees umércos: Uos pocos úmeros resume toda la dstrbucó Complemeto atural de la descrpcó gráfca Faclta la comparacó de muestras co modelos de refereca y la comparacó etre muestras
Descrpcó umérca de ua varable Meddas de poscó: Dvde u cojuto ordeado de datos e grupos co la msma catdad de dvduos. Cuartles, decles, cuatles, percetles Meddas de cetralzacó: Idca valores co respecto a los que los datos parece agruparse. Meda, medaa, moda, meda geométrca, meda armóca, Meddas de dspersó: Idca la mayor o meor cocetracó de los datos co respecto a las meddas de cetralzacó. Desvacó típca, coefcete de varacó, rago, varaza, recorrdo tercuartílco.., Meddas de forma: Asmetría Aputameto o Curtóss
Parámetros y estadístcos Parámetro: es ua catdad umérca calculada sobre ua poblacó La altura meda de los dvduos de u país La dea es resumr toda la formacó que hay e la poblacó e uos pocos úmeros (parámetros). Estadístco: es ua catdad umérca calculada sobre ua muestra (Cualquer fucó co los datos de la muestra destada a cuatfcar algú aspecto de la dstrbucó de frecuecas.) La altura meda de los dvduos de esta clase Somos ua muestra ( represetatva?) de la poblacó. S u estadístco se usa para aproxmar u parámetro també se le suele llamar estmador. Normalmete teresa coocer u parámetro, pero por la dfcultad que colleva estudar a TODA la poblacó, calculamos u estmador sobre ua muestra y cofamos e que sea próxmos. Hay que elegr muestras represetatvas, para que el error sea cofablemete pequeño.
Estadístcos de poscó y cetralzacó:
Meda
Meda Ejemplo: Muestra de tamaño 6, la meda: X 0 3 2 4 0,4 2 7 meda=[ (0*3) + (2*4) + (0,4*2) + (*7)] /6 = 0,987 Muestra de tamaño 00 se toma el peso e kg de las persoas. L - - L 50-60 30 60-70 25 70-80 20 80-90 0 90-00 0 00-05 5 Meda?
Meda Ejemplo: Muestra de tamaño 00 se toma el peso e kg de las persoas. L - - L m 50-60 30 55 60-70 25 65 70-80 20 75 80-90 0 85 90-00 0 95 00-05 5 05 m = (L - - L)/2 marcas de clase meda = 7 kg
Meda
Meda
Meda
cambo de escala: Y=bX ej. Cálculo de precos medos aplcado el IVA (2%) precos precos +IVA x x*,2x,2x* 0,9 3 2,70,089 3 3,27,3 6 7,80,573 6 9,44 2,5 8 20,00 3,025 8 24,20 3,9 5 9,50 4,79 5 23,60 5,9 4 23,60 7,39 4 28,56 7 2 4,00 8,47 2 6,94 total 28 87,60 28 06,00 meda 3,3 meda 3,79 meda=,2*3,3 cambo de orge: Y=a+X ej. Sueldo medo de los trabajadores de ua empresa después de u aumeto de 50 a todos
x x2 2 h elemetos X es la meda de esta poblaco xh h e total N elemetos x(h+) (h+) x(h+2) (h+2) (N-h) elemetos X2 es la meda de esta poblaco xn N meda de los N elemetos es=[(h*x)+(n-h)*x2]/n Ejemplo: salaro medo e España a partr del salaro medo de cada ua de las provcas.
Meda geométrca M... log M = x x x G 2 = log( G X = ) Muestra tabulada (dscreta) Muestra tabulada (cotua) 2 M G = x x2... x 2 M G = m m2... k k m k k dode m so las marcas de clase
Meda geométrca: M = x x... G 2 x Desvetajas: Dfícl de calcular (cfras muy elevadas: solucó tomar logartmos) S algú X =0, M G se aula No es relevate y puede ser u úmero complejo (úmero o real) s algú valor es egatvo Usado para promedar %, tasas, úmeros ídces (stuacoes dode la vble preseta varacoes acumulatvas). Ejemplo: C captal cal colocado a tatos utaros de terés aual durate años. Para calcular el tato de terés medo del perodo, o es la meda artmétca. S C es el captal al fal del año, etoces C=C(+ ) C2=C (+ 2) =C(+ ) (+ 2)... C=C- (+ )= =C(+ ) (+ 2) (+ ) El tato de terés medo será C= C(+ ) (+) Igualado ambas expresoes y despejado, se cumplrá = (+ ) (+ 2) (+ ) -
Meda armóca M H = X = Muestra tabulada (dscreta) M H = k = X Muestra tabulada (cotua) M H = k dode m = m so las marcas de clase
Meda armóca Desvetaja: flueca de los valores pequeños o se puede calcular s algú valor es 0 Usado para promedar aquello cuyas udades sea el cocete de dos magtudes smples: velocdades, redmetos, etc. Ejemplo: ídce de Paasche es ua meda armóca
Relacó etre las dferetes medas M H M G X
Estadístcos de orde Medaa
Medaa
Medaa Msma formula: Me = L j + ( L j L j / 2 N ) j j
Medaa
Medaa Ejemplo de cálculo para vble dscreta, a partr de la tabla de frecuecas: Me = 2
Medaa Datos agrupados e clases: buscar el tervalo e el que se alcaza la medaa, L ] [ L Me = L + N 2 N c
Moda Mo= Puto dode se alcaza el máxmo de la dstrbucó de frecuecas Hay dstrbucoes co varas modas (bmodales o multmodales)
Moda Mo= Puto dode se alcaza el máxmo de la dstrbucó de frecuecas Moda absoluta, moda relatva, tervalo modal
Moda Mo= Puto dode se alcaza el máxmo de la dstrbucó de frecuecas E dstrbucoes agrupadas, el tervalo modal es el de mayor desdad S queremos seleccoar u pto, dferetes crteros: [Mo= L- ] ; [Mo= L ]; El crtero más utlzado: Mo = L _ + d + d+ + d _ c d = c
Poscó relatva de meda, medaa y moda
Cuatles Cuatl de orde α es el valor de la varable por debajo del cual se ecuetra ua frecueca acumulada α. Casos partculares so los percetles, cuartles, decles, qutles,...
Cuatles: Percetl de orde p ( P p )= cuatl de orde p/00 (me deja a la zda el p% de la dstrbucó de frecuecas y a la drcha el (-p)% La medaa es el percetl 50 El percetl de orde 5 deja por debajo al 5% de las observacoes. Por ecma queda el 85% Cuartles: Dvde a la muestra e 4 grupos co frecuecas smlares. Prmer cuartl Q= Percetl 25 (p=0,25)= Cuatl 0,25 Segudo cuartl Q2= Percetl 50 (p=0, 5)= = Cuatl 0,5 = medaa Tercer cuartl Q3= Percetl 75 (p=0,75)= = cuatl 0,75
Cuatles: ejemplos El 5% de los recé acdos tee u peso demasado bajo. Qué peso se cosdera demasado bajo? Percetl 5 o cuatl 0,05 Percetl 5 del peso frecueca 0 5 0 5 20 25 2 3 4 5 Peso al acer (Kg) de 00 ños
Cuatles: ejemplos El colesterol se dstrbuye smétrcamete e la poblacó. Supogamos que se cosdera patológcos los valores extremos. El 90% de los dvduos so ormales Etre qué valores se ecuetra los dvduos ormales? Percetles 5 y 95 frecueca 0 5 0 5 20 80 200 220 240 260 Colesterol e 00 persoas
Cuatles: ejemplo Número de años de escolarzacó Porcetaje Frecueca Porcetaje acumulado 3 5,3,3 4 5,3,7 5 6,4, 6 2,8,9 7 25,7 3,5 8 68 4,5 8,0 9 56 3,7,7 0 73 4,8 6,6 85 5,6 22,2 2 46 30,6 52,8 3 30 8,6 6,4 4 75,6 73,0 5 73 4,8 77,9 6 94 2,9 90,7 7 43 2,9 93,6 8 45 3,0 96,6 9 22,5 98,0 20 30 2,0 00,0 Total 508 00,0 20%? 90%? Estadístcos Número de años de escolarzacó N Meda Medaa Moda Váldos Perddos 508 0 2,90 2,00 2 Percetles 0 20 25 30 40 50 60 70 75 80 90 9,00,00 2,00 2,00 2,00 2,00 3,00 4,00 5,00 6,00 6,00
Para calcularlo el cuatl de orde r/k se halla las frecuecas acumuladas y se busca el valor que ocupe el lugar (r/k)*n de la dstrbucó. S K=4, etoces tedremos los cuartles: r= prmer cuartl r=2 segudo cuartl (medaa) S K=0, etoces tedremos los decles: r=, prmer decl S K=00, etoces tedremos los percetles
Cuatles: ejemplos
Datos agrupados e clases: buscar el tervalo e el que se alcaza dcha frecueca : [ L, L ] _ C r, k = L _ + r N k N _ c S K=4, etoces tedremos los cuartles: S K=0, etoces tedremos los decles: S K=00, etoces tedremos los percetles
Meddas de dspersó
Meddas de dspersó Mde el grado de dspersó (varabldad) de los datos, depedetemete de su causa. Meddas de dspersó absolutas: Rago Recorrdo tercuartílco Varaza Desvacó típca o desvacó estadar Otras (desvacó respecto de la meda, desvacó respecto de la medaa) Meddas de dspersó relatvas: Coefcete de varacó Recorrdo sem-tercuartlco
Meddas de dspersó Rago ( o Ampltud) : Máxmo Mímo= X () - X () Dfereca etre observacoes extremas. Ej: 2,,4,3,8,4. El rago es 8-=7 Es muy sesble a los valores extremos. Rago/recorrdo tercuartílco: Es la dstaca etre prmer y tercer cuartl. Rago tercuartílco = P 75 - P 25 =Q 3 Q Parecda al rago, pero elmado las observacoes más extremas ferores y superores. (el 50% de los valores cetrales está ahí) No es ta sesble a valores extremos.
Meddas de dspersó Es sesble a valores extremos (alejados de la meda). Sus udades so el cuadrado de las de la varable. Muestra tabulada Vble dscreta Vble cotíua Varaza S 2 Mde el promedo de las desvacoes (al cuadrado) de las observacoes co respecto a meda. = x x S 2 2 ) ( dode m so las marcas de clase = = x x f x x S 2 2 2 ) ( ) ( = = x m f x m S 2 2 2 ) ( ) (
Meddas de dspersó Varaza S 2 Otra expresó para la varaza S 2 = ( 2 x ) x 2
Meddas de dspersó Desvacó típca S Es la raíz cuadrada de la varaza S = S 2 Msmas udades que la varable.
S 2 = Varaza: propedades ( x x) 2 Sempre es postva. Varaza=0 s y solo s todos los valores so guales (es decr, la varable es costate)
ejemplos Muestra Muestra 2 Muestra 3 6 6 6 6 6 6 7 6 6 8 8 7 8 8 9 9 0 0 0 0 0 0 0 0 N= 8 8 8 Medaa= 8 8 8 Rago= 4 4 4 S=,50,73,80 S*2=Var= 2,25 3,00 3,25
ejemplos
ejemplos U empresaro paga a sus vededores asalarados u salaro fjo más ua comsó. Los salaros fjos so:
Meddas de dspersó Desvacó meda respecto a la meda: D x = = x x Desvacó meda respecto a la medaa: D Me = = x Me
Meddas de dspersó: Coefcete de varacó CV: cocete etre desvacó típca y la meda Mde la desvacó típca e forma de qué tamaño tee co respecto a la meda (úmero de veces que la desvacó típca cotee a la meda artmétca.) També se la deoma varabldad relatva. Es frecuete mostrarla e porcetajes S la meda es 80 y la desvacó típca 20 etoces CV=20/80=0,25=25% (varabldad relatva) Es ua catdad admesoal. Iteresate para comparar la varabldad de dferetes varables. S el peso tee CV=30% y la altura tee CV=0%, los dvduos preseta más dspersó e peso que e altura. Solo para vbles postvas Faclta la comparacó (homogeedad) CV = S x
Meddas de dspersó: Recorrdo sem-tercuartlco RS: cocete etre el recorrdo tercuartílco y la suma del prmer y tercer cuartl R = Q 3 Q Q 3 + Q
Mometos Mometos muestrales Mometos respecto al orge Mometo de orde k=,2 Mometos respecto a la meda Mometo de orde k=,2.. La dstrbucó de frecuecas queda defda por todos sus mometos k k x a = = k k X x m = = ) (
Meddas de smetría
Meddas de smetría Coefcete de asmetría de Fsher (g ó CA) = = = = = = 3 3 3 3 3 ) ( ) ( x x x S X x S X x S m g CA k x x k S X x S X x CA = = = = 3 3 3 ) ( ) ( S la dstrbucó está tabulada 3 3 S x m g CA = =
Meddas de smetría Coefcete de asmetría de Pearso Ap A p = x Mo S Dstrbucó smétrca Ap=0 Dstrbucó asmétrca postva Ap>0 Dstrbucó asmétrca egatva Ap<0
Meddas de smetría Coefcete de asmetría de Bowley: A B = CAB = ( Q 3 + Q 2Me) Q 3 Q Dstrbucó smétrca AB=0 Dstrbucó asmétrca postva AB>0 Dstrbucó asmétrca egatva AB<0
Meddas de forma Coefcete de curtoss o aputameto g 2 g 4 ( x X ) m4 = 2 = 3 = 4 4 S x Sx 3 S g2 >0, está más aputada que la dstrbucó ormal, se deoma leptocúrtca. S g2 <0, está meos aputada que la dstrbucó ormal, se deoma platcúrtca. g2 =0, msmo aputameto que la ormal: mesocúrtca.
Meddas de forma Coefcete de curtoss o aputameto g2 S g2 >0, está más aputada que la dstrbucó ormal, se deoma leptocúrtca. S g2 <0, está meos aputada que la dstrbucó ormal, se deoma platcúrtca. g2 =0, msmo aputameto que la ormal: mesocúrtca.
Tpfcar/estadarzar ua varable Ua varable se deoma tpfcada o estadarzada, s su meda es cero y su varaza es uo. Para tpfcar ua varable se hace la sguete trasformacó: Z = x x S
CONCENTRACIÓN Estudamos la CONCENTRACIÓN para varables cuattatva postvas e las cuales la suma de los valores dvduales tee el setdo de u todo del cual cada dvduo partcpa co ua parte. La dea es aalzar el grado de gualdad o falta de esta e el reparto del todo. Ejemplos: La rqueza de la poblacó de u país Los salaros de los empleados de ua empresa o de u sector La poblacó de los mucpos de ua provca No tee setdo e varables como la altura, el úmero del pe, etc La cocetracó oscla etre ua stuacó e la cual u dvduo tee el todo y el resto o tee ada (máxma cocetracó) y ua stuacó e la que todos los dvduos tee exactamete la msma catdad (cocetracó míma). Costruremos el Ídce de G para medr estas stuacoes y la curva de Lorez para vsualzar el grado de cocetracó
Cocetracó: ídce de G P=N/N proporcoes acumuladas de poblacó q=u/u proporcoes acumuladas de la vble, dode u = x j j j= El ídce de G está etre 0 y El ídce de G toma el valor 0 cuado hay gualdad, es decr s todos los dvduos dspoe de gual parte del todo (míma cocetracó) El ídce de G toma el valor cuado hay máxma desgualdad, es decr, u dvduo dspoe del todo y el resto de dvduos o tee gua parte (máxma cocetracó)
Cocetracó: curva de Lorez Ejemplo:
Cocetracó: curva de Lorez Empresa A x N x* u: Acum x* p q p-q 0 0 800 5 5 2000 2000 0,5 0,057 0,093 000 20 35 20000 32000 0,35 0,52 0,98 200 30 65 36000 68000 0,65 0,323 0,327 500 20 85 30000 98000 0,85 0,466 0,384 7500 5 00 2500 20500,000 0,000 Sumas - 2,0023753 IGA 0,508765 =,0023753/2 0,9 0,8 0,7 0,6 q 0,5 0,4 0,3 0,2 0, 0 0 0, 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 p
ejemplo: curva de Lorez
Ejemplo cocetracó ZONA IG= 0,48 ZONA 2 IG= 0,094 coclusó? Cocetracó baja e las dos zoas. Meor cocetracó e zoa 2
Empresa A x N x* u: Acum x* p q p-q 0 0 800 5 5 2000 2000 0,5 0,057 0,093 000 20 35 20000 32000 0,35 0,52 0,98 200 30 65 36000 68000 0,65 0,323 0,327 500 20 85 30000 98000 0,85 0,466 0,384 7500 5 00 2500 20500,000 0,000 Sumas - 2,0023753 IGA 0,508765 =,0023753/2 Empresa B x N x* u: Acum x* p q p-q 0 0 800 0 0 8000 8000 0, 0,065 0,035 000 30 40 30000 38000 0,4 0,308 0,092 200 35 75 42000 80000 0,75 0,648 0,02 500 24 99 36000 6000 0,99 0,939 0,05 7500 00 7500 23500,000 0,000 Sumas - 2,24 0,28048583 IGB 0,252689 =0,28048583/2,24
0,9 0,8 0,7 0,6 q 0,5 0,4 0,3 0,2 0, 0 0 0, 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 p