1 Medidas de Tedecia Cetral La Media La media (o promedio) de ua muestra x 1, x,, x de tamaño de ua variable o característica x, se defie como la suma de todos los valores observados e la muestra, dividida por el úmero total de observacioes, es decir, 1 X ejemplo si los datos so x 1 1, x, x 3 3, etoces la media es 1/3(1++3). i 1 X i. Por La Mediaa Dado u cojuto de observacioes x 1, x,, x, de la variable o característica x, se defie la mediaa de este cojuto de valores, como aquel valor que o es superado i supera a más de la mitad de las observacioes, arregladas e orde de magitud creciete o decreciete.
Cálculo de la Mediaa: Ordear los datos e orde de magitud creciete X X,..., X, etoces la mediaa esta defiida mediate la siguiete fórmula: ( 1), () ( ) Me X X ( + 1) / ( / ) + X ( / + 1) E el ejemplo previo, la mediaa Me. si es impar si es par Nota: E geeral, la mediaa o se ve afectada por valores muy grades o por valores muy pequeños e los datos e comparació a la media. Por ejemplo, si x 3 40, la media es 1/3(1++40)14.33, si embargo la mediaa es Me.
3 La Moda La moda de ua muestra x 1, x,, x, es aquel valor de la variable que se preseta co mayor frecuecia; es decir es el valor que más se repite, y se deota por Mo. Los Percetiles Los percetiles so valores que divide a la muestra ordeada e forma ascedete (o descedete) e 100 partes iguales, y se deota por, i 1,,...,99. Cálculo de los Percetiles: 1. Se ordea los datos e forma ascedete (o descedete) X ( 1) X (),..., X ( ) (ó X (,..., ), X ( 1) X (1) ). P i,
4. Se determia el percetil de acuerdo a lo siguiete: * Si * Si i( +1) 100 i( +1) 100 es u etero, etoces P i X i(+ 100 es fraccioario, hacemos ua iterpolació lieal etre los dos valores correspodietes a las dos observacioes etre las cuales se ecuetra la fracció. 1) Observació: Para el caso e que i 5,50,75, se deomia cuartiles, y cuado i 10,0,..., 90, se deomia deciles.
5 Medidas de Dispersió La Variaza La variaza de ua muestra x 1, x,, x de ua variable o característica x, se defie como la media del cuadrado de las desviacioes de las observacioes co respecto al promedio de esos datos. La variaza muestral etoces queda defiida como: S i ( X X ) 1 1 i 1 Por ejemplo la variaza de x 1 1,x,x 3, es 1/[(1-) +(-) +(3-) ]1.
6 U posible icoveiete para la iterpretació de la variaza es que, por el efecto del cuadrado e la defiició, o está expresada e las mismas uidades que los datos, sio e su cuadrado (por ejemplo, si los datos se toma e metros, la variaza se expresará e metros cuadrados). Como ua maera de elimiar este icoveiete, se defie la desviació estádar. Desviació Estádar La desviació estádar se defie por la raíz cuadrada positiva de la variaza. ( X X ) 1 S 1 i i 1 La desviació estádar de x 1 1,x,x 3, es 1 σ (1 ) ( ) (3 ) + + 1 1. 3 1
7 Rago El rago se calcula como la diferecia etre el máximo valor y el míimo valor presetes e el cojuto de datos: R X X. máx mí Rago Itercuartil El rago itercuartil es la logitud del itervalo dode está coteido el 50% cetral de los datos: RI Q3 Q1 o RI P75 P5.
8 Medidas de Tedecia Cetral (datos tabulados) La Media Si los datos ha sido clasificados e m clases e ua tabla de frecuecias co marca de clase y i ( y i puto medio de cada clase) y frecuecia absoluta i, la media aritmética de estos datos está defiida por: i 1,,..., m, X 1 i m 1 y i i La Mediaa Hay que distiguir si la variable es discreta o cotiua.
9 Variable Discreta: El procedimieto para calcular la mediaa es: 1. Se costruye la tabla de distribució de frecuecias absolutas acumuladas meor que.. Se determia la meor frecuecia absoluta acumulada N j que supera a /. Es decir < N j E esta situació puede ocurrir que N j 1. O sea que se puede teer N j 1 N j
10 i. Cuado > N j 1, etoces la mediaa es: Me y j. ii. Cuado N j 1, e esta situació se acostumbra a tomar como valor de la mediaa Me y j + y 1 j. Variable Cotiua: el procedimieto cosiste e: 1. Costruir la distribució de frecuecias absolutas acumuladas meor que.. Determiar la meor de las frecuecias absolutas acumuladas N j tal que N j >
11 E esta situació puede ocurrir que N j 1. Es decir, se puede teer N < j 1 N j i. Si ocurre que N j 1, la mediaa está dada por: Me ' y j 1 dode ' y j 1 el límite iferior de la clase mediaa. N > j ii. Si ocurre que 1, la mediaa está dada por: Me y N N j 1 j ' j 1 + c j N j j N j 1 c amplitud de la clase mediaa Frecuecia absoluta acumulada de la clase mediaa
1 Los Percetiles La fórmula para el cálculo de los percetiles es la siguiete: P i y ' j 1 + c j i N 100 N j N j 1 j 1 dode ' y j 1 límite iferior de la clase que cotiee a P i. c j amplitud de la clase que cotiee a P i. N j frecuecia absoluta acumulada de la clase que cotiee a P i.
13 La Moda Hay que distiguir si la variable es discreta o cotiua. Variable Discreta: E este caso la moda se determia fijádose e el valor de la variable que más se repite. Variable Cotiua: La fórmula para ecotrar la moda es la siguiete: Mo y ' j 1 + c j j j 1 ( j j 1 ) + ( j j+ 1) dode: ' y j 1 límite iferior de la clase modal. j frecuecia absoluta de la clase modal. c j amplitud de la clase modal.
14 Medidas de Dispersió (datos tabulados) La Variaza La variaza para datos tabulados está dada por la siguiete fórmula : S m i ( Y Y ) 1 1 i i 1 dode: i frecuecias absolutas, Desviació Estádar Y i marcas de clase, Y promedio. Está dada por S S.
15 Diagramas de Caja El diagrama de caja (Boxplot) es ua represetació gráfica de los datos que permite aalizar cojutamete ua serie de medidas uméricas, tales como el míimo, el máximo, la mediaa y los cuartiles. E este gráfico es posible observar características de los datos como simetría y posibles observacioes atípicas. Los pasos a seguir para la costrucció del diagrama de caja so los siguietes: 1. Ordear los datos y obteer X mí, X máx, Q 1, Q, Q 3.. Dibujar u rectágulo cuyos extremos sea Q 1 y Q 3, e idicar Q mediate ua líea.
16 3. Calcular los límites admisibles superior e iferior: LI LS Q Q 1 f Q *( Q3 1) 1 + f Q * ( Q3 1) Se cosidera posibles valores atípicos a los situados fuera del itervalo ( LI, LS). El factor f puede variar etre diferetes textos o software estadísticos. Alguos de los valores más usados de f so f 0. 75 y f 1. 5. 4. Dibujar ua líea que vaya desde cada extremo del rectágulo al valor más alejado o atípico. 5. Idicar todos los datos que está fuera del itervalo admisible marcádolos como atípicos.
17 Ejemplo Cosidere el siguiete cojuto de datos (putajes de escala de depresió). 5 6 8 8 9 9 10 11 11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 0 0 A partir de estos datos costruyamos u diagrama de caja.
18 Costrucció del Diagrama de Caja. 1. Primero calcularemos la mediaa, puesto que el úmero de observacioes es 45 ( impar) la mediaa es aquel valor que ocupa la ubicació (45+1)/, e los datos ordeados e forma ascedete, es decir, la observació 3. Etoces, Me16.. Del cojuto de datos se ecotrará que Q 1 13 y Q 3 18. 3. Tomado f 1. 5 teemos que LI 5. 5 y LS 5. 5. 4. Existe dos observacioes que está fuera del itervalo admisible. El gráfico se muestra a cotiuació.
19 Diagrama de Caja 0 depscore 15 10 5 0 'Box plot of Koopmas depressio scores'