1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos en ella el valor 0.5 y el valor de la varable correspondente. S no aparece el 0.5 nterpolamos. Ordenamos los ntervalos de menor a mayor, y como antes buscamos F = 0.5 para saber en que ntervalo estamos y aplcamos la fórmula: 1 Me = l + a n Debemos dferencar dos casos: Para ntervalos de gual ampltud buscamos aquel que Moda Cuartles Decles Percentles Es el valor de la varable que más veces aparece, es decr el valor de la varable con mayor frecuenca absoluta. Son meddas de poscón cuyo cálculo se realza gual que la medana. Los cuartles son 4, Q 1 (F =0.5),Q (F = 0.5), Q 3 (F 3 = 0.75), y Q 4 (F 4 = 1). Suele ser necesaro nterpolar, aunque la defncón nos dce que el cuartl prmero es el valor de la varable que deja por debajo al menos el 5% de la muestra. Son meddas de poscón cuyo cálculo se realza gual que la medana. Los decles son 10, D 1 (F = 0.1), D (F = 0.),... D 8 (F 8 = 0.8), y D 10 (F 10 = 1). Suele ser necesaro nterpolar, aunque la defncón nos dce que el decl prmero es el valor de la varable que deja por debajo al menos el 10% de la muestra. Son meddas de poscón cuyo cálculo se realza gual que la medana. Los percentles son 100, P 1 (F = 0.01), P 0 (F 0 = 0.),... P 80 (F 80 = 0.8), y P 100 (F 100 = 1). Suele ser necesaro nterpolar, aunque la defncón nos dce que el percentl prmero es el valor de la varable que deja por debajo al menos el 1% de la muestra. presente mayor n 1 1 = n n 1 Mo = l + a 1 + = n n + 1 Para ntervalos de dstnta ampltud calculamos una nueva columna h = n /a, que nos permte comparar los ntervalos equtatv. Buscamos el ntervalo con mayor h 1 1 = h h 1 Mo = l + a 1 + = h h + 1 Buscamos el ntervalo que contene el cuartl buscado como hacíamos en la meda y aplcamos la fórmula: q 1 Q q = l + a 4 Sendo q = 1,, 3, ó 4 n Buscamos el ntervalo que contene el decl buscado como hacíamos en la meda y aplcamos la fórmula: d 1 D d = l + a 10 Sendo d = 1,,..., 10 n Buscamos el ntervalo que contene el percentl buscado como hacíamos en la meda y aplcamos la fórmula: P p = l + a p 100 1 n Sendo p = 1,, 3,..., 50,..., 100
Medda Meddas de dspersón = Varanza S x = = 0 Desvacón típca S x = = = 0 ( x x) Datos no agrupados ( x x) Datos agrupados n n - x n = = x = x n x = x - x x x Recorrdo ntercuartílco R.I = Q 3 Q 1 Q3 Q1 Recorrdo sem ntercuartílco R.S.I = Coefcente de varacón C.V = x Sx 100 Varables bdmensonales, momentos. Momentos a mn = Respecto al orgen x m y n n j j m ab = Respecto a la meda a ( x x) ( y y) j b n j Ejercco 1 En una clínca nfantl se han do anotando durante un mes el número de metros que el nño anda segudo sn caerse el prmer día que comenza a camnar. Se obtuveron los sguentes datos: º d emetros 1 3 4 5 6 7 8 º de nños 5 6 11 10 3 1 Calcular: a) La tabla de frecuencas b) Dagrama de barras para frecuencas relatvas c) Dagrama de barras para frecuencas acumuladas absolutas d) Meda artmétca y desvacón típca e) S la dstanca recorrda se ncrementa un 10%, cuál es el número medo y la desvacón típca de metros recorrdos? f) S la dstanca se ncrementa en o,5 metros, cómo varían esos parámetros muestrales? Resolucón apartado a) Para crear la tabla de frecuencas calculamos la frecuenca absoluta acumulada, la frecuenca relatva y la frecuenca relatva acumulada. º de metros 1 3 4 5 6 7 8 º de 5 6 11 10 3 1
3 nños(n ) 7 13 4 34 37 39 40 f 0.05 0.15 0.15 0.75 0.5 0.075 0.05 0.05 F 0.05 0.175 0.35 0.6 0.85 0.95 0.975 1 Como vemos el sumatoro de las frecuencas absolutas nos da el tamaño muestral y la suma de las frecuencas relatvas nos da 1. Resolucón apartado b y c) 0.75 0.5 0.15 0.15 0.075 0.05 0.05 Resolucón apartado d) La meda y varanza son: La meda es 4.1 y la varanza S = 1.5779733 =.489999736 Resolucón apartado e) S la dstanca recorrda por el nño aumenta un 10%, lo que hacemos es multplcar la varable por 0.1. S multplcamos una varable por una constante, la meda queda multplcada por esa constante y la varanza multplcada por esa constante al cuadrado.
4 Resolucón apartado f) S la dstanca que recorre cada nño se ncrementa en 0.5 metros, lo que ocurre es que le estamos sumando una constante a la varable. En este caso al sumarle una constante a la varable la meda que da sumada por la constante y la varanza no se modfca. La varanza como ya vmos no camba al sumarle una constante. Ejercco Un profesor mparte dos asgnaturas x e y de un msmo curso y establece el aprobado en 5 puntos. En una determnada convocatora los resultados obtendos por los alumnos en cada asgnatura fueron: Puntuacón 0 1 3 4 5 6 7 8 9 10 n x 3 3 4 6 4 1 8 4 4 1 1 n y 0 1 3 9 1 4 4 3 4 6 4 a) Cuál de las ods asgnaturas es en térmnos relatvos más dfícl? b) En cuál de las dos asgnaturas la dspersón de las notas es mayor? c) S un alumno saca un 6, en qué asgnatura obtene mejor clasfcacón? Resolucón apartado a) Para compara muestras utlzamos el coefcente de varacón de Pearson, que nos da la relacón entre la varabldad y la meda de la muestra.
5 Las meddas que caracterzan a la varable x son: Las meddas que caracterzan a la varable y son: La meda de la varable x es 4.64 y la desvacón típca.378463 La meda dela varable y es 5.46 y la desvacón típca es.568889 La medana en la asgnatura x es 5, mentras que en la asgnatura y es 4, por lo que la asgnatura y parece ser más dfícl Resolucón apartado b) La varable x presenta mayor grado de dspersón que la varable y. Resolucón apartado c)
6 Ejercco 3 Se consdera una varable estadístca x cuyo dagrama de frecuencas acumuladas relatvas aparece representado en la fgura sguente: 1 0.5 1 3 Calcular: a) La meda b) La varanza c) El porcentaje de observacones que son menores o guales a.5. d) El valor de la muestra tal que un 5% de las observacones sean menores o guales que él. Resolucón apartado a) Para poder calcular la meda debemos conocer culaes son las frecuencas de los dferentes valores que toma la varable estadístca en estudo. La frecuenca relatva acumulada es la frecuenca resultante de sumar las frecuencas relatvas, y por tanto: X 3 F 0.5 1 f 0.5 1 0.5 = 0.5 La meda es.5 Resolucón apartado b) La varanza es:
7 Resolucón apartado c) Queremos conocer cual es el tanto por cento de ndvduos de la muestra que están por debajo del valor de la varable.5. Para ella nterpolamos: 1 x 0.5 1.5 3 Resolucón apartado d) El valor de la varable que deja a la zquerda al menos el 5% de la muestra es el, ya que como vemos hasta ese valor de la varable se acumula ya el 50% de la muestra. Ejercco 3 En un estudo sobre un determnado tpo de plantas se estuda la longtud folar. Los resultados obtendos fueron: x 1 3 4 5 6 7 8 9 10 n 1 1 33 1 7 35 5 37 5 15 a) Dbujar el dagrama de barras y el polígono de frecuencas b) Calcular meda medana, moda, varanza y prmer cuartl. c) Representar el hstograma de frecuencas absolutas y el polígono de frecuencas para los ntervalos de clase, 0.5-3.5, 3.5-5.5, 5.5-7.5, 7.5-10.5 d) Para esta agrupacón calcular medda, medana, moda, prmer cuartl, percentl 60 y el rango percentl de valor 4.5.
8 Resolucón apartado a) Resolucón apartado b) Calculamos las frecuencas relatvas y relatvas acumuladas: Para calcular el prmer cuartl más exactamente nterpolamos, aunque la defncón nos dce que el prmer cuartl es el valor de la varable que deja a la zquerda al menos al 5% de la muestra. El prmer cuartl se corresponde con el valor 0.5 de la frecuenca acumulada, y por tanto: 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0. 0.1 1 3 4 5 6 7 8 9 10
9 Resolucón apartado c) S agrupamos en ntervalos tenemos que crear una nueva tabla de frecuencas, con una nueva columna con la marca de clase o punto medo de cada ntervalo, y con las nuevas frecuencas asgnadas a cada ntervalo. Tenemos la columna con la marca de clase x, la frecuenca absoluta y absoluta acumulada, la frecuenca relatva y relatva acumulada, y la columna h. Esta nueva varable debemos calcularla sempre que trabajemos con ntervalos de dstnta ampltud para poder calcular la moda. Al ser los ntervalos de dferente ampltud no podemos tener solo en cuenta la frecuenca a la hora de calcular la moda, es necesaro tomar cada ntervalo con su frecuenca pero en relacón a la ampltud de dcho ntervalo. Resolucón apartado d) La meda sufre una pequeña varacón debdo a que al agrupar los datos en ntervalos se perde nformacón, aunque se gane en facldad de cálculo. En el caso de ntervalos para calcular la medana, moda, cuartles, decles y Percentles tenemos fórmulas:
10 La moda vene dada por: En prmer lugar buscamos el ntervalo que la contene y que será el ntervalo cuya h sea mayor. Una vez encontrado el ntervalo, que en este caso se corresponde con el ntervalo 5.5-7.5, aplcamos la fórmula. El prmer cuartl vendrá dado por: En prmer lugar buscamos el ntervalo que lo contene y que será el ntervalo cuya F sea el prmer valor superor a 0.5. Una vez encontrado el ntervalo, que en este caso se corresponde con el ntervalo 0.5-3.5, aplcamos la fórmula.
11 Percentl 60: Lo prmero es localzar el ntervalo que contene al menos el 60% de la muestra y cuya frecuenca relatva absoluta sea la nmedatamente superor a 0.6. En este caso es el ntervalo 5.5-7.5 El rango percentl 4.5. En este caso sabemos el valor de la varable y lo que nos nteresa saber es el porcentaje de muestra que queda por debajo de este valor. Para conocer el ntervalo con el que debemos trabajar buscamos en que ntervalo se encuentra el valor de la varable 4.5 y aplcamos la fórmula:
1
13 Cuestón S la recta de regresón de y sobre x es y = a 1 x + b 1, y la d ex sobre y es y = = a x + b, Qué expresón tomará el coefcente de correlacón? Aplcarlo al caso de las rectas: Y = x + 3 y = 3 x - 1 El coefcente de correlacón de Pearson vene dado por la raíz del producto de las pendentes o coefcentes de regresón de las rectas de y sobre x y de x sobre y. El problema es que en este caso ambas rectas de regresón están despejadas en funcón de y, o lo que es lo msmo en la recta de x/y hemos nvertdo el coefcente de regresón y por tanto el coefcente de correlacón de Pearson es: En la recta de x/y la varable que debe estar despejada es la x, y por tanto las rectas de regresón son: Cuestón 3 La recta de regresón de y sobre x es y = -x y la de x sobre y es y = - x + 4. Calcular: a) Coefcente de regresón b) Coefcente de correlacón c) Meda de x y de y. d) S la varanza de x es, cuánto vale la varanza de y? Resolucón apartado a) Los coefcentes de regresón son las pendentes de las rectas de regresón:
14 Resolucón apartado b) El coefcente de correlacón es la raíz cuadrada del producto de las pendentes: Resolucón apartado c) Las dos rectas de regresón se cortan al menos en un punto, el punto ( x, y ) ambas ecuacones obtendremos ambas medas:. S resolvemos el sstema formado por Resolucón apartado d)
15 Cuestón 3 En un estudo sobre de termnadas parcelas se obtuveron los sguentes datos: Resolucón La relacón funconal más empleada es la lneal. Para saber s una relacón funconal es buena utlzamos el coefcente de correlacón de Pearson.
16 Según esto la varable que mejor expresa y sería la varable x. Vamos ahora a calcular los valores de y esperados para los valores de x y z dados. Prevamente y a partr de los datos aportados por el problema calculamos las rectas de regresón de y/x y la de y/z: Al calcular y a partr de la varable x obtenemos un valor absurdo, a pesar que la relacón funconal de tpo lneal exstente entre ellas era muy buena. Sn embargo la relacón entre z e y era peor pero al fjarnos en los datos dados en el problema el resultado obtendo con esta relacón es mucho mejor. Esta contradccón aparente tene una fácl explcacón, la relacón entre x e y es muy buena en el rango estudado cuando extrapolamos para obtener un resultado la relacón ya no es buena. mentras que en la relacón entre z e y es gual de buena cuando nterpolamos y cuando extrapolamos. Cuestón 4 En un estudo de regresón lneal entre las varables x peso de una persona e y presón sstólca, se encontraron las rectas de regresón con ecuacones: Y = 5 x + 1 Y = 0.01 x + 4 a) Cuál debería ser la recta de regresón de y/x?, y la de x/y? B) Habría una dependenca lneal grande entre ambas varables x e y? Resolucón La recta de x/y está despejada en funcón de y:
17 Cuestón 5 En un estudo de regresón lneal entre dos varables estadístcas (x, y) se determnó la recta de regresón de y sobre x, y de x sobre y. Supongamos que en la recta de y/x cuando x = 4 obtenemos un valor para y = 7, mentras que en la recta de regresón de x/y cuando y = 7 obtenemos un valor para x = 4. Puede garantzarse que r es necesaramente ± 1?. S es así justfcarlo, y s no, explcar que puede decrse sobre los valores de las medas artmétcas de x y de y. Resolucón Las dos rectas de regresón ya vmos que se cortan en al menos un punto que es el punto ( x, y ) podemos hacer dos suposcones: El punto (, y ) coefcente de correlacón de Pearson.. En este caso x = (4, 7). En este caso no podemos afrmar nada sobre el valor que puede tomar el El punto ( x, y ) (4, 7). En este caso ambas rectas pasan por el punto (, y ) x y por el punto (4, 7). Dos rectas que tengan dos puntos comunes concden. En este caso podemos afrmar que el valor del coefcente de correlacón de Pearson es ± 1. Cuestón 6 Cuáles de los sguentes pares pueden ser los coefcentes de regresón de y sobre x y de x sobre y en este 1 1 1 1 orden de dos rectas de regresón?,, (-3, -5), 3,, 3,. Explcar por qué y calcular r cuando sea 5 3 5 5 posble. Resolucón
18 Cuestón 7 (examen febrero 96) En el estudo de la asocacón de dos varables (X, Y) se obtuveron los datos (, 3), (3, 4). Calcular el coefcente de correlacón lneal para esta muestra de datos. puede afrmarse a partr de los datos que exste una buena relacón lneal entre las varables en la poblacón? Cuestón 8 Dada una varable bdmensonal X e Y que se estuda en 0 ndvduos, puede ocurrr que una muestra presente coefcente de correlacón de Pearson gual a cero?. y un coefcente V de Kramer dstnto de cero? Cuestón 9