Estadística 1 ESTADÍSTICA 07-08. Hoja 1. La tabla siguiente muestra la distribución conjunta de las variables X=número de horas semanales de clase e Y=retribución mensual en euros de los profesores de una determinada Facultad: Y\ X 3 4 5 6 7 8 1050-1350 0 0 3 4 0 0 1350-1500 0 1 7 0 6 0 1500-1800 0 0 4 3 10 8 1800-50 0 0 0 7 8 15 10 50-700 0 3 1 0 0 0 700-3000 5 0 6 0 0 0 N a) Calcular la media, mediana, desviación típica y cuartiles para la variable X, sabiendo que x i n i = 716 i=1 N y que x i n i = 4440. i=1 b) Calcular el porcentaje de profesores que dan menos de 6 horas y ganan más de 1800 euros. c) Qué porcentaje de profesores es mayor, el de los que dan menos 6 horas, respecto de los que ganan más de 50 euros o el de los que dan más de 5 horas respecto de los que ganan menos de 1500 euros?. Sean X e Y variables estadísticas con distribución conjunta: X\Y 0 1-1 1 b 0 c 0 a 0 1 3 1 g 1 d e f a) Completar la tabla y obtener las distribuciones marginales de X e Y. b) Calcular x y s X. Cuál será la mediana de Y? c) Son X e Y independientes? d) Obtener la distribución de frecuencias de X condicionada a Y = y la de Y condicionada a X 0. 3
Estadística e) Obtener la distribución de la variable Z = X + Y. f ) Calcular fr(x < 1 4, Y < 0) y fr(xy < 3 ). 3. La variable X toma los valores 0 y 1 con f X (0) = 0,4; la variable Y toma los valores 1 y y se conocen: f Y/(X=0) (1) = 0,5 y f Y/(X=1) (1) = 0,4. Obtener la tabla de doble entrada para (X,Y). 4. Dada la siguiente tabla de frecuencias absolutas X\ Y y 1 y x 1 n 11 n 1 n 1. x n 1 n n. n,1 n, N Demostrar que si las variables X e Y son independientes entonces n 11n n 1 n 1 = 1. 5. Considera las siguientes distribuciones de frecuencias relativas marginales: X = x i 1 3 4 f i 0, 0,3 0,4 0,1 Y = y j 1 1 f j 0,6 0,4 Suponiendo que las variables X e Y son estadísticamente independientes: a) Obtén la distribución conjunta de frecuencias relativas del vector estadístico bidimensional (X, Y ). b) Calcula la media de la variable Y/X 3. 6. Dada la tabla de frecuencias relativas X/Y y 1 y x 1 a b x b a Determinar los valores de a y b que hacen que las variables estadísticas X e Y sean independientes. 7. Una jugadora de baloncesto, cuando lanza dos tiros libres, tiene los siguientes porcentajes de resultados: Tiro o \ Tiro 1 o Anota Falla Anota 4 % 1 % Falla A % % a) Determinar el valor de A. b) Cuál es el porcentaje de aciertos en el lanzamiento del primer tiro? Y en el lanzamiento del segundo? c) Cuál es el porcentaje de veces que anota alguno de los dos tiros libres?
Estadística 3 d) Si fall el primer tiro, cuál es el porcentaje de veces que anota el segundo? e) Son independientes los resultados en el primer y en el segundo tiro? 8. A los alumnos de química de determinada asignatura se les ha preguntado sobre el número de horas semanales que dedican a la asignatura (X) y el número de convocatorias consumidas (Y), obteniéndose la siguiente información: el 80 % de los alumnso que estudian 6 horas han consumido convocatorias. el número medio de convocatorias consumidas por los alumnos que estudian 4 horas es 1.5. el número medio de convocatorias consumidas es 1.. una fracción 0.06 de los alumnos que estudian horas a la semana han consumido una sola convocatoria. El resto de los datos se encuentran resumidos en la siguiente tabla: Obtener a, b, c y d.. Los corredores buenos dan más pasoso por segundo a medida que aumentan la velocidad.he aquí el promedio de pasos por segundo de un grupo de corredores de élite a distintas velocidades. La velocidad se expresa en metros por segundo: Velocidad 4,83 5,14 5,33 5,67 6,08 6,4 6,74 pasos por segundo 3,05 3,1 3,17 3,5 3,36 3,46 3,55 a) Quieres predecir el número de pasos por segundo a partir de la velocidad. Para ello dibuja un diagrama de dispersión. b) Describe la relación que observas y calcula el coeficiente de correlación. c) Halla la recta de regresión del número de pasos por segundo a partir de la velocidad. Traza dicha recta en el diagrama de dispersión. 10. Sean X e Y dos variables estadísticas con distribución conjunta de frecuencias relativas: X\Y 0 1 0.1 0. 4 0.5 0. Obtener la recta de regresión de Y sobre X.
Estadística 4 11. Un conjunto de datos bidimensionales (X, Y ) tienen coeficiente de correlación r = 0,8 y las medias de las distribuciones marginales son X = 3 y Ȳ = 10. Razonar porqué las siguientes ecuaciones no corresponden a la recta de regresión de Y sobre X r 1 y = x + 16 r y = 1,5x + 1 r 3 y = 3,5x + 0,5 1. Las rectas de regresión de dos variables estadísticas X e Y son: x+y=7 y x+3y=13. Calcular las medias, los coeficientes de regresión, el coeficiente de correlación lineal y las varianzas residuales, sabiendo que SY = 4. 13. Las rectas de regresión de dos variables estadísticas X e Y son: y=4x+4 e y=x+3. Si la varianza de X es igual a 1, obtener las medias marginales de X e Y, el coeficiente de correlación lineal y las varianzas residuales para ambas regresiones. 14. Las rectas de regresión de dos variables estadísticas son y x = 5 e y x = 1. Obtener la proporción de variablidad de Y explicada por X. 15. Un tren de mercancías realiza el trayecto Valladolid-Sevilla con velocidad aproximadamente constante y sin detenerse en ningún punto intermedio. En su viaje, el tren atraviesa diversas ciudades entre las que está Madrid. El maquinista ha observado que transcurridas seis horas desde la salida, el tren ya ha superado Madrid y se encuentra a 7 Km de esta ciudad, a las siete horas a 50 Km y después de ocho horas a 0 Km. a) Da una estimación de la velocidad a la que circula el tren y de la distancia que recorre desde que sale en Valladolid hasta que llega a Madrid. b) Predice la distancia recorrida por el tren después de 7 horas de viaje y proporciona un índice que mida la validez de dicha predicción. 16. En un estudio para relacionar las variables X= número de semanas de gestaciónçon Y= peso en gramos del bebé al nacer, se obtuvieron los siguientes resultados: n = 5 xi = 17 yi = 15555 x i = 7785 y i = 41351 xi y i = 617055 Hallar la recta de regresión de Y sobre X y utilizarla peara predecir el peso de un bebé con 40 semanas de gestación. Es bueno el ajuste realizado con esta recta de regresión?. 17. Dados los datos (x 1, y 1 ),(x, y ),(x 3, y 3 ),(x 4, y 4 ), las rectas de regresión son: y = x + 1 y = 3x 1 a) Cuál es la recta de regresión de X sobre Y? b) Cuánto valen x e y?
Estadística 5 c) Obtener el coeficiente de correlación lineal. 18. Sean ( 1, a), (b, 1), (0, c) y (1, 3) un conjunto de datos de la variable (X, Y ) cuyas rectas de regresión son: y + x = 5, x + y 5 = 1. Calcular a, b y c. 1. Considar el siguiente conjunto de datos bidimensionales: x 1 1 3 4 4 5 6 6 y.1.5 3.1 3.0 3.8 3. 4.3 3. 4.4 Sin efectuar cálculos, razonar cuál de los siguientes valores puede ser su coeficiente de correlación: a) 0.3 b) -0. c) -0.1 d) 0. 0. Indica razonadamente cul es el coeficiente de de correlacin: 0., 0, -0.57, que corresponde a cada uno de los siguientes conjuntos de datos, sin realizar operaciones: Datos 1: (-1., -.7), (-1.,.7), (-.3,-1.), (-.3, 1.), (-3,0). Datos : (-1.01, -.3), (-.0, -.3), (-3.1, -3.1), (-4.13, -3.6). Datos 3: (-.,-1), (-1.03,-4.3), (-0,-3.8), (-0.1,-.3). 1. El consumo de un vehículo y la velocidad a la que circula son variables íntimamente relacionadas? Para decidir sobre esta cuestión se han recogido los siguientes datos (donde la velocidad se mide en Km por hora y el consumo en litros por cada 100 Km recorridos con la velocidad correspondiente): Velocidad (Km/h) 30 45 55 70 85 Litros/100 Km,8 8,4 7,8 8,4,8 a) Las variables consumo y velocidad están relacionadas linealmente? Justifica tu respuesta empleando un índice o medida adecuada para ello. b) Responde a la cuestión planteada al comienzo del problema, razonando tu respuesta. En caso afirmativo, propón un modelo matemático (función exponencial, logarítmica, polinómica, etc.) que permita representar correctamente la relación existente entre la velocidad y el consumo.. Para una distribución bidimensional de frecuencias se han obtenido las rectas de regresión 7x 4y + = 0 y 0x 11y 70 = 0. Calcular los valores medios de X e Y. Qué información se puede obtener de estas ecuaciones acerca de las varianzas marginales de X e Y? Calcular el coeficiente de correlación lineal de las variables X e Y.
Estadística 6 3. Para dos variables estadísticas X e Y, las rectas de regresión son y = 3 x, x = 4y. Calcular el coeficiente de correlación lineal, las medias de X e Y, y la relación existente entre las dos varianzas. 4. Un investigador sabe que el cuadrado del coeficiente de correlación de dos variables X e Y es 0,81. Sabiendo que una de las rectas de regresión pasa por los puntos (4, 5) y (6, ) podrías determinar r? De ser así, da su valor. Razona la respuesta. 5. Estudiar el caso de rectas de regresión ortogonales. 6. La tabla siguiente presenta tres conjuntos de datos preparados por el estadístico Frank Anscombepara ilustrar los peligros de hacer cálculos sin antes representar los datos. x A y A x B y B x C y C 10 8,04 10,14 8 6,58 8 6,5 8 8,14 8 5,76 13 7,58 13 8,74 8 7,71 8.81 8.77 8 8,84 11 8,33 11,6 8 8,47 14,6 14 8,10 8 7,04 6 7,4 6 6,13 8 5,5 4 4,6 4 3,1 8 5,56 1 10,84 1,13 8 7,1 7 4,8 7 7,6 8 6,8 5 5,68 5 4,74 1 1,5 Calcula los coeficientes de correlación y las rectas. Dibuja por último los correspondientes diagramas de dispersión. A qué conclusión llegas?