Probabilidades y Estadística Práctica 6 Ejercicio Nº 1 Sea X = la proporción de tiempo en la que se encuentra sin niebla, en funcionamiento, el aeropuerto de Ezeiza, y sea Y = la misma proporción para Aeroparque. El conjunto de posibles valores de (X,Y) es el rectángulo D={(x,y): 0<=x<=1, 0<=y<=1}.Suponer que la función de densidad conjunta de (X,Y) está dada por: 6/5(x+y 2 ) 0<=x<=1, 0<=y<=1 f(x,y)= 0 afuera del intervalo a) Verificar que es una función de densidad. b) Calcular la probabilidad de que ninguno de los dos aeropuertos se encuentren funcionando más de ¼ del tiempo. c) Calcular las funciones de densidad marginales de X e Y. d) Calcular la probabilidad de que Aeroparque se encuentre funcionando entre ¼ y ¾ del tiempo. e) Analizar la independencia de ambas variables. Ejercicio Nº 2 Calcular la Covarianza (x,y) como Cov(x,y) = E(x,y)-E(x).E(y), dada la siguiente función de densidad conjunta para las variables x e y definida para las siguientes condiciones: x+y=1, 0<=x<=1, 0<=y<=1. 24xy en la región descripta f(x,y)= 0 afuera.
de donde se dedujo que la función de densidad marginal de x es 12x(1-x) 2 0<= x <=1 f x (x) = 0 afuera. donde f y (y) es idéntica a f x (x) reemplazando y por x. Ejercicio Nº 3 Suponer la siguiente tabla de probabilidades p(x,y), para los valores de x e y indicados: y p(x,y) 0 100 200 x 100.20.10.20 250.05.15.30 a) Verificar que sea una función de probabilidades b) Calcular las probabilidades marginales c) Evaluar la independencia de las variables x e y d) Calcular la Covarianza(x,y)= E(x,y)-E(x).E(y) Ejercicio Nº 4 Dadas las siguientes muestras, calcular los coeficientes de correlación r AB, r AC, r CD, r DB y discutir su valor. Graficar los diagramas de dispersión correspondientes. A 10.1 11.1 15.1 9.2 10.3 12.4 13.1 11.1 11.0 9.0 B 11.1 12.1 16.1 10.2 11.3 13.4 14.1 12.1 12.0 10.0 C 10.1 9.1 5.1 11.0 9.9 7.8 7.1 9.1 9.2 11.2 D 9.1 8.1 4.1 10.0 8.9 8.8 13.1 10.1 8.2 12.2 Ejercicio Nº 5
Dadas las siguientes muestras, construir el diagrama de dispersión, calcular el coeficiente de correlación y discutir su valor: X 8 9 2 3 6 7 10 11 6 13 14 4 Y 7 6 3 2 6 5 5 5 3 4 3 4 Ejercicio N º 6 Hallar el coeficiente de correlación lineal para los siguientes conjuntos de datos: a) X: 6 8 10 12 14 6 10 10 8 12 16 18 16 14 12 16 14 Y: 4 8 6 4 6 10 8 10 12 8 6 6 10 8 12 10 14 b) Agregar a la parte a) los siguientes datos: X: 18 20 20 22 24 24 Y: 16 14 18 18 14 16 c) Agregar a la parte b) los siguientes datos: X: 28 28 30 30 Y: 22 24 22 24 d) Graficar los datos en cada caso e) Cómo ha variado el coeficiente de correlación en los distintos casos? Difieren significativamente de cero? Difieren entre si? Sacar conclusiones. Ejercicio Nº 7 Dados los datos de temperatura y precipitación mensual correspondiente a distintas estaciones de la Argentina, para el período 1961-1970: a) Tomando la misma variable en Paraná Aero (Paraná_Aero.xls) y Santa Rosa Aero (Sta Rosa_Aero.xls), realizar el diagrama de dispersión, calcular la recta de regresión y el coeficiente de correlación. Repetir para ambas variables. b) Discutir la validez de las regresiones. c) Qué porcentaje de la varianza total de la regresión explica la recta? d) Repetir a) a c) para la misma estación en las dos variables. Ejercicio Nº 8
Tomando la precipitación de Santa Rosa Aero y las anomalías de temperaturas de la superficie del Mar (SST) para las 4 regiones que figuran en el archivo datos_sst_tp.xls para el período 1960-1993: a) Realizar el diagrama de dispersión. b) La recta de regresión. c) El coeficiente de correlación. d) Qué porcentaje de la varianza total de la regresión explica la recta? Ejercicio Nº 9 a) Evaluar los intervalos de confianza para un ρ = 0.75 al 95%. b) Evaluar la significancia de la correlación entre la temperatura y la precipitación de las estaciones analizadas en el Ejercicio 7. En qué casos puede decir que existe una correlación lineal? c) Evaluar si la relación lineal entre temperatura y precipitación de la estación Paraná es significativamente diferente de la estación Sta Rosa. Ejercicio Nº 10 a) Suponiendo que se realiza una regresión entre dos muestras de 50 datos cada una, y resulta un coeficiente de correlación igual a -0.40. Indique el mejor nivel de significancia para el cual es significativa esta relación. b) Cómo es la distribución de r para ρ= 0 y para ρ 0? c) Qué significa que el coeficiente de correlación entre dos muestras sea igual a cero?, Qué ocurre con el valor del coeficiente de correlación cuando dos muestras son independientes? d) Calcular el intervalo de confianza del coeficiente de correlación de la población de la cual se extrajo un r de 0.5, en una muestra de 70 datos. Ejercicio Nº 11 Se correlacionaron las series de precipitación mensual de 3 años de distintas estaciones entre sí. Se desea establecer que grupos de estaciones tienen igual variabilidad en su régimen de precipitación a través de estos coeficientes de correlación. Se presentan en la tabla los coeficientes de correlación entre estaciones.
Estación A Estación B Estación C Estación D Estación A 1 0.40 0.32 0.29 Estación B 1 0.18 0.21 Estación C 1 0.45 Estación D 1 a) Decida qué correlaciones se pueden considerar significativamente distintas de cero, con un nivel de significancia del 5%. b) En el caso de considerar rabb,, contestar verdadero o falso en las siguientes afirmaciones, justificando todas sus respuestas: i) La recta explica el 40% de la varianza de la regresión lineal. ii) El 40% de los datos están sobre la recta de regresión. iii) La recta explica el 16 % de la varianza de la regresión. iv) Si r fuera cero no existe ningún tipo de regresión. v) Si r fuera -1 todos los puntos están sobre la recta de regresión. Ejercicio Nº 12 El siguiente gráfico es un diagrama de dispersión para los caudales medios mensuales en la represa Salto Grande y las precipitaciones totales mensuales observadas en Paso de los Libres durante los meses de enero del período 1952-1999. Tomando la Precipitación como X y los caudales como Y obtenemos: x i y i 26691123.68 y i 133796.87 x i 6775.2 (x i ) 2 1451627.26 N 48 (x i x medio )(y i y medio ) 7805695.34 y medio 2787.43 x medio 141.15 σ y 2546.23 σ x 101.58 a) Podría aseverar que existe una relación de tipo lineal con un nivel de significancia del 5%? Qué porcentaje de la varianza esta explicada por esta relación? Justifique su respuesta. b) Estas variables responden a la siguiente función de densidad conjunta:
(576 10 6 ) -1 X + (1536 10 6 ) -1 Y 0 X 600 0 Y 1600 f(x,y) = 0 afuera i) Cuál es la probabilidad de que en un mes de enero la precipitación en Paso de los Libres alcance como máximo los 300mm? ii) Cómo se modifica esta probabilidad si se sabe que para ese mes el caudal medio en Salto Grande a lo sumo fue de 400 m 3 /seg? Ejercicio Nº 13 Dos variables responden a la siguiente función de densidad conjunta: f(x,y) = 4Y -2 - XY 0 X 2 1 Y 2 0 afuera iii) Cuál es la covarianza de estas dos variables? iv) Son independientes dichas variables? Ejercicio Nº 14 Tras muchos años de estudio varios investigadores llegaron a la conclusión de que la precipitación en el NE de Brasil esta altamente influenciada por el fenómeno de El Niño. Encontraron que la correlación es de r = 0.58 usando series de 70 datos. Es correcto afirmar que esta serie pertenece a una población de ρ = 0.7?