EXAMEN DE ESTADÍSTICA SEGUNDA CONVOCATORIA ORDINARIA. 2001-2002 2 o curso de Ingeniería Técnica de Informática de Sistemas. Departamento de Estadística e Investigación Operativa 1. En el problema de la recta de mínimos cuadrados de Y sobre X (y = a + bx). (a) Define e interpreta la varianza residual de Y sobre X, S 2 e(y X). (b) Demuestre la relación entre las varianzas: S 2 Y, S2 Y (varianza de los valores ajustados) y S2 e(y X). (c) Define el coeficiente de determinación de Y sobre X, y justifique su interpretación. Se trata de una pregunta teórica que se encuentra desarrollada en los apuntes de la asignatura. 2. Se tienen dos urnas; la urna A contiene 5 bolas rojas y 3 blancas y la urna B contiene 1 bola roja y 2 blancas. Se lanza un dado equilibrado; si en el dado se obtiene un 3 o un 6, se extrae al azar una bola de B, que se introduce en A, y luego se extrae al azar una bola de A; si se obtiene otra puntuación en el dado, se extrae al azar una bola de A, que se introduce en B, y luego se extrae al azar una bola de B. Se pide calcular (a) Probabilidad de que al final del juego en la urna B, solamente queden dos bolas blancas. (b) Probabilidad de que las dos bolas extraídas sean rojas. Apartado (a) Apartado (b) P [B 1 ] = P [D 3,6 R B ] ] = P [D 3,6 ] P [R B D3,6 regla multipl. = 2 1 6 3 = 1 9 = 0.11111 P [RR] = P [ (D 3,6 R B R A ) (D c 3,6 R A R B ) ] = disj. = P [(D 3,6 R B R A )] + P [ (D3,6 c R A R B ) ] = regla multipl. = 2 1 6 6 3 9 + 4 5 2 6 8 4 = 61 216 = 0.2824 3. Sea la variable bidimensional (X, Y ), cuya tabla de frecuencias conjunta es X/Y 1 5 20 4 n 11 4 n 13 5 7 n 22 n 23 9 n 31 n 32 n 33 18 29 3
Se conocen los datos y x=9 = 6, x y=20 = 19 3, f 23 = 0.04 y la frecuencia relativa marginal de X = 5 que es 0.4. (a) Estudie la dispersión y la asimetría de la variable Y. (b) Estudie la posible existencia de observaciones outliers para la variable Y. (c) Complete la tabla. (d) Estudie la dependencia lineal entre ambas variables. Son independientes? Apartado (a) Para realizar estos cálculos no es necesario completar la tabla conjunta previamente, ya que la distribución de la variable Y la conocemos de forma completa Y n j 1 18 5 29 20 3 50 Medidas de dispersión (ȳ = 4.46, Q 1 = 1, Q 3 = 5) son S 2 y = 18.9684, S Y = 4.3527, CV Y = 0.97652, Rg(Y ) = 19, IQR Y = 4 Medidas de asimetría de la variable son γ Y 1 = 2.54618, As Y P = 0.12399 Apartado (b) Usando el método basado en la desviación típica, para k = 3 Para el método basado en el rango intercuartílico ( 8, 60582, 17.52582) [Q 1 1.5IQR, Q 3 + 1.5IQR] = [ 5, 11], [Q 1 3IQR, Q 3 + 3IQR] = [1, 17], Apartado (c) Se completa la tabla planteando las siguientes ecuaciones (1) ȳ x=9 = 1 n 31 + 5 n 32 + 20 n 33 = 6 (2) x y=20 = 4 n 13 3 + 5n 23 3 + 9 n 33 3 = 19 3 (3) f 23 = n 23 n = 0.04 (4) f 2 = 7 + n 22 + n 23 = 0.4 n (5) n = 18 + 29 + 3 = 50 (6) n 11 + 7 + n 31 = 18 (7) 4 + n 22 + n 32 = 29 (8) n 13 + n 23 + n 33 = 3 De (3) y utilizando (5) se obtiene n 23 = 0.04 50 = 2. De (4) y utilizando (3 y 5) se obtiene n 22 = 20 7 2 = 11. De (7) y utilizando lo anterior se obtiene n 32 = 14. De (2) y utilizando (8) se obtiene 4n 13 + 5 2 + 9(1 n 13 ) = 19; de donde 5n 13 = 19 9 10, es decir n 13 = 0. De (8) y utilizando lo anterior n 33 = 1 0 = 1.
De (1) y utilizando lo anterior n 31 + 5 14 + 20 1 = 6(n 31 + 15), de donde 5n 31 = 70 + 20 90, es decir n 31 = 0 y de (6) se obtiene n 11 = 11. X/Y 1 5 20 4 11 4 0 15 5 7 11 2 20 9 0 14 1 15 18 29 3 50 Apartado (d) Para estudiar la dependencia lineal utilizamos el coeficiente de correlación lineal r y vemos si r 2 0.75, ya que si es así, se diría que la dependencia lineal es aceptable (si fuese 1, la dependencia lineal es exacta): S X,Y = 2.566, r = 0.28445, r 2 = 0.08091 0.75 (S 2 X = 4.29, S X = 2.07123) Por otro lado se comprueba que las dos variables no son independientes, ya que por ejemplo no se cumple la condición de que las filas de la tabla conjunta de frecuencias absolutas sean proporcionales. 4. Sea X una variable aleatoria con función de densidad f(x) = kx + 1 2, para todo x [, 1]. (a) Determinar los valores de k para los cuales f(x) es ciertamente una función de densidad. (b) Calcular la esperanza y la moda de X. (c) Para qué valores de k se minimiza la varianza de X? Apartado (a) Debe verificarse que f(x) 0, para todo x [, 1]. Se han de distinguir dos casos: (a) Si k > 0, la función de densidad es una recta con pendiente positiva. Por lo tanto, tiene que imponerse que f() = k + 1/2 0, es decir, k 1/2. (b) Si k < 0, la recta tiene ahora pendiente negativa, por lo que es necesario que f(1) = k + 1/2 0, luego k /2. Se comprueba además que f(x) dx = 1, para cualquier valor de k, así que, de acuerdo con esto y lo visto anteriormente, para que f(x) sea función de densidad, k debe pertenecer al intervalo [/2, 1/2]. Apartado (b) Calculemos la esperanza de la variable X E [X] = x f(x) dx = x (kx + 1 2 ) dx = 2k 3 Por otra parte, para calcular la moda debemos tener en cuenta, al igual que en el primer apartado, el signo de la constante k. La moda es el valor que maximiza la función de densidad f(x). Ya que ésta es una función derivable en el intervalo [, 1], y además su derivada es igual a k, se obtiene que: (a) Si k > 0, entonces la moda de la variable X es 1. (b) Si k = 0, la moda es cualquier punto en el intervalo [, 1]. (c) Si k < 0, la moda es -1. Apartado (c) La varianza de la variable X es var(x) = E [ X 2] (E [X]) 2. Se tiene que E [ X 2] = x 2 f(x) dx = ( x 2 kx + 1 ) 2 dx = 1 3 De este modo, y conociendo, por el segundo apartado del problema, que E [X] = 2k 3, obtenemos que var(x) = 1 ( ) 2 2k 3 = 1 3 3 4k2 9 y se comprueba que esto se maximiza cuando k = 0, y se minimiza para k = ± 1 2, ya que se trata de una parábola cóncava.
5. Elija la opción que crea correcta en las siguientes cuestiones: Figura 1: Tabla dinámica Cuestión 1. para La pestaña que aparece en la tabla dinámica de la figura 1 junto al rótulo categoría sirve (a) hacer más grande la celda correspondiente. (b) abrir un menú de opciones sobre apariencia de la celda. (c) seleccionar las modalidades de categoría que se mostrarán en la tabla. (d) Ninguna de las anteriores. Cuestión 2. La función estadística frecuencia devuelve un rango de datos, por esta razón al salir del cuadro de diálogo de la figura 2 es necesario utilizar la combinación de teclas (a) Ctrl+Alt+F3. (b) Ctrl+Mayús+F1. (c) Ctrl+Mayús+Intro. (d) Ctrl+Alt+Intro. Cuestión 3. La utilidad de tablas dinámicas de Excel permite que en el interior de la tabla aparezcan diferentes tipos de datos como por ejemplo promedios o frecuencias absolutas de la submuestra de datos asociada a la categoría de fila y columna correspondiente. Cuál de los siguientes indicadores no está disponible en el menú de datos de dicha utilidad? (a) Máximo. (b) Suma. (c) Producto. (d) Mediana.
Figura 2: Cuadro de diálogo de la función frecuencia Cuestión 4. Supongamos que en una hoja de Excel los datos se encuentran en las casillas A1, A2 y A3 conteniendo respectivamente los números 1, 3 y 5, y en la C15 se escribe =A1+A$2+$A3. Si seleccionamos la casilla C15 y arrastramos con el ratón un lugar hacia abajo, el resultado que se obtendrá será: (a) 9. (b) 8. (c) 4. (d) 6. Cuestión 5. Al seleccionar en la barra de menús, Herramientas-Análisis de datos-estadística descriptiva, y modificar posteriormente los datos del rango de entrada, se modifican también los resultados? (a) Sí, automáticamente. (b) No, de ninguna forma. (c) Sí, si se especifica previamente. (d) Sí, si se especifica posteriormente. Las respuestas correctas son: cuestión 1 (c) cuestión 2 (c) cuestión 3 (d) cuestión 4 (d) cuestión 5 (b)