PROBABILIDAD Y ESTADÍSTICA PROPUESTAS PARA UNA AUTOEVALUACIÓN DE LOS FUNDAMENTOS TEÓRICOS En lo que sigue le presentamos 50 puntos que fueron incluidos en diferentes evaluaciones finales de los fundamentos teóricos. En algunos casos son solo ejercicios de aplicación de propiedades que debería conocer. Estos 50 puntos no responden al orden en que fueron desarrollados los temas de la asignatura. Le recomendamos abordar esta propuesta una vez que haya finalizado su preparación para un examen final. En caso que tuviese dificultades con algún punto, le sugerimos ubicar el tema en los materiales de estudio y realizar una nueva lectura de los mismos. También es conveniente que recurra a los textos recomendados en la bibliografía o a cualquier texto de la temática que esté a su alcance. Si aún así no lograra responder a algún punto recurra a las instancias de consulta de los docentes de la asignatura, mostrando su elaboración. Los docentes solo lo guiarán para que por sus propios medios encuentre la respuesta. Esperamos que esta nueva propuesta resulte un aporte para alcanzar mejores aprendizajes. 1) En una compañía donde trabajan 20 hombres y 30 mujeres la media aritmética de las edades es igual a 42 años. Así mismo se conoce que la media aritmética de las edades de los hombres es de 45 años. Permiten los datos disponibles calcular la media aritmética de las edades de las mujeres? En caso afirmativo determine la misma, de lo contrario diga qué información le estaría faltando. 2) Una industria tiene 3 fábricas: A, B y C. Los 40 obreros de la fábrica A ganan en promedio $280 por día; en cambio los 26 obreros de B y los 34 obreros de C ganan en promedio $350 y $300 respectivamente. Son los datos suficientes para calcular lo que ganan en promedio los obreros de esa industria? En caso afirmativo calcule dicho valor de lo contrario diga qué información le estaría faltando. 3) El número de veces que una red de computadoras se bloquea sigue un proceso de Poisson a razón de 2 bloqueos por semana. Cuál es la distribución del número de bloqueos por año (52 semanas) de la red de computadoras? Fundamente su respuesta. 4) Un gerente de producción desea conocer si la duración media de cierto tipo de pilas para calculadoras es superior a 25 horas. Explique el procedimiento a seguir para informar al gerente. 5) Analice cuál o cuales de las siguientes afirmaciones son incorrectas. Justifique Si los sucesos A y B son excluyentes, entonces: a) P(A) + P(B) = 1 b) P(A B) = c) P(A B) = 1
6) a) Enuncie las hipótesis implicadas que permiten obtener la función de probabilidad puntual en el modelo Binomial. b) Sea X Binomial (n = 100, p = 0.30). Calcule E(X) y V(X). Interprete los valores obtenidos. c) Explique por qué se puede utilizar la distribución normal para calcular P(X 40), siendo X la variable del ítem b). 7) Dos variables aleatorias X e Y se distribuyen normalmente con media 0. Se conoce además que P(X 2) = P(Y 3). Cuál de las dos variables tiene mayor variancia? Justifique, de ser posible, sin realizar cálculos. 8) A partir de una misma muestra aleatoria simple de una población normal se construyen los siguientes intervalos de confianza para la media poblacional: I 1 : (30; 36) I 2 : (28; 38) I 3 : (31; 35) Podría decidir cuál de los tres intervalos fue calculado con un mayor nivel de confianza. Justifique. 9) Sea Y = 2X +10. Se conoce que E(X) = 4 y V(X) = 1. Son los datos disponibles suficientes para calcular E(Y), V(Y) y el coeficiente de correlación entre X e Y? Justifique. 10) Represente gráficamente las curvas de densidad correspondientes a dos variables aleatorias con distribución normal, que tengan diferentes medias e igual desviación estándar. 11) a) Cómo se distribuyen las medias aritméticas de muestras extraídas al azar de una población normal? b) Qué pasa si las muestras provienen de una población con distribución desconocida? Justifique en ambos casos. 12) Cuando se realiza la estimación de la media de una población normal, a través de un intervalo de confianza, el error de estimación será menor cuanto menor sea la amplitud del intervalo. De qué depende la longitud de dicho intervalo de confianza? Cómo se puede hacer para disminuir la amplitud, conservando el nivel de confianza? 13) Explique la diferencia entre dos sucesos excluyentes y dos sucesos independientes (de un mismo espacio muestral). 14) Defina probabilidad condicional y diga cuándo dos sucesos de un espacio muestral son independientes. 15) Defina e interprete el significado de la variancia de una variable aleatoria discreta. Ejemplifique. 16) Qué significa que una variable aleatoria se distribuye uniformemente en el intervalo [40, 60]?
17) Explique qué significa que un intervalo de confianza para un parámetro tiene una confiabilidad de 0.95. 18) Presente una situación que vincule la distribución exponencial con la distribución de Poisson. Explique cómo es dicha vinculación. 19) Enuncie dos propiedades para la esperanza matemática y para la variancia de una variable o más variables aleatorias. 20) Analice si hay error en las siguientes afirmaciones. a) Si el número de buques tanques que llegan a una refinería sigue una ley de Poisson a razón de dos buques por día, entonces el tiempo que transcurre entre la llegada de dos buques sigue una ley exponencial con media igual a dos días. b) Si la desviación estándar de un conjunto de datos es igual a cero entonces todos los datos son iguales a cero. c) Si el coeficiente de correlación entre dos variables aleatorias es igual a 1 entonces existe una relación lineal entre las variables con pendiente igual a 1. 21) Establezca la relación entre el tamaño de la muestra, el nivel de confianza y el error de estimación al estimar la media de una población normal con desviación estándar conocida. Interprete además el significado del nivel de confianza. 22) Cada 10 minutos pasa por una parada un colectivo de cierta línea. Explique qué significa que el tiempo de espera de una persona en particular para abordar un colectivo de dicha línea se distribuye uniformemente en el intervalo (0, 10). 23) Enuncie el teorema central del límite y muestre una aplicación del mismo. 24) Defina coeficiente de correlación entre dos variables aleatorias y explique qué significa un coeficiente de correlación sea igual a 1. 25) Analice, justificando, si la siguiente afirmación es verdadera o falsa: Si X es una variable aleatoria con distribución normal de parámetros y entonces, ( - 1.96 / n + 1.96 / n ) es un intervalo de confianza del 95 % para la media muestral. 26) Defina E(X) y V(X) cuando X es una variable continua. Explique además por qué la variancia puede expresarse como una media o esperanza matemática. 27) a) Sea X la variable aleatoria cantidad de veces que se presenta un suceso A en n ensayos independientes de Bernoulli, siendo P(A) = p. Diga cuál es el recorrido de la variable aleatoria X y con qué probabilidad asume cada valor. X b) Suponga que p = P(A) es desconocida. Explique porqué es un buen n estimador de p y diga cuál es su distribución cuando n es convenientemente grande. En este caso enuncie el teorema o propiedad que justifica tal distribución.
28) Pruebe que si todos los sueldos de los empleados de una fábrica aumentan en un 20%, el coeficiente de variación de los sueldos antes y después del aumento es el mismo. 29) Explique qué representa el área encerrada por un histograma sobre un intervalo. 30) La siguiente tabla corresponde a la función de distribución acumulada para la variable aleatoria X: número de solicitudes por día para el uso de una sala de conferencias: x 0 1 2 3 4 F X 0.07 0.22 0.67 0.92 1 Permiten los datos de la tabla calcular la media, la variancia, la mediana y la moda de X? En caso afirmativo determine dichos valores y explique qué cuantifican los mismos. 31) Un fabricante afirma que al menos el 20% del público prefiere su producto. Se toma una muestra de 100 personas para poner a prueba su afirmación. Qué tan pequeño debe ser el porcentaje observado en la muestra para refutar dicha afirmación con un 95% de confianza? 32) Para una muestra de tamaño 5, el intervalo de confianza del 95 % para la media de una variable aleatoria con distribución normal y varianza desconocida es: (229.764, 233.504) Son los datos disponibles suficientes para determinar un intervalo de confianza del 99%, tanto para la media como para la variancia? En caso afirmativo determine ambos intervalos, de lo contrario explique qué información le estaría faltando. 33) Analice si las siguientes afirmaciones son verdaderas o falsas. Justifique. a) Sea F X la función de distribución acumulada de la variable aleatoria continua X. Si F X (a) = 0.75 entonces P(X > a) = 0.25 b) La especialidad Ingeniería Civil tiene dos divisiones: una por la tarde y otra por la noche. Entre las dos divisiones hay 50 alumnos. Se conoce que la calificación media en una evaluación parcial de los 30 alumnos que cursan por la tarde es de 6.50, mientras que la media de los 50 alumnos fue de 6.40. Los datos disponibles no permiten calcular la media aritmética de las calificaciones de los alumnos que cursan por la noche. c) Sea x 1, x 2,.x n una muestra de tamaño n, e y i = 2.5x i + 3. Si la variancia de los x i es igual a 2 entonces la variancia de los y i es 2.5 2 + 3 d) Cuando se estima la media de una población con distribución normal y desvío estándar conocido, a mayor nivel de confianza le corresponde menor error en la estimación. e) Si X ~ U(20 ; 30) entonces E(X) y la mediana de X coinciden. f) Si X ~ N (, ) entonces X ~ N (-, ). g) V(-X) = - V(X). h) P(A/B) = P(A) entonces P(A B) = P(A) + P(B) P(A).P(B) i) Si la mediana de la variable aleatoria X es igual a 10 entonces la mediana de la variable Y = 5 X + 20 es igual a 70.
34) Se desea estudiar por una parte la precisión de una balanza, y por otra parte si las mediciones que se realizan con dicha balanza tienen errores sistemáticos. Se tienen 7 mediciones de un ejemplar de prueba cuyo peso se conoce y es igual a 10 kilogramos. Qué recurso gráfico puede resultarle útil a tal fin? Explique. 35) Analice si la siguiente afirmación es o no verdadera. Justifique. Si la remuneración anual media a los ejecutivos senior de tres firmas es de $180000, entonces ninguno de ellos puede cobrar $550000. 36) El tiempo (en minutos) que una persona demora para ir de su casa al trabajo es una variable aleatoria T que se distribuye uniformemente en el intervalo [60; 80]. Analice cuáles de las siguientes afirmaciones son verdaderas y cuáles son falsas. Fundamente en cada caso su respuesta. a) El 50% de las veces el tiempo de demora es inferior a 70 minutos. b) Lo más probable es que demore 70 minutos en realizar el viaje. c) Que demore más de 60 minutos y menos de 65 minutos es igualmente probable a que demore más de 75 minutos. d) Los valores de las medias aritméticas calculadas en todas las posibles muestras aleatorias de tamaño 100 se distribuyen uniformemente en el intervalo [60; 80]. Sea X la variable aleatoria que asume el valor 1 cuando la persona demoró a lo sumo 65 minutos en realizar el viaje y 0 cuando demoró más de 65 minutos. e) Determine E(X) y V(X). f) Sea Y: cantidad de veces que la persona realizó el viaje en a lo sumo 65 minutos sobre un total de 100 viajes. Cuál es la distribución de la variable aleatoria Y? g) Podría relacionar la variable aleatoria Y del ítem f) con la variable X del ítem e)? h) Qué puede decir en relación a la distribución de la variable aleatoria Y n? 37) Explique la diferencia entre una probabilidad determinada a priori y una probabilidad determinada a posteriori. Ejemplifique ambos casos. 38) Explique el error en el siguiente enunciado: Si E(X) = 3 entonces el valor de la variable X con mayor probabilidad de ocurrir es el 3. 39) Complete: a) Cualquiera sea la variable aleatoria X, el intervalo: (E(X) 2.5 (X) ; E(X) + 2.5 (X)) contiene por lo menos el... b) Si el número de baches en una autopista sigue una ley de Poisson a razón de 1 bache cada 5 kilómetros entonces la probabilidad de no encontrar baches en un trayecto de 10 kilómetros es igual a.. 40) Para calibrar un aparato de medición se mide repetidas veces un patrón cuyo peso es de 30 gramos. El error que se comete en cada medición varía aleatoriamente con distribución normal, media 0 y desviación estándar 2 gramos. Cuál es la distribución de los valores proporcionados por el aparato? Justifique.
41) Sin realizar cálculos ni búsqueda en tablas o calculadoras decida cuales de las siguientes afirmaciones son verdaderas y cuáles son falsas. Fundamente brevemente. Si X N( =100; =10) entonces: a) P(90 < X < 110 ) = P(100 < X < 120) b) P(90 < X < 110 ) = P(X < 110) P(X < 90) c) P(90 < X < 100 ) > P(140 < X < 200 ) 42) Sean X e Y dos variables aleatorias, siendo R X = {1, 2, 3, 4, 5} y R Y ={11, 12, 13, 14, 15}. Se desconocen sus respectivas distribuciones de probabilidad. Diga cuál o cuáles de las siguientes afirmaciones son verdaderas y cuál o cuáles son falsas. Fundamente brevemente. a) No se puede decidir si E(X) es menor, igual o mayor que E(Y). b) V(X) = V(Y) c) La mediana de X es igual a 3. 43) Sea X: cantidad de piezas defectuosas en una muestra de tamaño 10, extraída de un gran lote de piezas, que tiene un 1% de piezas defectuosas. Solo una de las siguientes afirmaciones es verdadera. Decida cuál y fundamente brevemente sin realizar cálculos algunos. a) P( 0 X 1 ) 0.90 b) P( 0 X 1 ) 0.10 44) Sean los sucesos A: un alumno elegido al azar de la clase tiene aprobada Álgebra, F: un alumno elegido al azar de la clase tiene aprobada Física. Decida si las siguientes afirmaciones son verdaderas o falsas. a) P(A) P(A F) b) P(A) + P(F) nunca puede ser mayor a uno. c) La probabilidad de que un alumno elegido al azar de la clase tenga aprobada ambas asignaturas es mayor a la probabilidad de que tenga aprobada al menos una de las asignaturas 45) Un sistema se compone de veinte componentes conectadas en paralelo. La probabilidad de que una componente falle en [0,t) es igual a 0.05. Decida si la siguiente afirmación es verdadera o falsa. La probabilidad de que en el intervalo [0,t) fallen menos de diez componentes es igual a la probabilidad de que en dicho intervalo fallen más de diez componentes Responda sin efectuar cálculos y fundamente su respuesta. 46) El número de fallas de un instrumento de prueba debido a las partículas contaminantes de un producto, es una variable aleatoria de Poisson con media 0.02 fallas por hora. Sin realizar cálculos decida cuál de los valores de la variable cree usted tiene la mayor probabilidad de ocurrir. Fundamente su respuesta. 47) Sea X N(μ, σ = 2). Analice si las siguientes afirmaciones son verdaderas o falsas. Justifique. a) la media aritmética de 100 observaciones de X se encuentra más cerca de que la media de 20 observaciones.
b) 20 observaciones independientes de X son suficientes para estimar a con un error inferior a 1.05 y un nivel de confianza del 98%. c) Si se reduce el valor de entonces la cantidad de observaciones necesarias para estimar a con un error inferior a 1.05 y un nivel de confianza del 98% debe aumentarse. 48) Para un tipo de troqueladora de lámina, el tiempo hasta la falla es una variable aleatoria X con E(X) = 56 horas y V(X) = 16 horas 2. El tiempo de reparación de una troqueladora es una variable aleatoria Y con E(Y) = 5 horas y V(Y) = 4 horas 2. Considere que ambas variables aleatorias son independientes. Explique porqué es poco probable que la variable aleatoria X+Y (tiempo total de un ciclo de trabajo y de reparación) asuma un valor superior a 80 horas. Observación: No se conoce la distribución de X. 49) Enuncie la desigualdad de Chebyshev y aplique la misma para responder al siguiente problema: De 1000 alumnos que se presentan a una evaluación, los 120 mejores son admitidos para cursar cierta carrera. Un alumno en particular obtuvo una calificación de 85 puntos sobre 100. Así mismo averiguó que la media y desviación estándar de las 1000 calificaciones fue de 60 y 8 puntos respectivamente. A partir de esta información el alumno sostiene que él es admitido para cursar la carrera. Analice la validez de la afirmación del alumno. 50) Cuando se estima la media de una población normal con desviación estándar desconocida, el error de estimación puede variar de una muestra a otra, aun cuando se mantiene el mismo nivel de confianza y el mismo tamaño de la muestra. Explique el porqué de esta afirmación.