Universidad Diego Portales Inferencia Estadistica Semestre II - 015 Prof. Esteban Calvo - Pablo Hueichapan - Omar Ramos Pauta Solemne inferencia Estadistica Noviembre 015 (1) La Tabla 1 nos muestra las notas de alumnos de dos secciones de inferencia estadistica, extraidas aleatoriamente. Curso 1 33 54 45 9 4 38 60 Curso 4 5 58 35 46 40 48 Las autoridades de la universidad estan interesadas en saber si los profesores de cada una de las secciones son o no Buenos, y para ello quiere decide que si el promedio de notas de los alumnos es mayor a 40, el profesro sera catalogado como bueno. a) Estime un intervalo de confianza al 5% nivel de significancia para saber si los profesor son buenos o no. Que puede concluir? Ra) El intervalo de confianza es: IC = X ± t α/ σ n, por lo tanto: X 1 = 1 n Σx 33 + 54 + 45 + 9 + 4 + 38 + 60 i = = 43, 1 Σ(xi x) σ 1 = = 11, 16 n 1 IC = 43, 1 ±, 44 11, 16/ 33, 39 < µ 1 < 54, 04 X = 1 n Σx 4 + 5 + 58 + 35 + 46 + 40 + 48 i = = 44 Σ(xi x) σ = = 1, 43 n 1 IC = 44 ±, 44 1, 43/ 3, 9 < µ < 55, 1 Viendo los intervalos de confianza no podemos asegurar que los promedios de dichos cursos sean mayores a 40, ya que pueden ser perfectamente menores, por lo que no podemos con esta información inferir si los profesores son Buenos o no b) Dada la misma información de la Tabla las autoridades ahora quieren ser un poco más especificas e inferir si los profesores son buenos si y solo si tienen promedio de curso mayor o igual a 41. Genere una prueba de hipotesis para ambos cursos. Son buenos profesores? 1
Rb) PLanteamos las hipotesis (son las mismas para ambas muestras): H 0 : µ 41 H 1 : µ < 41 El estadistico de prueba es: t c = x µ 0 σ n = 43, 1 41 11, 16 = 0, 64 Para un nivel de significancia del 5% el estadistico de Tabla de la distribución t-student correspondiente es t (6,0.95) = 1.943 Rechazo si t c < t, por lo tanto para el primer curso no podemos rechazar la hipotesis nula, por lo tanto inferimos que el promedio del curso es mayor o igual al menos a 41, por lo tanto dicho profesor seria bueno. Calculemos ahora para la otra sección: El estadistico de prueba es: t c = x µ 0 44 41 σ = = 0, 65 1, 1 n Para un nivel de significancia del 5% el estadistico de Tabla de la distribución t-student correspondiente es t (6,0.95) = 1.943 Rechazo si t c < t, por lo tanto para el primer curso no podemos rechazar la hipotesis nula, por lo tanto inferimos que el promedio del curso es mayor o igual al menos a 41, por lo tanto dicho profesor tambien seria bueno. c) Existe la convicción de que dada esta competencia para saber si son buenos profesores o no uno de estos profesores infló las notas de sus alumnos. Le pide a usted que con los datos con los que cuenta infiera si esto es verdad o no. Cual es su conclusión?. Suponga Normalidad de las Variables Rc) Generamos la hipotesis sobre si hay diferencia entre los promedios: H 0 : µ 1 µ = 0 H 1 : µ 1 µ 0 Como son datos el estadistico de prueba es: t = X 1 X (µ 1 µ ) = s 1 + s 11, 16 n 1 n Los grados de libertad seran: 43, 1 44 0 + 1, 1 = 0, 0465
( s 1 + s ) 11, 16 1, 1 ( + ) n gl = 1 n 1 n 1 1 ( s 1 ) n + 1 = 1 n 1 ( s 1 ) n 16 (11, ) 6 + 1 = 11, 9 1 (1, ) 6 Por lo tanto los grados de libertad son 11, y a 5% nivel de significancia los valores de Tabla son t =, 01 Nuestro criterio de rechazo como es una hipotesis alternativa de dos colas es, rechazar si t < tot > t o dicho de otra forma no rechazar si t < t < t en este caso nuestro rango de valores para no rechazar es que el valor t calculado este entre.01y.01. Como nuestro valor t calculado es t = 0, 0465 no podemos rechazar la nula, y por lo tanto podemos inferir a un 5% nivel de significancia que las medias de las notas de ambas secciones son iguales, por lo que ni un profesor esta inflando las notas. () Un alumno de una ingenería comercial, está efectuando un trabajo de investigación, con respecto a la cantidad de horas de estudio semanales que le dedican sus compañeros a un curso de Inferencia Estadística, y para ello, su estudio se centra en alumno que están por primera vez en el curso y los que ya han cursado en mas de una ocasión Inferencia, registrando la información en la siguiente tabla Cantidad de horas NÂ de alumnos NÂ de alumnos en mas de estudio semanales por primera vez de una ocasión 0 1 11 1 9 3 8 3 6 4 9 3 5 10 6 1 1 Pero el alumno cuando recoge los datos, no siempre registra la información, de si los alumnos están cursando por primera vez el curso, o en mas de una ocasión y con la información previa propone el siguiente test de hipótesis H 0 : El alumno está cursando Inferencia por primera vez. H 1 : El alumno está cursando por segunda o más veces Inferencia. Para concluir, establece la siguiente regla de decisión: Rechazar H 0 si el alumno estudia a lo más una hora diaria. 1. Cuál es la probabilidad de cometer error tipo 1? Interprete 3
Ra) El error tipo I está dado por α = P (Rechazar H 0 /H 0 es verdadera) = P (el alumno estudia a lo más una hora y es primera vez en el curso de Inferencia) 1 + = 1 + + 3 + + 9 + 10 + 1 = 3 44 = 0, 068 Existe una probabilidad del 6,8% de decir que alumno está cursando por segunda o más veces inferencia cuando en verdad estã por primera vez.. Cuál es la probabilidad de cometer error tipo? Interprete Rb) El error tipo está dado por Rc) β = P (aceptar H 0 / H 0 es falsa) = P (El alumno estudia más de una hora y es su segunda o más veces en el curso) 8 + 6 + 3 + + 1 = 11 + 9 + 8 + 6 + 3 + + 1 = 0 40 = 0, 5 Esiste una probabilidad del 50% de afirmar que el alumno está por primera vez cuando en verdad está por segunda o más veces en el curso de Inferencia. 3. Si el alumno estudia a lo más 3 horas diarias, cuál es el p-valor? Cuál es la decisión y conclusión? p valor = P (el alumno estudia a lo más 3 horas y está por primera vez en el curso) = 1 + + 3 + = 13 44 44 = 0, 95 Como el p-valor obtenido es mayor que α, es decir, 9,5% es mayor a 6,8% no se rechaza H 0, luego, el alumno está por primera vez en el curso de inferencia con un 6,8% de significación. (3) Usted es contratado como Analista de Logística para la empresa ELMAGICO. Su primera tareadentro de la firma, será evaluar la renovación de la flota de camionetas repartidoras. Para ello,realiza una licitación pública para todo oferente, de la que sobresalen dos propuestas enviadaspor los representantes de las marcas ZORT y TROZ, las cuales se ajustan, tanto al presupuesto destinado, como a los requerimientos técnicos establecidos. Luego de ello, usted se reúne con ambos representantes, planteándoles sus inquietudes respecto 4
a los beneficios a obtener si elige a uno de ellos. Tanto, el representante de ZORT, como TROZ le aseguran que el rendimiento promedio de sus respectivas camionetas es superior a la flota de la marca competidora, es decir,por cada litro de combustible, la cantidad de kilómetros recorridos será mayor. Para poner aprueba dichas aseveraciones le propone el siguiente trato a las empresas. Seleccionará demanera aleatoria 10 vehículos de cada empresa, los cuales serán conducidos por los choferes de ELMAGICO, y al término de cada jornada laboral, cada empleado llevará un registro delrendimiento, por lo tanto, usted contará con el desempeño de estos vehículos durante cada jornada. Adicionalmente, para evitar confusiones, al inicio de cada jornada mediante un proceso aleatorio, se elegirá qué chofer conducirá cada vehículo, como también la ruta arecorrer. Tras finalizar el periodo de pruebas ( días o jornadas), comprobará empíricamente las bondades de las respectivas marcas y en base a ello escogerá la propuesta más conveniente. a) Las empresas están dispuestas a acceder a su petición, con la salvedad de que las condiciones llevadas a cabo para probar los vehículos sean iguales para ambas firmas, de lo contrario, una firma podría argumentar que se benefició a un competidor por sobre el otro. Ante dicha situación, accede a la petición de los representantes? Ra Si estuviésemos frente a una situación donde los vehículos de las empresas estuvies en relacionadas con una camioneta de la competencia, el argumento planteado por las firmas sería correcto, no obstante, dada la independencia entre las muestras y la aleatoriedad de los choferes y rutas, no será necesario hacer equiparables las condiciones, incluso, podríamos alterar las condiciones iniciales, volviendo asimétrica la cantidad de camionetas solicitadas y los días de prueba, y aun así, podríamos realizar comparaciones entre los rendimientos de ambasempresas. Por lo tanto, no generará ningún ruido adicional al experimento, así que puede acceder a la petición. b) Tras haber completado su propuesta obtiene la siguiente información resumida respecto aldesempeño de cada marca. Tras su muestra, ambos representantes mantienen su posición inicial, indicando que su producto es mejor que el propuesto por la competencia. Indique cuál sería el planteamiento a resolver, determine la veracidad de las afirmaciones de los representantes y emita un juicio respecto al desempeño de los vehículos. Utilice el riesgo estándar para hacer su análisis. Marca (km/lt) Zort Troz Media 15, 16,9 DesvEstandar 1,88 1,41 Varianza de la Muestra 3,5 1,98 Error Típico 0,4 0,3 Indicación: Asuma para todos los efectos que los valores de tabla normal estándar y t-student para 5% de significancia, son: 1,96 y,00, respectivamente. 5
Rb) Lo haremos mediante intervalos de confianza, como el numero de datos en pequeño ocuparemos el estadistico t, seria: s IC = µ 1 µ ± t 1 α/,n1 +n + s n 1 n IC = 15, 16, 9 ± 0, 4 + 0, 3 IC = 1, ± 0, 5.; 0, Como la diferencia es negativa para todo el intervalo, el rendimiento de la empresa, tiene mejor rendimiento y por lo tanto deberia ser la elegida c) Cuál hubiese sido su sugerencia si se exige conclusiones al 99% de confianza? Indicación: Asuma que los valores de tabla normal estándar y t-student para 99% de confianza son:,5 y 3,0, respectivamente. s IC = µ 1 µ ± t 1 α/,n1 +n + s n 1 n IC = 15, 16, 9 ± 3 0, 4 + 0, 3 IC = 1, ± 3 0, 5.; 0, 3 En este caso no podemos concluir al 99% de confianza que existe una diferencia que nos diga que una es mejor que la otra. 6