1 Profesor : Ing. Oli Eduardo Carrillo MSc. olicarrillo@yahoo.es
2 Unidad I: Estimación de Parámetros. Estimación de parámetros: Es el empleo de estadísticos para calcular los respectivos parámetros poblacionales. Estadísticos: son las medidas correspondientes a la muestra. Parámetros: son las medidas correspondientes a la población. Estimación por intervalo: Cuando el parámetro se considere comprendido entre dos valores θi < θ < θs que se calcula a partir de una muestra seleccionada, se denomina entonces intervalo de confianza del (1- α) 100%; y la expresión 1- α: recibe el nombre de coeficiente de confianza grado de confianza, los puntos extremos θs y θi se llaman límite de confianza superior y límite de confianza inferior. Estimación de un intervalo de confianza para la media poblacional conociendo la desviación estándar σ: si x es la media de una muestra aleatoria del tamaño n, de una población con varianza conocida (σ²), el intervalo de confianza de (1- α) 100% para μ es: Estimación de un intervalo de confianza para la media poblacional desconociendo la desviación estándar: si y representan la media extraída de una población normal con varianza desconocida σ², entonces el intervalo de confianza del (1 α) 100% para μ es: Intervalo de confianza para μ con σ conocida: Ejemplo del Intervalo de confianza para μ con σ conocida: 1. Se determina que la media de los promedios de los puntos de calidad de una muestra aleatoria de 36 alumnos universitarios en el último año es de 2.6. Encuentre los intervalos de confianza del 95% y 99% para la varianza total de alumnos. Asuma una desviación estándar de la población de 0.3.
3 Datos: = 2.6 a) 95% b) 99% μ=? σ=? n=36 a) Intervalo de confianza del 95% b) Intervalo de confianza del 99%
4 Intervalo de confianza para μ con σ desconocida: Donde es un valor de distribución t con v= n-1 grados de libertad lo que deja un área a la derecha de. Ejemplo: Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8; 10.2; 10.4; 9.8; 10; 10.2; 9.6 (litros). Encuentre un intervalo de confianza del 95% para la media de todos los recipientes suponiendo una distribución aproximadamente normal. Datos: n=7 (1 α) 100% = 95% μ=? ( )
5 Intervalo de confianza para la varianza poblacional Si es la varianza de una muestra aleatoria de tamaño n de una población normal entonces el intervalo de confianza de (1 α) 100% para es: Dónde: respectivamente a la derecha. Ejemplo: son los valores de con v= n-1 grados de libertad La varianza muestral de 10 paquetes de semillas de pasto que distribuye determinada compañía es de 0.286. Se plantea la interrogante de conocer cuál será el intervalo de confianza del 95% para la varianza de todos los paquetes de semillas de pasto que distribuyó esta compañía.
6 Datos: n= 10 Intervalo de confianza para con 95%
7 Unidad II: Prueba de Hipótesis. Una hipótesis estadística se considera como una afirmación a cerca de una o más poblaciones. Características: 1.- La evidencia de la muestra que es inconsistente con la hipótesis planteada conduce a un rechazo de la misma. 2.- La evidencia que apoya la hipótesis conduce a su aceptación. Estructura: 1.- Hipótesis Nula: se refiere a cualquier hipótesis que se desea probar y se representa (Ho). 2.- Hipótesis Alternativa: en una hipótesis estadística el rechazo de Ho da como resultado la aceptación de la hipótesis alternativa representada por (Hi). 3.- Estadístico de prueba: se basa en la distribución que permita tomar el control de la cantidad de elementos en el grupo de prueba. Pueden ser varias (distribución normal, t, F, etc.). 4.- Error Tipo I: consiste en rechazar la hipótesis nula cuando esta en realidad es verdadera. 5.- Error Tipo II: consiste en la aceptación de la hipótesis nula cuando en realidad es falsa. Clasificación: { { Procedimiento para resolver prueba de hipótesis: 1.- Establecer la hipótesis nula Ho de que θ = θo 2.- Seleccionar la hipótesis alternativa Hi de una de las alternativas siguientes: ; ò. 3.- eleccionar el nivel de significancia de tamaño alfa (α).
8 4.- Seleccionar el estadístico de prueba apropiado y establecer la región criica. 5.- Calcular el valor del estadístico de prueba de los datos muéstrales. 6.- Decisión: Rechazar Ho si el estadístico de prueba tiene un valor en la región crítica; de otra forma aceptar Ho. Formulas relacionadas a pruebas con una sola media y varianza conocida: Hipótesis Criterio de Rechazo Estadístico de Prueba Ho: M = Mo Hi: M Mo ( ) Ho: M = Mo Hi: M > Mo Ho: M = Mo Hi: M < Mo Ejemplo: Un fabricante de equipos deportivos ha desarrollado un nuevo sedal (y lo sintético basado en nylon para pesca) el cual se considera que tiene una resistencia a la ruptura de 8kg con desviaciones aproximadas a los 0.5kg. Pruebe la hipótesis de que la media es 8 (M=8) en contra posición con la alternativa de que μ es diferente a 8 (M 8) si se prueba una muestra aleatoria de 50 sedales y se determina que la resistencia promedio a la ruptura es de 7.8kg. Utilice un nivel de significancia de 0.01.
9 Datos: n=50 x=.8kg α= 0.01 M=8 M 8 σ=0.5kg 1) Ho: M=8 2) Hi: M 8 3) α= 0.01 4) = 0.005 5) = -2.82 6) Decisión: Se rechaza la hipótesis nula entonces se acepta la hipótesis alternativa.
10 Formulas relacionadas a pruebas con una sola media y varianza conocida: Hipótesis Criterio de Rechazo Estadístico de Prueba Ho: M = Mo Hi: M Mo ( ); v= n-1 Ho: M = Mo Hi: M < Mo Ho: M = Mo Hi: M Mo Ejemplo: El Edison electric Institute (EEI) ha publicado cifras a cerca de la cantidad anual de kwatts/horas consumidos por varias aparatos del hogar. Se afirma que las aspiradoras consumen un promedio de 46 kw/h al año. Si una muestra aleatoria de 12 hogares, indican que las aspiradoras consumen un promedio de 42 kw/h al año con una desviación estándar de 11.9kw/h. Sugiere esto que las aspiradoras consumen un promedio menor de 46kw/h al año? Tómese un nivel de significancia del 0.05. Datos: Mo=46kw/h n=12 x= 2 kw h S= 11.9 kw/h Hi< 46kw/h α=0.05
11 1) Ho: M=46 2) Hi: M <46 3) α=0.05 4) 5) 6) Decision: = -1.16 Aceptamos la Ho (hipótesis nula) y se comprueba que las aspiradoras consumen 46kw/h al año.
12 Fórmulas para pruebas relacionadas con proporciones: Hipótesis Región Critica Estadístico de Prueba Ho: p=po Hi: p po Ho: p=po Hi: p po Si P es menor o igual que se rechaza Ho. Ho: p=po Hi: p po Procedimiento: 1.- Establecer la hipótesis nula p=po. 2.- Establecer la hipótesis alternativa Hi; seleccionando la alternativa más conveniente p < po; p > po; p po. 3.- Escoge el nivel de significancia α. 4.- Utilizar el estadístico de prueba la dirección binomial de variable X con p=po donde b (X, n, p). 5.- Calcular: a) El número de éxitos de la variable X. b) El valor apropiado de p. 6.- Decidir: Tomar la decisión en base al valor de p.
13 Ejemplo: Un constructor afirma que actualmente se instalan bombas de calefacción en el 70% de todos los hogares en construcción de la ciudad Richmond. Estaría usted de acuerdo con esta afirmación si una investigación aleatoria de nuevas casas en esta ciudad indica que 8 de cada 15 tienen instaladas bombas de calefacción? Utilice un nivel de significancia del 0.10. Datos: 1) Ho: p= 0.70 2) Hi: p 0. 0 3) α=0.10 4) p= 0.70; n= 15; X=8 Distribución binomial. 5) Cálculos: Si X < 0 > npo npo= (15) (0.70)= 10.5 X < npo 8 < 10.5 [ ] [ ] [] [ ] 6) Decisión: P<α rechaza 0.2622 < 0.10 ɇ * e acepta Ho porque el valor de p es mayor que el valor de α 0.2622 > 0.10
14 Unidad III: ANOVA Análisis de Varianza (Anova): se utiliza para comparar varias medias de tratamiento a fin de ver si provienen de la misma población. Los supuestos fundamentales de las Anovas son: 1.- Formulas para el cálculo de la suma de cuadrados en muestras iguales tamaños. 2.- Formulas para el cálculo de la suma de cuadrados en muestras de diferentes tamaños. Procedimiento: 1.- Se seleccionan muestras del tamaño n de cada una de las k poblaciones. 2.- Las k poblaciones se clasifican sobre la base de un criterio único denominado tratamiento. 3.- Se debe asumir que k poblaciones son independientes y tienen una distribución normal con media, y con una varianza común. 4.- La hipótesis a probar será la siguiente: Ho: Hi: al menos dos de las medias no son iguales. Tratamiento: Total Media T ȳ 5.- Formulas para el cálculo de la suma de cuadrados en muestras de iguales tamaños: Suma total de cuadrados.
15 Suma de cuadrados de tratamiento. Suma de cuadrados del error. Cuadrados de tratamiento medio. Cuadrados medio del error. libertad. valor de la distribución aleatoria F, con k-1 y k(n-1) grados de *Ho se rechaza cuando [ ] En resumen: Fuente variación de Suma cuadrados de Grados libertad de Cuadrados de medios Calculada Tratamientos SSA K-1 Error SSE K(n-1) Total SST n k-1 Ejemplo: Supóngase que un experimento industrial un ingeniero está interesado en como varia la absorción media de humedad en el concreto de entre 5 diferente mezclas de concreto. Las mezclas varían en el porcentaje en peso de cierto ingrediente importante. Se expone a la humedad durante 48 horas y se deciden probar 6 para cada muestra o mezclar, lo que requiere un total de 30 muestras.
16 Los datos se registran en la siguiente tabla. Pruebe la hipótesis de que con un nivel de significancia de 0.05 para los datos tabulados. Tabla 1: Absorción de humedad en muestras de concreto. Mezcla (%de peso) 1 2 3 4 5 551 595 639 417 563 457 580 615 449 631 450 508 511 517 522 731 583 573 438 613 499 633 648 415 656 632 517 677 555 679 TOTAL 3320 3416 3663 2791 3664 16854 MEDIA 553,333333 569,333333 610,5 465,166667 610,666667 561,8 Datos: α=0.05 n=6 k=5 1) Ho: 2) Hi: al menos 2 de las medias no son iguales. 3) α=0.05 Distribución F (tabla 6) 4)
17 Fuente variación de Suma cuadrados de Grados libertad de Cuadrados de medios Calculada Mezcla 85356.6 4 21339.15 =4.30 Error 124021 25 4960.84 Total 209377 29 26299.99 5) Se rechaza la hipótesis nula Ho Se acepta que al menos dos mezclas no son iguales. Análisis de varianza para muestras de tamaños diferentes:
18 Grados de libertad SST= N-1 SSA= K-1 SSE= N-K Ejemplo: La Universidad Politécnica de Virginia de estados unidos diseño un sistema para medir los niveles de actividad de fosfatasa alcalina del suero en niños que padecían ataques convulsivos y quienes habían recibido terapia anti convulsionante bajo el cuidado de un especialista privado. Se encontraron 45 sujetos para el estudio y se clasificaron en 4 grupos de acuerdo con la medicina que se les proporciono. A partir d muestras sanguíneas obtenidas de cada sujeto se determinaron los niveles de (bessey Lowry) y se registraron en la tabla que se muestra. Pruebe la hipótesis con un nivel de significancia de 0.05, de que el nivel promedio de actividad de fosfatasa alcalina del suero es el mismo para los 4 grupos. Nivel de actividad del suero fosfatado alcalino. Grupo de Medicamento.
19 G-1 G-2 G-3 G-4 49,2 97,07 62,1 110,6 44,54 73,4 94,95 57,1 45,8 68,5 142,5 117,6 95,84 91,85 53 77,71 30,1 106,6 175 150 36,5 0,57 79,5 82,9 82,3 0,79 29,5 111,5 87,25 0,77 78,4 105 0,81 127,5 95,22 97,5 105 58,05 86,6 58,35 72,8 116,7 45,15 70,35 77,4 TOTAL 1459,65 440,36 842,45 707,41 3449,87 MEDIA 72,9825 48,92889 93,60556 101,0586 79,14388 G-1=control (sin anti convulsivos). G-2= fenobarbital. G-3= carbamazepina. G-4= otros anti convulsivos. Datos: 1) Ho: 2) Hi: al menos 2 de las medias no son iguales. 3) α=0.05 4) Calculo:
20 = TABLA ANOVA Fuente variación de Suma de cuadrados Grados libertad de Cuadrados de medios Calculada Grupos de Medicamentos 13943.01 3 4647.66 =3.56 Error 53463.9 41 1303.99 Total 67406.91 44 5951.65
21 5) Decisión: Se rechaza la hipótesis nula Ho se acepta Hi.