AGRO 6600 Examen Final 2004 Nombre: Instrucciones: Apague celulares. Se descontarán puntos si su celular suena durante el examen. Por favor lea los enunciados y las preguntas cuidadosamente. Se pueden usar el libro y la calculadora. Para obtener crédito parcial las respuestas deben ser consistentes. Tenga en cuenta que algunos de los resultados parciales presentados podrían no ser relevantes al problema en cuestión. Todo acto de deshonestidad académica conllevará una nota de 0 en el examen y la radicación de cargos disciplinarios. El examen dura 2 horas. 1. (30 puntos; 6 cada parte) Se desea encontrar una ecuación que permita predecir el peso de un árbol dadas distintas variables fácilmente medibles (diámetro a la altura del pecho, altura del árbol, edad y gravedad específica de la madera). Para ello se observan estas variables en 47 árboles y luego de derribados se pesan. Se ajustaron dos modelos: El modelo uno (1) usa el peso (weight, en libras) como variable independiente y el diámetro (dbh, en pulgadas), la altura (height, en pies), la gravedad específica (grav) y la edad (age, en años) como variables independientes. En el modelo dos (2) se usó el logaritmo natural del peso como variable dependiente, y el logaritmo natural de la altura, el logaritmo natural del diámetro, la gravedad específica y la edad como variables independientes. Los resultados se presentan a continuación. Estadística descriptiva Variable Media Mín Máx weight 369.340 58.000 1692.000 dbh 6.153 3.500 12.100 height 49.596 27.000 79.000 age 17.043 10.000 27.000 grav 0.445 0.353 0.508 logweight 5.495 4.060 7.434 logdbh 1.766 1.253 2.493 logheight 3.870 3.296 4.369
Modelo 1: Análisis de regresión lineal Variable N R² R² Aj ECMP weight 47 0.9144 0.9062 22112.1365 Coeficientes de regresión y estadísticos asociados Coef Est. EE LI(95%) LS(95%) T p-valor CpMallows const -362.1466 228.1907-822.6540 98.3609-1.5870 0.1200 dbh 166.7656 16.9133 132.6331 200.8981 9.8600 <0.0001 98.9821 height 4.1444 2.9990-1.9078 10.1966 1.3819 0.1743 5.8886 age -0.5846 3.6246-7.8993 6.7301-0.1613 0.8726 4.0487 grav -1100.9154 578.4182-2268.2105 66.3797-1.9033 0.0639 7.5616 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 6516119.1969 4 1629029.7992 112.1533 <0.0001 dbh 1412120.6689 1 1412120.6689 97.2198 <0.0001 height 27738.7523 1 27738.7523 1.9097 0.1743 age 377.8471 1 377.8471 0.0260 0.8726 grav 52618.8227 1 52618.8227 3.6226 0.0639 Error 610051.3563 42 14525.0323 Total 7126170.5532 46 Modelo 2: Análisis de regresión lineal Variable N R² R² Aj ECMP logweight 47 0.9818 0.9800 0.0219 Coeficientes de regresión y estadísticos asociados Coef Est. EE LI(95%) LS(95%) T p-valor CpMallows const -1.6463 0.3827-2.4186-0.8740-4.3019 0.0001 logdbh 2.2021 0.1152 1.9697 2.4345 19.1208 <0.0001 361.1250 logheight 0.8857 0.1522 0.5786 1.1927 5.8210 <0.0001 37.1192 age -0.0069 0.0039-0.0147 0.0009-1.7881 0.0810 7.1463 grav -0.1309 0.6218-1.3857 1.1240-0.2105 0.8343 4.0665 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 36.5795 4 9.1449 565.8499 <0.0001 logdbh 5.9086 1 5.9086 365.6042 <0.0001 logheight 0.5476 1 0.5476 33.8839 <0.0001 age 0.0517 1 0.0517 3.1974 0.0810 grav 0.0007 1 0.0007 0.0443 0.8343 Error 0.6788 42 0.0162 Total 37.2583 46 a. Cuál de los dos modelos elegiría Ud. para predecir mejor el peso de un árbol dado si conoce la altura, el diámetro, la edad y la gravedad específica de la madera? Justifique su respuesta brevemente. b. Para el modelo seleccionado en la parte a, interprete claramente el coeficiente de regresión asociado con altura (o log altura). c. Interprete, si es posible, el intercepto. Si no es posible hacerlo, justifique. d. Para realizar un proceso de selección BACKWARD, Ud. debería comenzar en el primer paso eliminado cuál(es) de las variables i. AGE ii. GRAV iii. AGE y GRAV iv. No se puede determinar a partir de la información provista. e. Prediga (si es posible) el peso de un árbol que tiene un diámetro de 10 (ln diam=2.30), una altura de 50 pies (ln altura=3.91), 15 años de edad y es de una especie cuya gravedad específica es 0.450. (Recuerde que si Ud. ha escogido el modelo 2, el resultado que obtiene será del logaritmo del peso, por lo que deberá ser exponenciado para llevarlo a la escala original)
PÁGINA EN BLANCO
2. (31 puntos) Se diseñó un estudio para evaluar el agregado de una hormona de crecimiento (citoquinina, dosis 0, 10, 20, 30 ppm) sobre el rendimiento de yautía en dos épocas de siembra (abril y junio). Para ello se usó un diseño con 4 bloques completos aleatorizados. Una mitad de cada bloque (aleatoriamente seleccionada) se sembró en abril y la otra mitad en junio. Cada parcela se trató con la dosis correspondiente de la hormona mediante aplicaciones foliares. a. (9 puntos) Mencione el/los factor/es en este estudio. Indique si son fijos o aleatorios y el número de niveles de cada uno de ellos. b. (6 puntos) Realice un esquema del diseño de campo, indicando una posible aleatorización del (o de los) factor(es). c. (6 puntos) Mencione el nombre completo del diseño de este estudio e indique el número de repeticiones. d. (10 puntos) Presente una tabla de ANOVA con las fuentes de variación, los grados de libertad y los estadísticos F. Indique los números (no las letras) cuando sea posible.
3. (30 puntos, 5 puntos cada parte) Se realizó un experimento para evaluar la efectividad de una vacunación con inmunoglobulina a cerdas antes de parir, para así mejorar las defensas de los cerditos. Para ver si la cantidad de inmunoglobulina A presente en la sangre era mayor en las cerdas vacunadas que en las sin vacunar, se eligieron 20 cerdas. Diez de estas cerdas (aleatoriamente seleccionadas) se vacunaron con la dosis recomendada de IgA, mientras que a las otras 10 se les inyectó un placebo (solución fisiológica). Como cada cerda tiene su propia cantidad natural de IgA, la concentración de IgA (ppm) en sangre de cada cerda se determinó inmediatamente antes de vacunarlas (IgA0), para usar esta cantidad como covariable. A las 3 semanas después del parto se volvió a determinar la concentración de IgA en sangre (IgA1). Los datos y resultados del análisis en SAS se muestran a continuación. cerda trat IgA0 IgA1 1 vac 49.7 62.8 2 vac 43.2 59.0 3 vac 55.0 64.3 4 vac 52.1 60.6 5 vac 40.2 54.7 6 novac 45.2 49.2 7 novac 56.4 53.8 8 novac 52.4 54.9 9 novac 50.2 53.3 10 novac 50.0 49.8 Estadística descriptiva Variable n Media IgA0 10 49.44 IgA1 10 56.24 proc glm; class trat; model IgA1= trat IgA0 / solution; lsmeans trat; run; Class Level Information Class Levels Values trat 2 novac vac Number of observations 10 Dependent Variable: IgA1 Sum of Source DF Squares Mean Square F Value Pr > F Model 2 223.3784241 111.6892120 37.15 0.0002 Error 7 21.0455759 3.0065108 Corrected Total 9 244.4240000 R-Square Coeff Var Root MSE IgA1 Mean 0.913897 3.083089 1.733929 56.24000
Source DF Type III SS Mean Square F Value Pr > F trat 1 209.1806340 209.1806340 69.58 <.0001 IgA0 1 60.1624241 60.1624241 20.01 0.0029 Standard Parameter Estimate Error t Value Pr > t Intercept 35.09173000 B 5.68390423 6.17 0.0005 trat novac -9.54809234 B 1.14468834-8.34 <.0001 trat vac 0.00000000 B... IgA0 0.52431869 0.11720984 4.47 0.0029 Least Squares Means trat IgA1 LSMEAN novac 51.4659538 vac 61.0140462 proc glm; class trat; model IgA1= trat IgA0 trat*iga0; run; Dependent Variable: IgA1 Sum of Source DF Squares Mean Square F Value Pr > F Model 3 223.6297512 74.5432504 21.51 0.0013 Error 6 20.7942488 3.4657081 Corrected Total 9 244.4240000 R-Square Coeff Var Root MSE IgA1 Mean 0.914926 3.310173 1.861641 56.24000 Source DF Type III SS Mean Square F Value Pr > F trat 1 0.62997592 0.62997592 0.18 0.6847 IgA0 1 48.02748471 48.02748471 13.86 0.0098 IgA0*trat 1 0.25132708 0.25132708 0.07 0.7967 a. Escriba las ecuaciones estimadas que le permitirán predecir IgA1 en función de IgA0 para cerdas vacunadas y para cerdas no vacunadas. Debe indicar las dos ecuaciones. b. Existen diferencias entre los tratamientos una vez eliminado el efecto de la cantidad inicial de IgA? Formule y pruebe las hipótesis correspondientes usando α=.05. c. Hay alguna relación lineal entre IgA1 e IgA0 en cada uno de los tratamientos? Formule y pruebe las hipótesis correspondientes usando α=.05. d. Es la pendiente de la relación lineal entre IgA1 e IgA0 la misma en cada tratamiento? Formule y pruebe las hipótesis correspondientes usando α=.05. e. Interprete claramente la pendiente estimada en el modelo en términos de este problema.
f. Observando que la media de IgA0 para las 10 cerdas es 49.44, indique claramente cómo se puede calcular el valor observado de media ajustada para IgA1 en cerdas vacunadas (61.014).
4. (9 puntos: 3 cada parte) Indique cierto/falso. Justifique brevemente. 2 a. En una regresión polinomial, el valor de R nunca disminuye a medida que consideramos términos de mayor grado (es decir, para los mismos datos, una regresión 2 cúbica va a tener un R mayor o igual que el de una cuadrática) b. En regresión múltiple, el primer paso usado en los métodos de selección FORWARD, BACKWARD y STEPWISE (es decir, los tres métodos comienzan ajustando el mismo modelo) c. En un modelo con dos factores, la prueba F para probar la interacción es la misma si ambos factores son fijos, si ambos factores son aleatorios, o si uno es fijo y el otro aleatorio