PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES. E el siguiete ejercicio se tratará de expoer, de forma didáctica, el proceso de solució de u problema de regresió simple. Problema: Uso de fertilizates para la siembra de tomates. Este ejercicio o problema ha sido elaborado de forma académica, o represeta u experimeto real y los valores expresados so uicamete refereciales, auque sigue u plateamieto metodológico que puede ser utilizado e la práctica profesioal. Las medias poblacioales tampoco so reales, se icluye para ilustrar el proceso de iferecia estadística implicado e u problema ecoómetrico. E la agricultura tecificada actual, está extedido el uso de fertilizates para aumetar la producció por uidad de superficie cosechada Tabla 1: Medias Codicioales Toeladas de Tomate por hectárea Medias Codicioales Kilos de fertilizates por hectárea 200 250 300 350 400 450 500 550 600 10 11 18 20 34 38 33 43 49 9 14 20 22 29 35 43 46 45 8 9 15 25 31 33 38 40 38 12 15 16 26 34 44 46 46 8 13 30 35 48 9,4 12,4 17,25 24,6 31,33 35 38,6 43,75 45,2 Medias Poblacioales 10 15 20 25 30 35 40 45 50 E la tabla 1 se muestra los resultados obteidos e 40 grajas e las cuales se sembró tomates, e las grajas se usaro diferetes catidades de fertilizate. Así teemos que e cico grajas se usaro 200 kilos de fertilizates por hectáreas, e otras cico 250 kilos de fertilizates, e cuatro grajas se utilizaro 300 kilos de fertilizates y así hasta 600 kilos de fertilizates por hectáreas, es decir se agruparo las grajas de acuerdo a la catidad de fertilizate utilizado. Para el grupo dode se utilizó 200 kilos de fertilizates (5 grajas), la producció de tomates por hectáreas varió desde 8 hasta 12 toeladas, e el grupo dode se utilizó 250 kilos de fertilizates la producció por hectárea varió desde 9 toeladas hasta 15 toeladas y así sucesivamete. Es de hacer otar que alguas grajas del grupo dode se utilizó 250 kilos de fertilizates, mostraro ua producció meor que otras grajas e el grupo dode se utilizó 200 kilos de fertilizates, esto es debido que hay otras variables que tambié iterviee e la producció de tomates, como por ejemplo el tipo de suelo, el clima, etc. E este ejemplo se muestra que los valores de la variable idepediete (X) queda fijos para las distitas muestras, es decir, el valor de X o cambia (por ejemplo 200 kilos de fertilizate) pero los valores de la variable depediete (Y) si cambia (para 200 kilos de fertilizate los valores de Y so 10, 9, 8, 12 y 8 toeladas de tomates). Surge ahora la preguta, cuál producció utilizar? La Repuesta es: la producció promedio, de dode surge el cocepto de medias codicioales, e este caso la
producció de tomates e esta muestra de cico grajas, está codicioada al uso de 200 kilos de fertilizates. Así para cada grupo o muestra de grajas. Para este problema la recta de regresió poblacioal, si tomamos los datos correspodiete a las medias poblacioales de la tabla 1, es la siguiete: Y i = 10 + 0,10 X i + μ i (1) Co u R 2 = 1. Si hacemos la grafica de esta ecuació os queda como se muestra e la figura 1 Figura 1: Fució de Regresió Poblacioal RECTA DE REGRESION POBLACIONAL 60 50 Yi = 0,10 Xi 10,00 R² = 1,00 40 30 E[Y/Xi] Lieal (E[Y/Xi]) 20 10 0 150 200 250 300 350 400 450 500 550 600 650 Si aplicamos la formula para calcular b 2, y luego calcular b 1, segú se muestra a cotiuació:
1. b 1 = ȳ b 2 x 2. b 2 = (x i x)( y i ȳ) (x i x) 2 (2) Ambas formulas cotiee sumas o sumatorias, primero calculamos las medias tato de X como de Y, luego calculamos los desvíos co respecto a la media de Y como de X. Estos cálculos se muestra e las tablas 2 y 3. Tabla 2: Datos para Cálculo de Coeficietes. X Y (X (X i X ) 2 i X ) (Y i Ȳ ) (X i X )(Y i Ȳ ) 1 200,00 9,40 (200,00) 40.000,00 (19,21) 3.842,96 2 250,00 12,40 (150,00) 22.500,00 (16,21) 2.432,22 3 300,00 17,25 (100,00) 10.000,00 (11,36) 1.136,48 4 350,00 24,60 (50,00) 2.500,00 (4,01) 200,74 5 400,00 31,33 - - 2,72-6 450,00 35,00 50,00 2.500,00 6,39 319,26 7 500,00 38,60 100,00 10.000,00 9,99 998,52 8 550,00 43,75 150,00 22.500,00 15,14 2.270,28 9 600,00 45,20 200,00 40.000,00 16,59 3.317,04 3.600,00 257,53 0,00 150.000,00-14.517,50 X = Ȳ = 400 b 1 = -10,0985 28,615 b 2 = 0,0968 Al sustituir los valores de las sumatorias de la tabla 2 e la correspodiete formula para calcular b 2, os queda:
b 2 = (x i x)( y i ȳ) (x i x) 2 = 14.517,50 150.000 = 0,0968 (3) El valor obteido de b 2 se utiliza para calcular b 1 : b 1 = 28,615 0,0968 x 400 = -10,0985 Co estos valores formulamos la fució de regresió muestral: Y i = 10,0985 + 0,0968 X i + e i (4) Co esta ecuació, podemos calcular los valores estimados de Y, para luego proceder a calcular los errores. Los valores estimados de Y se calcula sustituyedo los valores de X e la fució de regresió muestral si los errores, este procedimieto se muestra a cotiuació: Ŷ 1 = -10,0985 + 0,0968x(200) = 9,26 Ŷ 2 = -10,0985 + 0,0968x(250) = 14,1... Ŷ 9 = -10,0985 + 0,0968x(200) = 47,97 Para el calcular los errores e i = Y i Ŷ, se resta el valor de estimado de Y (Ŷ) calculado e el paso previo del valor observado de Y, esto lo mostramos a cotiuació: e 1 = 9,40 9,26 = 0,14 e 2 = 12,40 14,1 = -1,7... e 9 = 45,20 47,97 = -2,77 Como la suma de los errores da cero, debemos elevarlos al cuadrado, adicioalmete debemos calcular los desvíos co respecto a la media de Y (Ȳ), estos calculos se lleva a ua tabla, como se muestra e la tabla 3
Tabla 3: Datos para Cálculo de Coeficietes. Cotiuació... X Y X 2 ( ^Y i ) (Y i ^Y i ) (Y i ^Y i ) 2 ( ^Y i Ȳ ) ( ^Y i Ȳ ) 2 (Y i Ȳ ) 2 1 200,00 9,40 40.000,00 9,26 0,14 0,02-19,36 374,68 369,21 2 250,00 12,40 62.500,00 14,1-1,7 2,88-14,52 210,76 262,92 3 300,00 17,25 90.000,00 18,94-1,69 2,84-9,68 93,67 129,16 4 350,00 24,60 122.500,00 23,78 0,82 0,68-4,84 23,42 16,12 5 400,00 31,33 160.000,00 28,61 2,72 7,39 0 0 7,39 6 450,00 35,00 202.500,00 33,45 1,55 2,39 4,84 23,42 40,77 7 500,00 38,60 250.000,00 38,29 0,31 0,09 9,68 93,67 99,7 8 550,00 43,75 302.500,00 43,13 0,62 0,38 14,52 210,76 229,07 9 600,00 45,20 360.000,00 47,97-2,77 7,68 19,36 374,68 275,07 3.600,00 257,53 1.590.000,00 257,53 0,00 24,36 0,00 1.405,05 1.429,41 La grafica de la fució de regresió muestral se preseta e la figura 2, los putos detro de círculos so las medias codicioales de cada grupo de graja, y la recta de regresió se ajusta a estas medias codicioales dados los valores de X.
Figura 2: Fució de Regresió Muestral 60 50 Yi = 0,0968 Xi 10,0985 R² = 0,9830 RECTA DE REGRESION MUESTRAL 40 30 20 10 0 0 50 100 150 200 250 300 350 400 450 500 550 600 650 Aálisis de Variazas: Para el aálisis de variaza debemos verificar el cumplimieto de la coocida idetidad: SCT = SCE + SCR i=i ( y i ȳ) 2 = ( ^y i ȳ) 2 + ( ^y i y i ) 2 (5) E la tabla 3 ecotramos los valores correspodietes a cada ua de las sumas de la ecuació 6, de dode obteemos: SCT = 1.429,41 SCE = 1.405,05 SCR = 24,36
Al dividir estas sumas de cuadrados etre sus respectivos grados de libertad se obtiee las variazas o cuadrados medios, que luego os permitirá hacer iferecia estadística mediate pruebas de hipótesis e itervalos de cofiaza. 1.405,05 cme = = 1.405,05 1 24,36 cme = = 3,4803 = S² (e) 7 S(e) = 3,4803 = 1,8656 1.405,05 F = = 403,7151 3,4803 1.405,05 R 2 = = 0,983 = 98,3 % 1.429,41 El cálculo de las variazas de los estimadores se muestra a cotiuació: Para b 1 : 2 S b1 = S 2 e 2 x i = (x i x) 2 3,4803 9 1.590.000 150.000 = 4,0990 (6) Para b 2 : 2 S b2 = S e 2 = (x i x) 2 3,4803 150.000 = 0,0000232 (7) Co las variazas, calculamos las desviacioes estádar de los estimadores b 1 y b 2 : S(b1) = 4,0990 = 2,0246 S(b2) = 0,0000232 = 0,0048
Y co estos valores obteemos los t calculados para las pruebas de hipótesis. t c (b1) = 10,0985 2,0246 = -4,9881 t c (b2) = 0,0968 0,0048 = 20,0927 Co estos valores se realiza las pruebas de hipótesis para la validació idividual, tato para ϐ 1 como para ϐ 2. Validació idividual para los coeficietes del modelo estimado: Prueba de hipótesis del (1 α) % para el parámetro ϐ 1. 1) Hipótesis: H0: ϐ 1 = 0 Ha: ϐ 1 0 2) Estadístico de prueba: t c (b1) = 10,0985 2,0246 = -4,9881 El valor crítico, de acuerdo a la tabla t, es: t(0.95, 7) = 1.9 3) Criterio de aceptació o rechazo de la hipótesis ula ϐ 1 : Regió de aceptar H0 Regió de rechazar H0 (1-α) = 95% de cofiaza α/2 = 2,5 % -4,9881-1,9 0 1,9 α/2 = 2,5 % tc(b1) 4) Coclusió: Co u 95% de cofiaza, la muestra de tamaño = 9, o os da evidecia para aceptar la hipótesis ula de que el parámetro ϐ 1 = 0 es igual a cero, por cosiguiete se valida como distito de cero este parámetro del modelo, es decir, el valor t calculado es desde el puto de vista estadístico sigificativo.
Prueba de hipótesis del (1 α) % para el parámetro ϐ 2. 1) Hipótesis: H0: ϐ 2 = 0 Ha: ϐ 2 0 2) Estadístico de prueba: t c (b2) = 0,0968 0,0048 = 20,0927 3) Criterio de aceptació o rechazo de la hipótesis ula ϐ 2 : Regió de aceptar H0 Regió de rechazar H0 α/2 = 2,5 % (1-α) = 95% de cofiaza α/2 = 2,5 % -1,9 0 1,9 20,0927 4) Coclusió: Co u 95% de cofiaza, la muestra de tamaño = 9, o os da evidecia para aceptar la hipótesis ula de que el parámetro ϐ 2 = 0 es igual a cero, por cosiguiete se valida como distito de cero este parámetro del modelo, es decir, el valor t calculado es desde el puto de vista estadístico sigificativo. Validació global o cojuta para los coeficietes del modelo estimado: Prueba de hipótesis del (1 α) % para los parámetros ϐ 1 y ϐ 2. 1) Hipótesis: H0: ϐ 1 y ϐ 2 = 0 e forma cojuta. Ha: ϐ 1 y ϐ 2 0 2) Estadístico de prueba: tc(b2) F c = 1.405,05 3,4803 = 403,7151 Valor crítico para la distribució F: F(0.95, 1, 7) = 5.59
3) Criterio de aceptació o rechazo de la hipótesis ula ϐ 1 y ϐ 2 = 0 e forma cojuta Regió de aceptar H0 Regió de rechazar H0 0 (1-α) = 95% de cofiaza α = 5 % 5,59 403,7151 Fc 4) Coclusió: Co u 95% de cofiaza, la muestra de tamaño = 9, o os da evidecia para aceptar la hipótesis ula de que los parámetros ϐ 1 y ϐ 2 so iguales a cero e forma cojuta o globa, por cosiguiete se valida como distitos de cero estos parámetros del modelo, es decir, la prueba F es, desde el puto de vista estadístico sigificativa. Se cocluye que co u 95 % de cofiaza, el modelo es apto para predecir Itervalos del (1 α) % de cofiaza. Itervalos para la predicció media y para la predicció putual. Problema: Cuáto será la producció de tomates si se utiliza 415 kilos de fertilizates? Costruya e iterprete u itervalo del 95 % de cofiaza tato para la predicció media como para la predicció idividual. Primero utilizamos la fució de regresió muestral para estimar la producció de tomate cuado se utiliza 415 kilos de fertilizates (X = 415) Ŷ(415) = -10,0989 + 0,0968*(415) = 30,0662 producció promedio de tomates e toeladas cuado se utiliza 415 de fertilizates. Luego procedemos a calcular las variazas de la estimació media: S 2 ( ^y 0 ) = [ ( ^y i y i ) 2 ] [1 k + (x 0 x)2 (x i x) 2 i= 1 ] = 3,4803[ 1 9 + 225 150000 ] = 0,3919 (8)
Co las variazas, calculamos las desviacioes estádar: S(Ŷ 0 ) = 0,3919 = 0,6260 La variaza de la estimació putual es: S 2 ( y 0 ^y 0 ) = [ ( ^y i y i ) 2 k 2] ] [1 + 1 + (x 0 x) 2 = (x i x) 3,4803[ 1 + 1 9 + 225 150000 ] = 3,8722 (9) La desviació estádar es: S(b2) = 1,9678 = 1,9678 Hora costruimos el itervalo del 95 % de cofiaza para la estimació media: [ 30,0662 (1,9)(0,6260) ; 30,0662 + (1,9)(0,6260) ] = [ 28,8767 ; 31,2557 ] Itervalo del 95 % de cofiaza para la producció media de tomates e toeladas cuado se utiliza 415 kilos de fertilizates. Iterpretació: Co u 95 % de cofiaza, el itervalo [ 28,8767 ; 31,2557 ], costruido a partir de ua muestra de tamaño 9, cotedrá el verdadero valor de la producció media de tomates e toeladas cuado el uso de fertilizates es de 415 kilos. El itervalo del 95 % de cofiaza para la estimació putual es: [ 30,0662 (1,9)(1,9678) ; 30,0662 + (1,9)(1,9678) ] = [ 26,3274 ; 33,8050 ] Itervalo del 95 % de cofiaza para la producció de tomates e toeladas cuado se utiliza 415 kilos de fertilizates. Iterpretació: Co u 95 % de cofiaza, el itervalo [ 26,3274 ; 33,8050 ], costruido a partir de ua muestra de tamaño 9, cotedrá el verdadero valor de la producció de tomates e toeladas cuado el uso de fertilizates es de 415 kilos. Como se observa e los resultados obteidos, el itervalo de cofiaza para la estimació putual, es más grade que el itervalo de cofiaza para la estimació media. Esto es así porque la media es u valor meos represetativo o preciso que la estimació putual e si. Itervalo del 95 % de cofiaza para la variaza (σ 2 ): Valores críticos para la distribució chi cuadrado: χ 2 (0.95, 7) = 14.1 ; χ 2 (0.05, 7) = 2.17 [ 7 3,4803 14,1 ; 7 3,4803 2,17 ] = [ 1,7278 ; 11,2268 ] Itervalo del 95 % de cofiaza para la variaza.
Iterpretació: Co u 95 % de cofiaza, el itervalo [ 1,7278 ; 11,2268 ], costruido a partir de ua muestra de tamaño 9, cotedrá el verdadero valor de la variaza. Itervalo del 95 % de cofiaza para Β 1 : [ -10,0989 (1,9)(2,0246) ; -10,0989 + (1,9)(2,0246) ] = [ -13,9456 ; -6,2521 ] Itervalo del 95 % de cofiaza para Β 1. Iterpretació: Co u 95 % de cofiaza, el itervalo [ -13,9456 ; -6,2521 ], costruido a partir de ua muestra de tamaño 9, cotedrá el verdadero valor de Β 1. Itervalo del 95 % de cofiaza para Β 2 : [ 0,0968 (1,9)(0,0048) ; 0,0968 + (1,9)(0,0048) ] = [ 0,0876 ; 0,1059 ] Itervalo del 95 % de cofiaza para Β 2. Iterpretació: Co u 95 % de cofiaza, el itervalo [ 0,0876 tamaño 9, cotedrá el verdadero valor de Β 2. ; 0,1059 ], costruido a partir de ua muestra de Validació ecoómica: Para la validació ecoómica se tomará e cueta tato el sigo esperado para el coeficiete como el valor o magitud de este coeficiete y su relació co las variables del modelo. Para el coeficiete b 1 (-10,0985): Se espera u sigo egativo para este coeficiete, pues represeta la producció promedio de tomates (e toeladas) e caso que o se utilice fertilizates o el valor de la variable explicativa sea igual a cero (X = 0), como el sigo dio egativo o tiee ua explicació racioal o creíble desde el puto de vista ecoómico, auque alguie podría forzar ua iterpretació e el setido que represetaría las pérdidas por o utilizar este factor de producció. Por ser este coeficiete el térmio idepediete, e realidad o es muy importate su iterpretació, a meos que esté icluido expresamete e la teoría ecoómica que se utilice para especificar el modelo. E la práctica, se matiee este térmio idepediete auque o se valide. Para el coeficiete b 2 (0,0968): Este coeficiete si tiee el sigo esperado desde el puto de vista ecoómico, pues tiee sigo positivo. Se etiede que u aumeto e el uso de fertilizate hará aumetar la producció de tomate o ua dismiució e el uso de fertilizate hará dismiuir la producció de tomates, es decir, las variacioes va e el mismo setido por lo que se espera u sigo positivo.
PROBLEMA FERTILIZANTE (RESUMEN) Toeladas de Tomate por hectárea Medias Codicioales Kilos de fertilizates por hectárea 200 250 300 350 400 450 500 550 600 10 11 18 20 34 38 33 43 49 9 14 20 22 29 35 43 46 45 8 9 15 25 31 33 38 40 38 12 15 16 26 34 44 46 46 8 13 30 35 48 9,4 12,4 17,25 24,6 31,33 35 38,6 43,75 45,2 Medias Poblacioales 10 15 20 25 30 35 40 45 50 X Y X X (Y X) 2 Y - Y (X X)*(Y Y) 1 200,00 9,40 (200,00) 40.000,00 (19,21) 3.842,96 2 250,00 12,40 (150,00) 22.500,00 (16,21) 2.432,22 3 300,00 17,25 (100,00) 10.000,00 (11,36) 1.136,48 4 350,00 24,60 (50,00) 2.500,00 (4,01) 200,74 5 400,00 31,33 - - 2,72-6 450,00 35,00 50,00 2.500,00 6,39 319,26 7 500,00 38,60 100,00 10.000,00 9,99 998,52 8 550,00 43,75 150,00 22.500,00 15,14 2.270,28 9 600,00 45,20 200,00 40.000,00 16,59 3.317,04 3.600,00 257,53 0,00 150.000,00 0,00 14.517,50 X = Y = 400 b = 0,0968 28,61 a = -10,1 RECTA DE REGRESION POBLACIONAL 60 50 f(x) = 0,1x - 10 R² = 1 40 30 E[Y/Xi] Lieal (E[Y/Xi]) 20 10 0 150 200 250 300 350 400 450 500 550 600 650
Problema Fertilizates. (Cotiuació) X Y X 2 ( ^Y ) ( ^Y Y ) ( ^Y Y ) 2 ( ^Y Ȳ ) ( ^Y Ȳ ) 2 (Ȳ Y ) 2 1 200,00 9,40 40.000,00 9,26-0,14 0,02-19,36 374,68 369,21 2 250,00 12,40 62.500,00 14,1 1,7 2,88-14,52 210,76 262,92 3 300,00 17,25 90.000,00 18,94 1,69 2,84-9,68 93,67 129,16 4 350,00 24,60 122.500,00 23,78-0,82 0,68-4,84 23,42 16,12 5 400,00 31,33 160.000,00 28,61-2,72 7,39 0 0 7,39 6 450,00 35,00 202.500,00 33,45-1,55 2,39 4,84 23,42 40,77 7 500,00 38,60 250.000,00 38,29-0,31 0,09 9,68 93,67 99,7 8 550,00 43,75 302.500,00 43,13-0,62 0,38 14,52 210,76 229,07 9 600,00 45,20 360.000,00 47,97 2,77 7,68 19,36 374,68 275,07 3.600,00 257,53 1.590.000,00 257,53 (0,00) 24,36 0,00 1.405,05 1.429,41 60 RECTA DE REGRESION MUESTRAL f(x) = 0,1x - 10,1 R² = 0,98 50 40 30 20 10 0 0 50 100 150 200 250 300 350 400 450 500 550 600 650 Residuos (ei) 4 3 2 1 0-1 0 1 2 3 4 5 6 7 8 9 10-2 -3 Residuos t(0.95, 7) = 1.9 χ 2 (0.95, 7) = 14.1 ; χ 2 (0.05, 7) = 2.17 F(0.95, 1, 7) = 5.59 Z(0.95) = 1.96 Ua cola. Z(0.95) = ± 1.645 Dos colas.