9 9 Análisis de Regresión Lineal

Documentos relacionados
SESIÓN 8 DESCRIPCIONES DE UNA RELACIÓN

R-SQUARED RESID. MEAN SQUARE (MSE) σˆ 2 ADJUSTED R-SQUARED STANDARD DEVIATION σ ˆ

Figura 10. No se satisface el supuesto de linealidad.

2 Conceptos básicos y planteamiento

e i y i y i y i 0 1 x 1i 2 x 2i k x ki

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

MINITAB y MODELOS DE REGRESIÓN

CAPÍTULO I. Conceptos Básicos de Estadística

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

TEMA 1. ESTADÍSTICA DESCRIPTIVA

Tema 4. Estimación de parámetros

Análisis de resultados. Independencia de las muestras

Determinación del tamaño de una muestra (para dos o más muestras)

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

y i 0 1 x i 2 2 y i media 2 Varianza 2 i 1 Para calcular el los valores que maximizan L derivamos e igualamos a cero 2 y i 0 1 x i 0 # i 1

Estimación de Parámetros. Estimación de Parámetros

Estimación de Parámetros

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

Resumen Tema 2: Muestreo aleatorio simple. Muestreo con probabilidades desiguales.

Hacia dónde tienden los datos? Se agrupan en torno a un valor? o, se dispersan? Su distribución se parece a alguna distribución teórica?

Estimación de parámetros. Biometría

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

Guía 1 Matemática: Estadística NM 4

IntroducciónalaInferencia Estadística

PyE_ EF2_TIPO1_

De esta forma, el problema de encontrar la mejor recta se concentra en calcular los valores de la pendiente (m) y de la ordenada al origen (b)

Preguntas más Frecuentes: Tema 2

Distribuciones en el muestreo, EMV

MUESTREO Y ESTIMACIÓN ESTADÍSTICA

Medidas de tendencia central

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Bloque 3 Tema 12 PRUEBAS ESTADÍSTICAS PARA EL CONTRASTE DE HIPÓTESIS: PRUEBAS PARAMÉTRICAS

17.3 Intervalos de predicción para el promedio de m observaciones futuras

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

DISTRIBUCIONES DE PROBABILIDAD.- DISTRIBUCIÓN BINOMIAL (BERNOULLI) DISTRIBUCIÓN NORMAL (GAUSS)

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

Práctica 7 CONTRASTES DE HIPÓTESIS

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

Qué es la estadística?

LAS SUCESIONES Y SU TENDENCIA AL INFINITO

4.- Aproximación Funcional e Interpolación

1.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

INTERÉS SIMPLE COMO FUNCIÓN LINEAL.

Medidas de Tendencia Central

República Bolivariana de Venezuela Universidad Nacional Abierta Vicerrectorado Académico Área de Matemática

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO COLEGIO DE CIENCIAS Y HUMANIDADES

CAPITULO 0 CONCEPTOS BASICOS DE ALGEBRA Y PROGRAMACION LINEAL Algebra lineal Notación básica.

1. QUÉ ES LA ESTADÍSTICA?

Slide 1. Slide 2. Slide 3. Universidad Diego Portales Facultad de Economía y Negocios. Capítulo 4 Introducción a la Probabilidad.

1. Intervalos de Conanza

1. Teorema del Límite Central. Como se dijo varias clases atras si tenemos n variables aleatorias, cada una de. X i = X. n = 1 n.

Series alternadas Introducción

LAS SERIES GEOMÉTRICAS Y SU TENDENCIA AL INFINITO

Muestreo sistemático

Unidad N 2. Medidas de dispersión

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 6 Aula + Laboratorio

Topografía 1. II semestre, José Francisco Valverde Calderón Sitio web:

PRUEBAS DE HIPÓTESIS.

Un sistema de m ecuaciones lineales con n incógnitas es un conjunto de m igualdades del tipo:......

Práctica 2 VARIABLES ALEATORIAS CONTINUAS

Sistemas de Ecuaciones Lineales. M. en I. Gerardo Avilés Rosas

SUCESIONES Y SERIES Una sucesión es un conjunto de números ordenados bajo cierta regla específica. 7, 10, 13, 16, 19, 22, 25,...

1. Propiedades de los estimadores

Prueba A = , = [ 7.853, 8.147]

TRABAJO PRACTICO Nº 1

Identificación de Sistemas

FÍSICA GENERAL 2º CUATRIMESTRE 2014 TT.PP. LABORATORIOS- TEORIA DE ERRORES. (Algunos conceptos importantes)

ESTADÍSTICA UNIDIMENSIONAL

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 11. Estimación de una media. Introducción. Introducción (2) Introducción

SESION 15 DISTRIBUCIONES DE MUESTREO

UNIDAD 4.- INFERENCIA ESTADÍSTICA II

ESTADÍSTICA DESCRIPTIVA

Importancia de las medidas de tendencia central.

EJERCICIOS RESUELTOS TEMA 8

Objetivo. 1. Intervalos y test (una sola muestra) Práctica 7: Intervalos de conanza y contrastes de hipótesis I. M. Iniesta Universidad de Murcia

ESTADÍSTICA DESCRIPTIVA

Trabajo Especial Estadística

Universidad Antonio Nariño Matemáticas Especiales

MEDIDAS DE DISTRIBUCION

12 I N F E R E N C I A E S T A D Í S T I C A II (CONTRASTE DE HIPÓTESIS)

Luis González Abril y Luis M. Sánchez-Reyes {luisgon, - Dpto. Economía Aplicada I Universidad de Sevilla

Unidad 1: Las Ecuaciones Diferenciales y Sus Soluciones

Tema 2. Medidas descriptivas de los datos

Métodos de reducción de varianza

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

FUNCIONES. ( a) IGUALDAD DE FUNCIONES Sí y son dos funciones, diremos que las funciones f y

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

R. Urbán Introducción a los métodos cuantitativos. Notas de clase Sucesiones y series.

Introducción a la Inferencia Estadística. Muestreo en poblaciones normales

PRUEBAS DE HIPOTESIS

Departamento Administrativo Nacional de Estadística

Combinatoria. Tema Principios básicos de recuento

Introducción a la Econometría. Análisis estadístico de datos económicos

APUNTES DE FÍSICA I Profesor: José Fernando Pinto Parra UNIDAD 11 DINÁMICA DEL MOVIMIENTO ROTACIONAL

REPASO DE ESTADÍSTICA

Ley de Grandes Números y Teorema Central del

2 FUNDAMENTOS DE PROBABILIDAD

Transcripción:

9 9 Aálisis de Regresió Lieal Itroducció El objetivo de este capítulo es itroducir el aálisis simultáeo de dos variables y adquirir criterios para el uso de las técicas de regresió y correlació. Hasta el capítulo aterior se ha itroducido métodos estadísticos que se puede utilizar cuado el iterés es aalizar el comportamieto de ua sola variable, evetualmete, bajo distitas codicioes. Por ejemplo, el redimieto o la altura de las platas de u cultivo co o si riego. Pero frecuetemete se preseta situacioes dode se observa dos o más variables sobre cada uidad experimetal y el iterés se cetra e la forma e que estas variables se relacioa. Alguos ejemplos de relacioes fucioales que puede ser de iterés e agroomía so: la relació etre el redimieto de u cultivo y la desidad de siembra, la relació etre la catidad de suplemeto dado y el aumeto de peso que éste produce e u lote de aimales, las dosis de u isecticida y la mortalidad de los isectos tratados, etc. E cada uo de estos casos se puede platear los siguietes iterrogates: Existe algua relació etre las variables? Si se cooce el comportamieto de ua de ellas, se puede predecir el comportamieto de la otra? La estadística aplicada ofrece dos herramietas que permite dar respuesta a dichas cuestioes: el Aálisis de Regresió y el Aálisis de Correlació. El Aálisis de Regresió estudia la relació fucioal que existe etre dos o más variables. Idetifica el modelo o fució que liga a las variables, estima sus parámetros y, evetualmete, prueba hipótesis acerca de ellos. Ua vez estimado el modelo es posible predecir el valor de la variable deomiada variable depediete e fució de la o las otras variable/s idepediete/s y dar ua medida de la precisió co que esa estimació se ha hecho. Depediedo del objetivo del estudio, los valores o iveles de la/s variable/s 197

idepediete/s puede ser arbitrariamete modificados por el experimetador, es decir el ivestigador puede fijar los iveles de la variable idepediete para los cuales desea estudiar la respuesta de la variable depediete. El modelo hallado puede ser usado para predecir el comportamieto de la variable depediete para otros iveles de la variable idepediete, que perteezca al domiio del estudio. El Aálisis de Correlació lieal estudia el grado y setido de la asociació lieal que hay etre u cojuto de variables y, a diferecia del aálisis de regresió, o se idetifica i se estima explícitamete u modelo fucioal para las variables, este siempre se supoe lieal. El iterés pricipal es medir la asociació etre dos variables aleatorias cualesquiera, si ecesidad de distiguir variables depedietes e idepedietes. Por ejemplo, puede quererse evaluar la itesidad de la asociació etre la catidad de espiguillas por espiga de trigo y la logitud de las espigas. Se ha establecido que cuato mayor es la logitud de las espigas mayor es el úmero de espiguillas por espiga. Obsérvese que, e el ejemplo, o se habla de relació fucioal, i tampoco se isiúa que la logitud de la espiga aumeta porque aumeta el úmero de espiguillas o viceversa, sólo se efatiza la forma e que se comporta ua variable e relació a la otra y el iterés está cetrado e medir la itesidad de esta asociació. E el aálisis de correlació, igua de las variables puede ser fijada por el experimetador, ya que éste podría seleccioar iveles de las variables que o so frecuetes y esto podría coducir a ua estimació errada del grado de correlació. Los gráficos de dispersió so útiles e la etapa exploratoria, tato e el aálisis de regresió como e el de correlació. La represetació gráfica de los datos es frecuetemete el puto de partida de cualquier aálisis que ivolucra más de ua variable. E los gráficos de dispersió lo que se ve es ua ube de putos, dode cada puto represeta ua observació. La Figura 9.1 muestra los gráficos de dispersió usados e estudios de asociació etre dos variables dode además se ha dibujado sobre la ube de putos, la posible fució de ajuste de esos datos, es decir, se ha idetificado el modelo fucioal de la relació. 198

Figura 9.1: Gráficos de dispersió para diferetes modelos de relació etre dos variables. 199

Aálisis de regresió lieal El térmio regresió surgió de estudios de la herecia biológica realizados por Galto durate el siglo pasado. E su coocida experiecia, Galto otó que los padres altos teía hijos cuya altura era mayor a la altura promedio, pero o era más altos que sus padres. Tambié, padres bajos teía hijos co altura meor a la altura promedio pero era más altos que sus padres. Esta tedecia de las características de los grupos de moverse, e la siguiete geeració, hacia el promedio de la població o de regresió hacia la media fue descubierta por Galto. El térmio o tiee hoy el mismo sigificado que le dio Galto, pero se usa extesamete para referirse al estudio de relacioes fucioales etre variables cuado hay ua compoete aleatoria ivolucrada. Al estudiar la relació etre dos o más variables surge la idea de ecotrar ua expresió matemática que la describa. Para el caso de dos variables, si se deota como Y a la variable que se supoe depediete y como X a la variable que se postula como idepediete, resulta familiar utilizar el cocepto de fució y decir Y es fució de X, para idicar que de acuerdo a los valores asigados a X se puede predecir los valores que tomará Y. Dicho de otra maera, se puede coocer el comportamieto de Y a través de u modelo que relacioa la variació e Y co la variació de X. El aálisis de regresió tiee por objetivo idetificar u modelo fucioal que describa cómo varía la esperaza de la variable depediete, E(Y), frete a cambios e X. Al igual que e el aálisis de variaza el modelo para Y tambié preseta costates descoocidas que se llama parámetros, por lo que otro objetivo del aálisis es la estimació de los parámetros a partir de ua muestra aleatoria de observacioes e Y y e X. El aálisis de regresió se ocupa tambié de la validació del modelo propuesto y de las pruebas de hipótesis sobre los parámetros del modelo; por último, la modelació por regresió tambié tiee como objetivo la predicció, es decir el uso del modelo para dar el valor esperado de Y cuado X toma u valor particular. La complejidad matemática del modelo de regresió y la adecuació de éste depederá de cuáto se cooce acerca del proceso o feómeo que se está estudiado. E la práctica es posible adoptar modelos de regresió que se puede agrupar o clasificar e lieales y o lieales. Los primeros hace referecia a aquellos modelos e que la fució adopta la forma de ua suma de térmios, cada uo coformado por el producto de u parámetro y ua variable idepediete. Los modelos o lieales so aquellos dode los parámetros o se ecuetra multiplicado a las 00

variables idepedietes como e el modelo lieal de tal forma que o puede ser estimados resolviedo u sistema de ecuacioes lieales. Por ejemplo, los parámetros puede ecotrarse como expoetes de las variables idepedietes. La estimació de los parámetros e modelos o lieales se realiza usado herramietas diferetes a las presetadas e este capítulo. Aquí se aborda solamete los modelos lieales, o sólo por ser más simples, sio porque permite dar respuesta a u gra úmero de problemas e las Ciecias Agropecuarias. Además, alguos de los modelos o lieales puede, mediate adecuadas trasformacioes, ser expresados de la forma lieal (e estos casos los modelos se dice itrísecamete lieales). El modelo de regresió lieal más secillo es el que se preseta e la siguiete defiició: Defiició 9.1: Modelo de regresió lieal simple Se llama modelo de regresió lieal simple a: dode: Y X ij i ij Y ij = observació de la variable depediete bajo el i-ésimo ivel de X, i = 1,...,K e la j-ésima uidad experimetal, j = 1,...,m X i = = = ij = i-ésimo valor de la variable idepediete, i = 1,...,K parámetro que represeta la ordeada al orige de la recta (idica valor esperado de Y cuado X=0) parámetro que represeta la pediete de la recta (tasa de cambio e Y frete al cambio uitario e X). variació aleatoria (o o explicada por el modelo) asociada a la j-ésima observació de Y bajo el ivel X i. Los ij se supoe ormales e idepedietemete distribuidos co esperaza 0 y variaza costate para todo X e u itervalo dode el modelo se supoe verdadero. Esto es ij ~ N I D ( 0, ). El modelo aterior icluye solamete ua variable idepediete y establece que la esperaza de la variable depediete cambia co tasa costate, segú crece o decrece el valor de la variable idepediete. Qué se puede decir de la esperaza de Y?, es decir cuál es el valor esperado de Y para u determiado valor de X? Tomado esperaza de Y ij se tiee, por propiedades de la fució esperaza que: 01

E( Y ij X = x i ) = y x = + x i dode: y X=x represeta la E(Y ij ) dado u valor de X i, es decir la esperaza de la distribució de Y correspodiete a u valor particular de X. y represeta los parámetros del modelo y debe observarse que, dados y la esperaza de Y depede solo de X. Cuado el ivestigador trata co problemas de dos variables que está ligadas por ua relació fucioal lieal, difícilmete los pares de observacioes (X,Y) coicida exactamete co ua recta. La presecia de errores aleatorios e las observacioes hace imposible que e la práctica se ecuetre ua relació fucioal perfecta etre las variables. Por ello, los modelos determiísticos so de limitado valor e la descripció de feómeos biológicos. El modelo estadístico, a diferecia del modelo determiístico, cosidera ua compoete aleatoria co la cual se tiee e cueta la variació de los valores de Y observados para u mismo ivel de X. Es importate otar que de la Defiició 9.1 se desprede que la E(Y) se relacioa fucioalmete co X a través de ua recta, luego, aú cuado las observacioes experimetales o pueda aliearse sobre la recta, si la relació fucioal etre las variables existe, se espera que ésta se visualice co mayor claridad sobre los promedios. Ejemplo 9.1 Supoga que se quiere estudiar la distribució de los pesos de ua població de platas e relació a sus alturas. Para cualquier altura elegida, por ejemplo X=50 cm, existe ua distribució de pesos, es decir, la distribució de los pesos de todas las platas de la especie que posee esa altura. Esa distribució, llamada distribució codicioal de Y dada X (Y X=50), tiee como esperaza a Y X=x = peso medio de todas las platas que tiee altura 50 cm y ua variaza Y X=x = variaza de los pesos de todas las platas que tiee dicha altura. Así, se dice que la regresió del peso sobre la altura represeta la esperaza de la distribució de los pesos segú la altura. Obsérvese la siguiete figura. 0

Figura 9.: Esperaza de Y codicioada a X e relació a X. Cómo se iterpreta los parámetros del modelo de regresió lieal simple? La ecuació de cualquier recta puede ser escrita como Y x dode es la ordeada al orige e idica el valor de y para x = 0 y es la pediete e idica cuáto cambia y por cada icremeto uitario e x. Cuado es u úmero positivo sigifica que hay u crecimieto de uidades e y por cada icremeto de ua uidad e x; si es u úmero egativo, y dismiuirá uidades co cada icremeto uitario de x. Luego, la pediete y la ordeada al orige determia la posició de la recta. E la Figura 9.3 se observa ua recta co >0. y y= + x Figura 9.3: Represetació gráfica de la ecuació de la recta Y x que puede describir razoablemete bie la ube de putos presetada. Volviedo al modelo estadístico de regresió lieal simple: x 03

a) el parámetro, u ordeada al orige de la recta de regresió de Y sobre X, es la esperaza de Y para X = 0; y b) el parámetro, o pediete de la regresió de Y sobre X, es la diferecia etre y cuado x -x 1 = 1. YX x 1 YX x Estimació de la recta de regresió. Método de los míimos cuadrados Ejemplo 9. E u esayo sobre trigo que se lleva a cabo e la zoa de Marcos Juárez se desea cuatificar la relació que hay etre la dispoibilidad de Nitrógeo e el suelo y la catidad de Nitrógeo e la plata (que se supoe lieal). Se obtuviero datos para 1 parcelas, e las que se registró el coteido de itrógeo e el suelo (X) y los valores promedios de itrógeo por plata (Y). Los resultados se preseta e la Tabla 9.1. Tabla 9.1: Cada fila represeta los valores observados sobre ua uidad experimetal, coformada por ua parcela de 50 cm. x 50 cm., e la que se midió el Nitrógeo e el suelo y por plata calculado como promedio sobre todas las platas de la parcela X: Nitrógeo e Suelo (ppm) Y: Nitrógeo e plata (ppm) 0.4 0.13 0.45 0.15 0.50 0.16 0.55 0.17 0.68 0.18 0.69 0.18 0.70 0.19 0.73 0.0 0.80 0.0 0.90 0.1 0.9 0. 0.94 0.3 El diagrama de dispersió para los datos de esta experiecia se preseta e la siguiete figura. 04

coteido promedio de itrógeo por plata 0.4 0. 0.0 0.18 0.16 0.14 0.1 0.10 0.3 0.5 0.7 0.9 1.1 coteido de itrógeo e el suelo Figura 9.4: Diagrama de dispersió de los datos del Ejemplo 9.. El diagrama idica que hay ua relació positiva etre la catidad de itrógeo e la plata y la catidad de itrógeo dispoible e el suelo. E este ejemplo se puede postular ua relació lieal. La ecuació de la recta de regresió es: Y X=x = +x A partir de los datos experimetales se estima los coeficietes y de la recta de regresió. Defiició 9.: Coeficietes de regresió muestral Se llama coeficietes de regresió muestral a las estimacioes de y, las que se deota como a y b respectivamete. Si o hubiese errores aleatorios e los Y i y el modelo lieal fuera correcto, cualquier par de putos (X i,y i ) podría usarse para ecotrar los valores de y y todas las estimacioes sería idéticas idepedietemete del par utilizado. Pero la presecia de los errores aleatorios descalifica este procedimieto y muestra la ecesidad de dispoer de u método que combie toda la iformació dispoible e la muestra para dar ua solució razoable al problema de estimació. Uo de estos métodos es el coocido como Método de Míimos Cuadrados. 05

El método de Míimos Cuadrados defie la recta de mejor ajuste como aquella que hace que la suma de los cuadrados de las distacias de los valores observados respecto a la recta, medidas sobre el eje de las ordeadas, sea lo más pequeña posible. Esto es: dode: yˆ a i yi yi bx ei ab, i 1 i 1 i 1 mi. ŷa bx, es el valor predicho por el modelo lieal y e i es el residuo defiido como e y yˆ. i i Figura 9.5: Represetació de los residuos, E(Y X=x), recta de regresió e iterpretació geométrica de la ordeada al orige () y de la pediete () de la recta El método de estimació por míimos cuadrados produce las siguietes expresioes para los estimadores b y a de y respectivamete: 06

b i1 i1 XY i X i - - X. Y i1 i i i i1 i1 ( X ) i, a y x E el ejemplo: 8.8.. 1.5888 - b 1 0.159 8.8 6.078-1 a = 0.185-0.159. 0.69 = 0.076 por tato la regresió estimada de Y sobre X puede expresarse como: Y X=xi = 0.076 + 0.159 x i y su gráfica se preseta e la Figura 9.6. coteido promedio de itrogeo por plata 0.4 0. 0.0 0.18 0.16 0.14 0.1 0.10 0.3 0.5 0.7 0.9 1.1 coteido de itrógeo e el suelo Figura 9.6: Represetació gráfica cojuta del diagrama de dispersió del Ejemplo 9. y la recta de regresió estimadas Y = 0.076 + 0.159 X. 07

Estimacioes y prediccioes La ecuació de regresió puede ser usada para obteer estimacioes de la esperaza de Y o prediccioes de Y para valores elegidos de X. Debe teerse e cueta, si embargo, que los valores de X propuestos debe perteecer al domiio de las X utilizado para la estimació de la recta. No es coveiete usar la ecuació de la recta para extrapolar, es decir para estimar la esperaza de Y para valores de X fuera del rago estudiado ya que o se cooce ada sobre el comportamieto de la relació de X e Y fuera del domiio e la que se estudió esta relació. Por supuesto, aú detro del domiio estudiado de X, la validez de las estimacioes depede de la bodad de ajuste del modelo, es decir su grado de aproximació respecto de la verdadera relació fucioal etre las variables. Cada valor calculado a partir de la recta de regresió, es la estimació de la esperaza de la distribució de Y codicioada a u valor de X ˆ YX x, o ua predicció del valor de Y para ua observació futura de X ( ŷ ). E el ejemplo, las prediccioes de Y para x = 0.93 y x = 0.46 so, respectivamete: ŷ = 0.076 + 0.159 (0.93) = 0. ŷ = 0.076 + 0.159 (0.46) = 0.15 Itervalo de cofiaza para la esperaza codicioal de Y Utilizado las propiedades de la variaza de la suma de variables aleatorias, aplicada a la expresió de la esperaza codicioal de Y dado X se tiee: 1 x x Var E Y X x xi x i De la expresió aterior puede deducirse tres propiedades: a) La variaza de la esperaza de Y o es igual para todo valor X i, de hecho es míima cuado X i coicide co la media muestral de X. b) La variaza de la esperaza de Y es más pequeña cuato mayor es la suma de cuadrados de X i i x x, lo que implica que cuato más disímiles 08

sea los valores de X a los cuales se observa los valores de Y, tato mejor será las estimacioes de las esperazas codicioales de Y. c) Para que tiede a ifiito la variaza de la esperaza codicioal de Y tiede a cero. Además, bajo los supuestos clásicos del aálisis de regresió, el itervalo de cofiaza al 95%, de Y para X=x 0 está dado por: yˆ 1.96 1 i 0 0 i x x x x Si o se cooce y se estima, etoces, el itervalo aterior se modifica reemplazado el valor 1.96 por el cuatil correspodiete de ua T co - grados de libertad y sustituyedo por su estimador. Cuado los itervalos de cofiaza se grafica para todos los valores de x e u recorrido dado se obtiee badas de cofiaza. La Figura 9.7, muestra las badas de cofiaza al 95% para ua regresió lieal simple e la que se evaluó el coteido de itrógeo e platas de trigo e fució del coteido de itrógeo del suelo. 0.5 Nitrógeo e plata (ppm) 0.0 0.15 Figura 9.7: Recta de míimos cuadrados y badas de cofiaza al 95% para la esperaza codicioal de Y dado X=x. 0.10 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Nitrógeo e Suelo (ppm) Itervalo de predicció de Y dado X Al igual que e el puto aterior, aplicado el operador variaza al predictor de Y dado X=x se tiee la siguiete expresió. 09

1 x x Var Ypred X x 1 xi x i Idéticas observacioes a las realizadas para la variaza de la esperaza codicioal de Y, se puede hacer para la expresió aterior, pero debe agregarse que e este caso la variaza es uidades mayor y que para que tiede a ifiito la variaza del predictor tiede a. Cuado se grafica todos los itervalos de predicció para ua regió dada de x, se obtiee las badas de predicció, que so similares a las de cofiaza, excepto que so más amplias. El itervalo de predicció al 95% de Y dado X=x 0 tiee la siguiete expresió: yˆ 1.96 1 1 i 0 0 i x x x x E el caso e que se estime, el itervalo se obtiee reemplazado 1.96 por el cuatil correspodiete de ua T co - grados de libertad y sustituyedo por su estimador. La diferecia etre itervalo de cofiaza y predicció esta dada e que el primero delimita ua regió que co probabilidad 1- cotiee a la verdadera esperaza de Y dado X, mietras que el segudo delimita u regió cuya probabilidad de ocurrecia para muestras aleatorias de Y dado X es 1-. Itervalo de cofiaza para la ordeada al orige Para dar u itervalo de cofiaza para la ordeada al orige del modelo de regresió lieal simple se ecesita coocer la variaza del estimador a de. La siguiete expresió de la variaza de a se obtiee aplicado las reglas del operador variaza al estimador de : x 1 Var( a), xi xi dode es la variaza del error. Dado que bajo los supuestos usuales de regresió a se distribuye como ua ormal co esperaza y variaza segú la expresió 10

aterior, el itervalo de cofiaza al 95% para esta dado por: x 1 a 1.96 xi xi Si o se cooce y se estima, como se verá más adelate, etoces el itervalo se obtiee utilizado el cuatil correspodiete de ua T co - grados de libertad e reemplazo de 1.96 y sustituyedo por su estimador. Itervalo de cofiaza para la pediete Al igual que para la ordeada al orige, la obteció de u itervalo de cofiaza para se basa e la distribució de su estimador b y la variaza del mismo. Bajo los supuestos que se tiee para el aálisis de regresió, b se distribuye ormal co esperaza y variaza dada por la siguiete expresió: Var( b) x i xi dode es la variaza del error. Luego, el itervalo de cofiaza al 95% para esta dado por: b 1.96 xi xi Si o se cooce y se estima, etoces el itervalo se obtiee sustituyedo 1.96 por el cuatil correspodiete de ua T co - grados de libertad y por su estimador. Pruebas de hipótesis e regresió E los putos ateriores se ha estudiado como estimar los parámetros de u modelo de regresió lieal simple: estos so la ordeada al orige () y la pediete (). E esta secció se aborda la problemática de la prueba de hipótesis sobre estos parámetros. La aproximació más simple para probar = 0 y/o = 0 es mediate u test T. Los 11

estadísticos de las pruebas T, que se preseta a cotiuació, so simples y bajo los supuestos, que se discutirá más adelate, se distribuye como ua T co - grados de libertad. Para pruebas de hipótesis sobre Para pruebas de hipótesis sobre a 0 b 0 T T 1 x ˆ ˆ xi xi xi xi E las expresioes dadas aparece la estimació de la variaza del error. No se ha mostrado, hasta ahora, ua expresió para este estimador, si embargo, ésta o es descoocida ya que se presetó e el cotexto del aálisis de la variaza. La técica de estimació os coduce a la partició de la Suma de Cuadrados Total (SCT) de Y e ua Suma de Cuadrados Explicada por (SC), ua Suma de Cuadrados Explicada por (SC) y ua Suma de Cuadrados Residual (SCR). Así, se tiee: SCT = SC + SC + SCR Las sumas de cuadrados dadas tiee grados de libertad asociados. Las SC y SC tiee ambas 1 grado de libertad cada ua, la SCT tiee y SCR -. Luego, SCR/(-). La descomposició de la suma de cuadrados permite estimar y costruir la siguiete tabla de ANOVA para el modelo de regresió: Fuetes de Variació Suma de Cuadrados Grados de libertad Cuadrados Medios SC 1 CM CM /CMR SC 1 CM CM/CMR CMR SCR - CMR Total SCT Las pruebas F de las dos primeras filas de la tabla sirve para probar las hipótesis: H 0 :=0 vs H 1 : 0 y H 0 :=0 vs H 1 :0 respectivamete. Es usual que la prueba H 0 :=0 sea irrelevate o carete de setido e el cotexto del problema y la presecia de e el modelo cumple sólo co el propósito de o poer restriccioes al ajuste lieal. Por lo tato, virtualmete todo el software estadístico omite la prueba H 0 : = 0 y e el caso de proveer el cálculo de la SCT, lo que muestra es ua SCT corregida F 1

que es igual SCT-SC co -1 grados de libertad. Debido a que la correcció de la SCT es la práctica usual, excepto que se idique lo cotrario, siempre se hace referecia a ella. De esta forma SCT (corregida) = SC + SCR y la tabla de ANAVA es la siguiete: Tabla 9.: Cuadro de Aálisis de la Variaza para la hipótesis usual del modelo de regresió simple. H 0 : ß = 0, siedo ß el coeficiete Fuetes. de variació Debida a (explicada) i1 Suma de Cuadrados XiYi i1 i1 XY i i X i i1 X i i1 Grados de libertad 1 Cuadrados Medios SC 1 F observada CM CMR Residual (o explicada) Total (corregida) SC Total-SC - i1 Y ( Yi ) i1 i -1 SCR Observació: Como podrá observarse, la suma de cuadrados total (corregida) es idética a la que se ecotró e el aálisis de la variaza mietras que el Cuadrado Medio Residual es el estimador de la variaza del error ( ) al igual que e el aálisis de la variaza lo era la suma de cuadrados del error. La SC es tambié coocida como Suma de Cuadrados de Regresió. Ejemplo 9.: (cotiuació) volviedo a la relació etre el coteido de Nitrógeo e plata y e suelo presetada ateriormete y después de obteer las estimacioes de y, se puede proceder co la prueba de hipótesis para establecer el rechazo o o de la hipótesis = 0. 13

Los cálculos para el ejemplo so: SCTotal =. 0.40 - =0.0095 1 8.8. 1.5888 1 0.057 SC 0.0090 8.8 0.3596 6.078 1 SCR = SCT - SC = 0.0095-0.0090 = 0.0005 Tabla 9.3: Tabla del Aálisis de Regresió del Ejemplo 9. Fuetes de variació Suma de Cuadrados GL Cuadrados Medios F Observada Debida a (explicada) 0.0090 1 0.0090 180 Residual (o explicada) 0.0005 10 0.00005 Total (corregido) 0.0095 11 Como la F observada es mayor que el cuatil (1-) de ua F 1,10 se rechaza H 0 y se cocluye que u modelo lieal para la relació etre itrógeo e la plata y itrógeo e el suelo explica ua parte de la variació del coteido de Nitrógeo e la plata que resulta estadísticamete sigificativa. Si la hipótesis ula se acepta, o puede asegurarse que la pediete de la recta de regresió estimada sea diferete de cero. Luego, si la recta tiee pediete ula, los valores de Y so idiferetes a los valores de X y por lo tato la relació lieal propuesta o explica las variacioes de Y e fució de X. Los supuestos del aálisis de regresió Tato los métodos de estimació de los parámetros del modelo de regresió, así como los itervalos de cofiaza hallados y las pruebas de hipótesis estudiadas so válidas si se cumple las siguietes propiedades estadísticas para los errores del modelo. 14

La esperaza de la distribució de los errores es 0: E ( i ) = 0 La variaza de la distribució de los errores es costate: V ( i ) = Los i so variables aleatorias ormales e idepedietes. i i Estas tres propiedades se resume idicado que i ~ NIID (0, ) y que se lee: los errores so variables aleatorias ormales idepedietes e idéticamete distribuidas co esperaza 0 y variaza. Además, de los supuestos sobre los errores, tambié se supoe válido el modelo lieal para la esperaza codicioal de Y. Es decir, se supoe cierto que E(Y X= x) = + x. El aálisis de regresió está estrechamete ligado al aálisis de la variaza y los supuestos so los mismos para ambas técicas. E ambos casos los supuestos soporta las propiedades estadísticas que hace válida la iferecia. Si los supuestos o se cumple, el método de estimació por míimos cuadrados o es ecesariamete el más eficiete, los itervalos de cofiaza hallados, el ivel de sigificació y potecia omiales de las pruebas estadísticas de hipótesis o coicide co sus verdaderos valores. Es por esta razó útil pregutarse sobre la razoabilidad de los supuestos e cada problema real y e caso ecesario validarlos a través de pruebas gráficas o formales. Si alguo de los supuestos o se cumple usualmete se trasforma los datos origiales llevádolos a ua escala e la que los supuestos se cumple. Otra alterativa es usar métodos estadísticos que o exige el cumplimieto de estos supuestos. Valor predictivo del modelo de regresió Se ha idicado que la variació total e Y puede ser vista como la variació explicada por la regresió más la variació o explicada o residual. Si la variació o explicada es substacialmete mayor que la variació explicada, se tedrá u idicio de que modelo o es bueo para fies predictivos, es decir, el modelo está explicado poco de la variació e Y. No se debe, si embargo, cofudir la medida de cuato explica u modelo co su pertiecia, ya que se recordará ua vez más, que el modelo es para las esperazas de Y. Ua medida muestral de la capacidad predictiva del modelo es el coeficiete de determiació, deotado por R. 15

Defiició 9.3: Coeficiete de determiació muestral Llamaremos coeficiete de determiació muestral a: R Suma de Cuadrados de Regresió Suma de Cuadrados Total Este coeficiete se iterpreta como la proporció de la variabilidad total e Y explicable por la variació de la variable idepediete o como tambié es usual decir: la proporció de la variabilidad total explicada por el modelo. Por ser ua proporció, el coeficiete de determiació varía etre 0 y 1. Cuato más próximo esté a 1, mayor valor predictivo tedrá el modelo e el setido que los valores observables estará muy próximos a la esperaza estimada por la regresió. Siguiedo co el ejemplo de la relació etre Nitrógeo e plata y Nitrógeo e suelo, el coeficiete de determiació obteido es R = 0.951, es decir el 95% de la suma de cuadrados totales de la variable depediete (Nitrógeo e plata) es "explicada", a través de ua relació lieal, por la variació observada e la variable idepediete. Es frecuete ver al coeficiete de determiació usado como ua medida de la adecuació del modelo, etediedo por adecuació que la relació fucioal y los supuestos sobre los errores so correctos. Esta iterpretació es absolutamete icorrecta y se puede dar ejemplos e los que R es muy alto y el modelo completamete iapropiado. Luego, R es válido como medida de ajuste o de valor predictivo si el modelo es correcto tato e su parte determiística como e su parte aleatoria. La evaluació de la adecuació del modelo es u tema amplio que excede el objetivo de este libro pero es ua de las áreas a las que se ha prestado mucha ateció e los últimos años y existe ua amplia bibliografía sobre el tema (Rawligs, 1988, Myers,1990; Draper y Smith, 1998) Aálisis de Correlació Lieal E el aálisis de regresió, la variable X es usualmete fija, mietras que la variable depediete Y es aleatoria. Si X e Y so ambas variables aleatorias observables sobre ua misma uidad o elemeto de la població, podría ser de iterés medir el grado e que estas variables covaria ya sea positiva o egativamete. Por ejemplo, si u fitomejorador sabe cómo cotrolar la altura del tallo de maíz y se puede establecer que 16

existe u alto grado de asociació etre la altura del tallo y el redimieto de la cosecha se podrá, probablemete, tambié cotrolar el ride. La simple observació de que dos variables parece estar relacioadas, o revela gra cosa. Dos importates pregutas se puede formular al respecto: a) Qué ta estrechamete relacioadas se ecuetra las variables? o cuál es el grado de asociació que existe etre ambas? b) Es real la asociació observada o podría haber ocurrido solo por azar? Para respoder a la primer preguta se ecesita ua medida del grado de asociació etre las dos variables. Esta medida es el coeficiete de correlació, que se deota co la letra griega (rho). Para la seguda, se precisa ua prueba estadística de hipótesis para. El aálisis de correlació clásico supoe que los pares (X i, Y i ) so pares de variables aleatorias idéticamete distribuidos co distribució ormal bidimesioal, o ormal bivariada. Geométricamete, la fució de desidad de esta distribució es ua superficie de forma acampaada. La distribució ormal bivariada es aquella e la que la distribució codicioal de Y para cualquier X, es ormal, y la distribució codicioal de X para cualquier Y, es tambié ormal. Esta distribució icluye a como uo de sus parámetros. Las siguietes figuras muestra ua ormal bivariada co = 0 y ua ormal bivariada co = 0.8. Figura 9.8:Desidad ormal bivariada: =0. Figura 9.9:Desidad ormal bivariada: =0.8. Observació: Auque e el aálisis de correlació o se explicita la forma de la asociació etre variables cuya itesidad y setido se quiere medir, el coeficiete de correlació clásico o de Pearso cuatifica el grado de asociació lieal etre ellas. Por lo tato si dos variables sigue ua estrecha asociació o lieal, el coeficiete de correlació o la cuatificará correctamete. 17

Defiició 9.4: Coeficiete de correlació lieal. El coeficiete de correlació lieal etre las variables aleatorias X e Y se defie como : cov( XY, ) Var( X ) Var( Y ) dode Var(X) y Var(Y) deota las variazas de X e Y respectivamete y Cov(X,Y) deota la covariaza etre X e Y que se defie como Cov(X,Y)= E (XY) - E(X) E(Y). Es importate observar que de la defiició surge que el coeficiete de correlació es idepediete de las uidades de medida de las variables. Tambié debe otarse que el coeficiete de correlació lieal vive e el itervalo [-1,1]. Este coeficiete es u idicador de la desidad alrededor de la recta de regresió para la distribució codicioal de Y dado X y viceversa. Cuado X e Y está o correlacioadas, es igual a cero. E este caso el coocimieto de ua de las variables o ayuda a describir el comportamieto de la otra. Por otra parte, cuado X e Y está altamete correlacioadas e forma lieal, está muy próximo a 1 ó -1. Por defiició de la ormal bivariada, es u parámetro que la caracteriza, y como todo otro parámetro, se estima a partir de observacioes muestrales. Defiició 9.5: Coeficiete de correlació lieal muestral de Pearso Si (X 1, Y 1),..., (X, Y ) es ua muestra aleatoria bivariada de tamaño, el coeficiete de correlació lieal muestral (estimador de ), se deota co r y se defie por: r ( X X)( Y Y) i i i1. ( X i X) ( Yi Y) i1 i1 La fórmula de cálculo es: 18

r X Y XY i i i1 X i Y i i i i1 i1 i1 i1 X i Y i i1 i1 Este estimador provee ua medida muestral de la correlació etre X e Y, y posee la propiedad de ser u estimador isesgado de cuado = 0. Cuado está e la proximidad de 1 o -1 los pares (x,y) se aliea sobre ua recta co pediete positiva o egativa segú el sigo del coeficiete. Cuado = 0, los pares (X,Y) está dispersos alrededor del puto XY, si igua direcció predomiate. ota: 0 implica solamete que hay asociació etre X e Y pero o implica relacioes de causalidad. Bajo el supuesto de distribució ormal bivariada = 0 implica que X e Y so estadísticamete idepedietes. Prueba de hipótesis sobre Si se satisface las suposicioes de ormalidad bivariada y se tiee ua muestra aleatoria de pares de valores (X,Y), es posible utilizar el coeficiete de correlació muestral r, para probar la idepedecia etre X e Y probado la hipótesis H 0 : = 0. Para probar la hipótesis H 0 : = 0 vs. H 1 : 0, el estadístico utilizado es: r T 1 r que se distribuye como ua distribució T de Studet co - grados de libertad, dode es el úmero de pares (X,Y). Luego se procede como e cualquier prueba de hipótesis para la aceptació o rechazo de H o. Ejemplo 9.3 Los datos de la Tabla 9.4 se refiere al coteido de proteía bruta (PB) y caseía (CA) e leche e ua muestra de 3 tambos de la cueca lechera del cetro del país. 19

Tabla 9.4: Coteido de proteía bruta (PB) y caseía (CA) e leche de 3 tambos de la cueca lechera de la regió cetral Argetia. PB CA PB CA.74 1.87.95.04 3.19.6 3.08.16.96.07 3.14.16.91.09 3.. 3.3.8 3.14. 3.04.04 3.15.4 3.08.18 3.. 3.3.3.95.07 3.11.17 3.19.5 3.11.15 3.1.3 3.1.16.99.16 3.5.33 El coeficiete de correlació lieal muestral etre PB y CA es: r = 0.937. Es esta alta correlació estadísticamete sigificativa? Para cotestar a esta preguta se debe realizar ua prueba de hipótesis: Las hipótesis e este caso so: H 0 : = 0 vs H 1 : 0. Fijado =0.05 y utilizado el estadístico T = r 1-r -, que se distribuye bajo H 0 como ua T de Studet co - grados de libertad, se determia la regió de aceptació como el itervalo delimitado por los cuatiles 0.05 y 0.975 de ua t (-) como se muestra e la siguiete figura. t 1, 0.05 = -.079 t =.079 1,0.975 0

Calculado el estadístico se tiee T = 0.937 1 0.937 = 11.85, que está fuera de la 3 regió de aceptació y por lo tato se rechaza H 0. Se cocluye luego que, co u ivel de sigificació del 5%, se rechaza la hipótesis de correlació ula. E cosecuecia se puede decir que hay ua correlació lieal estadísticamete sigificativa etre los porcetajes de proteía bruta y caseía e la leche. Ejercicios Ejercicio 9.1 Los siguietes datos correspode a los porcetajes de mortalidad obteidos a dosis crecietes de u isecticida. Se desea estudiar si existe ua compoete lieal etre la mortalidad y la dosis, expresada como el logaritmo de las cocetracioes utilizadas. El experimeto cosistió e someter a grupos de 1000 isectos a cada ua de las dosis esayadas. Los resultados fuero los siguietes: L(dosis) Mortalidad (%) 0 5 1 7 5 10 10 16 15 17 0 5 5 6 30 30 a) Costruir u diagrama de dispersió Mortalidad vs. L(dosis). b) De acuerdo al gráfico obteido, es razoable propoer u ajuste lieal? c) Escribir el modelo lieal que, se supoe, relacioa la mortalidad co la dosis. d) Estimar los parámetros del modelo. e) Costruir el cuadro de aálisis de la variaza y obteer coclusioes. 1

Ejercicio 9. Cosidérese uevamete u esayo para evaluar el efecto comparativo de dos isecticidas (A y B) sobre la mortalidad de isectos. Co los resultados que se preseta a cotiuació: Mortalidad (%) L(dosis) Isecticida A Isecticida B 0 5 6 1 7 5 5 10 8 10 16 8 15 19 13 0 7 17 5 8 30 34 3 a) Verificar si para los isecticidas A y B es razoable u modelo lieal de la forma Y= + x + para modelar la mortalidad e relació a la dosis. b) Estimar los parámetros de ambos modelos. c) Costruir los cuadros de aálisis de la variaza. d) Comparar las pedietes y ordeadas al orige de ambos isecticidas. e) Si el esayo ha sido bie plaificado, qué se espera de la diferecia de las ordeadas al orige? f) Qué se recomieda teiedo e cueta las pedietes? Ejercicio 9.3 Para estudiar el efecto de la temperatura sobre el vigor durate la germiació, se dispusiero semillas de alfalfa e germiadores a distitas temperaturas. A los 6 días se midió la logitud de las plátulas, obteiédose los siguietes datos:

T ( o C) Logitud de Platas (mm) 10 13 18 15 19 11 17 15 0 4 15 17 0 7 31 1 6 5 4 5 8 3 a) Qué diferecia hay e los datos de este ejercicio co respecto a los ateriores? b) Costruir el diagrama de dispersió etre logitud de plátula y temperatura y verificar si existe ua tedecia lieal. c) Realizar u aálisis de regresió lieal trabajado co = 0.05. d) Qué temperatura permite obteer mayor vigor? Ejercicio 9.4 Si los redimietos del ajo depede liealmete, e u cierto rago, del porcetaje de materia orgáica (MO) del suelo co pediete 4000kg/ha/MO(%), cuál es la diferecia promedio de redimieto etre campos que posee ua diferecia e el coteido de materia orgáica del suelo del 1.3%? (Se supoe que estos campos tiee coteidos de materia orgáica e el rago de validez del modelo y que el modelo es válido e ambos campos). Ejercicio 9.5 E u experimeto para evaluar la efectividad de u isecticida sobre la sobrevida de dos especies de isectos (A y B) se obtiee que, e ambos casos, es posible ajustar u modelo lieal para la sobrevida (Y) versus la cocetració (e ppm) del isecticida utilizado (X), siedo los modelos ajustados los siguietes: Especie A: Y = 80-15 X; Especie B: Y = 60-15 X. De acuerdo a estos resultados: a) Es el isecticida igualmete efectivo e ambas especies? b) Qué iterpretació se puede hacer de cada ua de estas ecuacioes? c) Cómo se modifica la sobrevida por cada icremeto uitario e la cocetració del isecticida agregado? d) Si se quisiera que ambas especies tega ua sobrevida de a lo sumo 0, cuátas pm. se debería agregar del isecticida? 3

Ejercicio 9.6 E u esayo de resistecia a la sequía, dos especies de legumiosas (A y B) fuero comparadas. El experimeto cosistió e registrar el peso seco total de 10 platas al cabo de 30 días desde la siembra. Las codicioes comparadas fuero las siguietes: medio de cultivo estádar (MCE), MCE+10 g/l de ClNa, MCE+0 g/l de ClNa, MCE+30 g/l de ClNa, MCE+40 g/l de ClNa. Los siguietes tres gráficos muestra tres resultados posibles para esta experiecia. Los gráficos represeta las rectas que modela la esperaza del peso seco e relació al agregado de ClNa e cada caso. peso seco Caso I peso seco Caso II A A B B 0 10 0 30 40 ClNa agregado al MCE peso seco A Caso III 0 10 0 30 40 ClNa agregado al MCE B 0 10 0 30 40 ClNa agregado al MCE a) Qué coclusió se obtedría, e cada ua de estas situacioes acerca de la resistecia a la sequía de ambas especies, asumiedo que si la especie soporta mayor coteido de ClNa será más resistete? b) Qué sigifica (o que iterpretació tiee) la diferecia y la similitud de las ordeadas al orige de las rectas ajustadas e los casos I, II, y III? c) Qué sigifica (o que iterpretació tiee) la diferecia y la similitud de las pedietes de las rectas ajustadas e los casos I, II, y III? 4

Ejercicio 9.7 Se desea probar la efectividad de u uevo fugicida para el cotrol de roya e trigo. Se probaro distitas dosis e gramos de pricipio activo por ha (gr.p.a./ha) e 10 parcelas de 100 platas cada ua. A los 15 días de la aplicació se realizó ua evaluació del daño, como el tamaño promedio de las machas e hoja badera. Los datos so los siguietes: Dosis(X) 100 15 00 50 75 300 35 350 375 400 Daño (Y) 50 48 39 35 30 5 0 1 10 5 a) Ajustar u modelo de regresió lieal para el daño e fució de la dosis y costruir las badas de predicció y de cofiaza. b) Predecir el daño (tamaño promedio de las machas) que se hallará si se aplica 60 gr.p.a./ha Ejercicio 9.8 E u estudio se hiciero medicioes de perímetro y peso de cabezas de ajo. Los datos que se obtuviero fuero los siguietes: Perímetro (cm) 1.39 1.39 1.71 9.8 1.3 10.1 11.81 11.41 9.4 11.49 Peso (grs.) 3.7 9.39 30.8 15.6 9.8 16.87 8.11 3.9 14.11 5.37 a) Cómo se espera que sea la asociació etre peso y perímetro? b) Calcular coeficiete correlació etre peso y perímetro c) Es sigificativo el coeficiete ecotrado? d) Elaborar coclusioes. 5