1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M."

Transcripción

1 1 Introducción MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. Los modelos de regresión sirven, en general, para tratar de expresar una variable respuesta (numérica) en función de una o más variables explicativas (también numéricas). En este tema, vamos a abordar el modelo más sencillo: el modelo de regresión simple en el que consideramos una única variable explicativa. Este modelo es especialmente interesante por motivos pedagógicos, ya que permite abordar muchos de los aspectos interesantes de la regresión con una notación y una metodología relativamente sencillas. En concreto, dedicaremos la mayor parte del tiempo al modelo de regresión lineal simple. Ejemplos Podemos estar interesados en expresar el peso de las personas en función de su estatura. Podemos estar interesados en expresar el peso de los ejemplares de cierta especie de aves en función de su envergadura. Podemos estar interesados en expresar el nivel de cierto contaminante en función de la densidad industrial. 2 Modelo. Hipótesis del modelo Disponemos de los siguientes elementos para el estudio estadístico: En primer lugar, una variable respuesta (o dependiente), Y, que será una variable numérica (o cuantitativa): es la variable que se quiere analizar. Formalmente, será una variable aleatoria de tipo continuo. En segundo lugar, una variable explicativa (o independiente), X, que será una variable numérica (o cuantitativa). Recuérdese que los factores en el modelo de diseño de experimentos eran siempre variables cualitativas. En tercer lugar, necesitamos datos. Supondremos que disponemos de n pares de datos: (x 1, y 1 )..., (x i, y i ),..., (x n, y n ) Obsérvese que aquí es absolutamente necesario que los datos vayan emparejados, es decir, que (x i, y i ) representa los valores de X e Y en el i-ésimo individuo o unidad muestral. El modelo de regresión lineal simple es de la siguiente forma: Y i = β 0 + β 1 x i + u i para i = 1,..., n Significado de los parámetros: β 0 = Valor medio de la variable respuesta cuando X = 0. Muy a menudo, el parámetro β 0 no tiene una interpretación intuitiva de interés. 1

2 β 1 = Mide la variación media que experimenta la variable respuesta cuando X aumenta una unidad. La interpretación intuitiva de β 1 siempre es muy interesante. u i = Término de error = Efecto adicional debido a otras variables que no se incluyen en el modelo por no ser consideradas relevantes. Para poder obtener y utilizar herramientas estadísticas que nos permitan tomar decisiones objetivas y razonadas, necesitamos que el modelo se ajuste a unas determinadas hipótesis. Estas hipótesis iniciales del modelo son las siguientes: Normalidad: Las observaciones Y i siguen una distribución Normal, Linealidad: Los valores medios de la variable respuesta dependen linealmente del valor de X: E[Y i ] = β 0 + β 1 x i, Homogeneidad o igualdad de varianzas (homocedasticidad): V (Y i ) = σ 2, Las observaciones son independientes. Todas estas hipótesis se pueden expresar abreviadamente de la siguiente forma: Y i N(β 0 + β 1 x i ; σ 2 ) independientes. Es importante que estas hipótesis iniciales del modelo se cumplan (aproximadamente) para que las conclusiones que obtengamos no sean una barbaridad. Llegados a este punto, se puede abordar la cuestión de si tenemos suficientes datos (suficiente información muestral) para abordar el análisis estadístico de este modelo. La regla básica para responder a esto es muy fácil de recordar (y de entender): en general, necesitaremos al menos tantos datos como parámetros queremos estimar en el modelo. En este modelo, tenemos: Número de datos= n Número de parámetros= 3 Por lo tanto, necesitamos, al menos, n = 3 pares de datos. 3 Metodología La metodología o plan de trabajo que seguiremos en el análisis estadístico de un modelo de regresión simple es el siguiente: (1) Diagnosis de las hipótesis del modelo. Se llevará a cabo mediante un análisis de los residuos. Si las hipótesis iniciales (Normalidad, Linealidad y Homocedasticidad) no se cumplen ni siquiera aproximadamente, habría que replantearse el modelo de alguna forma. En muchos casos, una transformación de los datos (por ejemplo, trabajando con sus logaritmos neperianos) soluciona el problema. Al final del capítulo, se indicarán las herramientas estadísticas que se pueden utilizar para llevar a cabo la diagnosis de las hipótesis del modelo. 2

3 (2) Estimación puntual de los parámetros del modelo. (3) Intervalos de confianza para estimar los parámetros del modelo. (4) Contraste de la regresión. El contraste de la regresión dará respuesta a la pregunta más importante que nos planteamos en un modelo de regresión lineal simple: Encontramos diferencias significativas en los valores medios de la variable respuesta para diferentes valores de X? O dicho de otra manera, la variable explicativa tiene una influencia relevante sobre la variable respuesta? (5) Evaluación del ajuste proporcionado por la recta de regresión. (6) Estimación de valores medios e individuales de la variable respuesta. Observación: Para llevar a cabo todo este plan de trabajo, necesitaremos solamente el cálculo de los siguientes estadísticos: Media muestral de X: x = 1 n ni=1 x i Media muestral de Y : ȳ = 1 n ni=1 y i Varianza muestral de X: v x = 1 n ni=1 (x i x) 2 = 1 n ( n i=1 x 2 i n x 2 ) Varianza muestral de Y : v y = 1 n ni=1 (y i ȳ) 2 = 1 n ( n i=1 y 2 i nȳ 2 ) Covarianza muestral entre X e Y : cov x,y = 1 n ni=1 (x i x)(y i ȳ) = 1 n ( n i=1 x i y i n xȳ) 4 Estimación puntual de los parámetros La metodología estadística para obtener estimadores puntuales de los parámetros es la siguiente: Se aplica el método de máxima verosimilitud, y el estimador obtenido se corrige (en caso necesario) para que sea insesgado. Con este procedimiento, se obtienen las siguientes estimaciones: ˆβ 0 = ȳ cov x,y x v x ˆβ 1 = cov x,y v x ˆσ 2 = S 2 R = 1 n 2 i (y i ŷ i ) 2 = 1 n 2 (y i ˆβ 0 ˆβ 1 x i ) 2 i Las estimaciones de β 0 y β 1 que obtenemos por máxima verosimilitud coinciden con las estimaciones que se obtienen mediante la técnica de mínimos cuadrados utilizada en Estadística Descriptiva. Por lo tanto, los coeficientes de la recta de regresión se pueden obtener tanto por máxima verosimilitud como por mínimos 3

4 cuadrados: y = ˆβ 0 + ˆβ 1 x = ȳ cov x,y v x x + cov x,y x y ȳ = cov x,y (x x) v x El estimador de σ 2, S 2 R, recibe habitualmente el nombre de varianza residual y merece algún comentario adicional. El nombre de varianza residual obedece a que es una varianza que calculamos a partir de los residuos de cada dato. El residuo de cada dato depende del modelo estadístico que estemos utilizando, pero responde siempre a la misma filosofía: Residuo = Valor observado - Estimación del valor esperado = y i ŷ i = y i ˆβ 0 ˆβ 1 x i v x 5 Intervalos de confianza Los estimadores puntuales son muy interesantes, pero son demasiado rígidos. Cuando decimos que estimamos que el parámetro β 1 vale, por ejemplo, 1,15, lo que estamos diciendo en realidad es que pensamos que vale, aproximadamente, 1,15. La forma en que los métodos estadísticos cuantifican este aproximadamente de forma automática y objetiva es a través de los intervalos de confianza. A continuación, damos los intervalos de confianza que se obtienen, aplicando el método de la cantidad pivotal, para estimar los diferentes parámetros involucrados en este modelo: IC 1 α (β 0 ) = 1 ˆβ0 ± t n 2;α/2 S R n + x2 = ( ˆβ0 ± t n 2;α/2 (error típico de ˆβ 0 ) ) IC 1 α (β 1 ) = IC 1 α (σ 2 ) = ( ˆβ 1 ± t n 2;α/2 S R 1 (n 2)S2 R χ 2 n 2;α/2 nv x ) = ( ˆβ1 ± t n 2;α/2 (error típico de nv ˆβ 1 ) ) x ; (n 2)S2 R χ 2 n 2;1 α/2 A continuación, hacemos algunos comentarios sobre el intervalo obtenido para estimar β 1, que es el parámetro más interesante: (a) Cuando aumentamos el nivel de confianza 1 α (es decir, cuando aumentamos la probabilidad de que la estimación sea buena ), t n 2;α/2 aumenta, y la amplitud del intervalo también aumenta (es decir, nuestra estimación se hace menos precisa ). (b) Cuando aumentamos el tamaño de la muestra n, la amplitud del intervalo disminuye (es decir, nuestra estimación se hace más precisa ). (c) Cuando aumentamos la varianza v x correspondiente a los datos de la variable explicativa, la amplitud del intervalo disminuye (es decir, nuestra estimación se hace más precisa ). Por este motivo, conviene diseñar el experimento de modo que los valores de X que obtenemos estén lo más separados posibles, siempre que esto sea posible. 4

5 6 Constraste de la regresión En el modelo de regresión lineal simple, la cuestión más importante a la que hay que responder es la siguiente: Disponemos de suficiente evidencia muestral para afirmar que X tiene una influencia significativa sobre Y? O dicho de otra manera, disponemos de suficiente evidencia muestral para asegurar que X es realmente una variable explicativa? Teniendo en cuenta que la posible influencia de X desaparecería si su coeficiente β 1 se anulase, esto nos lleva a elegir entre las posibilidades β 1 = 0 y β 1 0 y, por tanto, al siguiente contraste de hipótesis: H 0 : β 1 = 0 (X no influye) H 1 : β 1 0 (X sí influye) Este contraste de hipótesis suele recibir el nombre de contraste de la regresión. Elegiremos, como siempre, un nivel de significación α para tomar una decisión al final del estudio. Esta decisión la podemos tomar de dos formas: (a) Podemos utilizar el intervalo de confianza IC 1 α (β 1 ) que hemos estudiado en la sección anterior. Si el valor cero está contenido en IC 1 α (β 1 ), aceptaremos H 0, y concluiremos que no hay suficiente evidencia estadística para afirmar que X influye sobre Y. Si por el contrario, el valor cero no está contenido en IC 1 α (β 1 ), rechazaremos H 0, y concluiremos que X tiene una influencia significativa sobre Y. (b) También podemos utilizar el Análisis de la Varianza (ANOVA), que vuelve a tener una gran importancia en el modelo de regresión lineal. Se puede utilizar, como veremos a continuación, en el modelo de regresión lineal simple, pero alcanza toda su importancia en el modelo de regresión lineal múltiple. La descomposición de la variabilidad o análisis de la varianza en el caso del modelo de regresión lineal simple es de la siguiente forma: Variabilidad total de los datos = SCT= i(y i ȳ) 2 = i(y i ŷ i + ŷ i ȳ) 2 = i(ŷ i ȳ) 2 + i(y i ŷ i ) 2 = SCE + SCR En la regresión lineal, la variabilidad total se descompone siempre en dos partes, tanto en la simple como en la múltiple: SCE = i(ŷ i ȳ) 2 que es la variabilidad asociada al modelo (o explicada por el modelo). SCR = i(y i ŷ i ) 2 que es la variabilidad residual (o no explicada por el modelo). La decisión de aceptar o rechazar H 0 se va a tomar en base al estadístico que se obtiene a partir de este análisis de la varianza: F = SCE/1 SCR/(n 2) 5

6 Este estadístico tiene una distribucion F 1;n 2 (bajo H 0 ) y, por tanto, la la regla de decisión es de la siguiente forma: Rechazaremos H 0, al nivel de significación α, cuando F = SCE/1 SCR/(n 2) > F 1;n 2;α También podemos alcanzar una decisión razonando con el p-valor de los datos. La manera más sencilla de interpretar y utilizar el p-valor es entendiendo el p-valor como el apoyo que los datos dan a H 0. De este modo: Si el p-valor< α, el apoyo a H 0 es insuficiente, y rechazaremos H 0 (al nivel de significación α). Si el p-valor> α, el apoyo a H 0 es suficiente, y aceptaremos H 0 (al nivel de significación α). Por supuesto, obtendremos la misma decisión, tanto si trabajamos con el estadístico F como si trabajamos con el p-valor. Es tradicional, y así lo podemos ver en libros y salidas de ordenador, organizar los cálculos correspondientes a un análisis de la varianza en una tabla ANOVA, que suele ser del siguiente tipo: Sumas de cuadrados G.l. Med. cuad. Estadístico SCE = i(ŷ i ȳ) 2 SCE 1 F = SCE/1 1 SCR/(n 2) SCR = i(y i ŷ i ) 2 SCR n 2 n 2 SCT = i(y i ȳ) 2 n 1 Finalmente, hay que señalar que la decisión que alcancemos sobre el contraste de hipótesis H 0 : β 1 = 0 H 1 : β 1 0 siempre será la misma (una vez fijado el nivel de significación), tanto si trabajamos con el intervalo de confianza IC 1 α (β 1 ), como si trabajamos con el análisis de la varianza, ya que es sencillo probar que los contrastes obtenidos son equivalentes. Una vez estudiado todo esto, es importante hacer un par de comentarios: (a) En la regresión lineal múltiple, el intervalo de confianza IC 1 α (β 1 ) servirá para una cosa, y la tabla ANOVA para otra. Por eso, se explican las dos técnicas estadísticas. (b) En la regresión lineal múltiple es cuando será especialmente importante determinar si una variable explicativa tiene una influencia significativa o no sobre la variable respuesta. El motivo es sencillo: en principio, introducimos en el modelo varias presuntas variables explicativas y, posteriormente, los datos se encargarán de decirnos cuáles son realmente relevantes. 6

7 7 Evaluación del ajuste A partir de los datos (x 1, y 1 )..., (x i, y i ),..., (x n, y n ), podemos obtener siempre la recta de regresión: y = ˆβ 0 + ˆβ 1 x Esta recta, en algunos casos se ajustará muy bien a los pares de datos que tenemos, y en otros casos se ajustará peor. Cuando el ajuste sea bueno, tendremos una cierta seguridad de que esa recta representa razonablemente bien la relación entre X e Y. Por supuesto, siempre se puede y se debe echar un vistazo al diagrama de dispersión de Y sobre X, donde añadiremos la recta de regresión estimada, y esta inspección visual nos dará mucha información sobre la situación. Pero también es útil disponer de alguna medida numérica que nos evalúe, de manera sencilla, si el ajuste es bueno o no. Para hacer ésto, disponemos de dos posibles herramientas: Coeficiente de correlación lineal.- Este coeficiente procede de la Estadística Descriptiva y está basado en el error cuadrático medio que se comete al sustituir la nube de puntos por la recta de regresión: n E.C.M. = 1 n i=1 = 1 ( n n ( y i ȳ + cov x,y (y i ȳ) 2 + i=1 = v y (cov x,y) 2 v x x cov ) 2 x,y x i v x v x ( ) covx,y 2 n (x i x) 2 2 cov ) x,y n (x i x)(y i ȳ) v x i=1 v x i=1 [ 1 (cov x,y) 2 ] v x v y = v y El cociente que aparece en la última expresión motiva la definición del coeficiente de correlación lineal entre X e Y : Coeficiente de correlación lineal = r = cov x,y vx v y Por lo tanto, el error cuadrático medio cometido con la recta de regresión puede escribirse también de la siguiente manera: E.C.M. = v y (1 r 2 ) El coeficiente de correlacion muestral toma siempre un valor entre -1 y 1 (ya que el E.C.M., al ser una suma de cuadrados, no puede ser negativo). Es fácil dar algunas pautas para interpretar el valor de r: Si r está próximo a +1, el E.C.M. es pequeño, lo cual significa que el ajuste es bueno. Además, al ser la cov x,y positiva, la pendiente de la recta de regresión es positiva, y se dice que existe una asociación positiva entre X e Y. Si r está próximo a -1, el E.C.M. es pequeño, lo cual significa que el ajuste es bueno. Además, al ser la cov x,y negativa, la pendiente de la recta de regresión es negativa, y se dice que existe una asociación negativa entre X e Y. Si r toma valores próximos a cero, el E.C.M. es mayor, indicando un mal ajuste. 7

8 Coeficiente de determinación.- El concepto de coeficiente de determinación procede del Analisis de la Varianza y tiene una definición y una interpretación muy sencillas: Coeficiente de determinación = R 2 = SCE SCT El coeficiente de determinación toma siempre un valor entre 0 y 1, y su significado es obvio: R 2 mide la proporción de variabilidad explicada por el modelo. Las pautas para interpretar el valor de R 2 también son obvias: Cuando R 2 toma un valor próximo a cero, la proporción de variabilidad explicada por el modelo es pequeña, y el ajuste es malo. Cuando R 2 toma un valor próximo a uno, la proporción de variabilidad explicada por el modelo es grande, y el ajuste es bueno. Hay que insistir en la idea de que, tanto el coeficiente de correlación lineal como el coeficiente de determinación, siempre hay que considerarlos con cuidado, ya que están resumiendo toda una nube de puntos en un solo número. Es conveniente hacer un par de observaciones sobre estos coeficientes: En la regresión lineal simple, podemos utilizar indistintamente el coeficiente de correlación lineal o el coeficiente de determinación, ya que existe una relación muy estrecha entre ambos: R 2 = r 2 En la regresión lineal múltiple, sin embargo, el único coeficiente que tiene sentido para evaluar el ajuste del modelo es el coeficiente de determinación. 8 Estimación de valores medios e individuales de la variable respuesta En esta sección, abordamos dos problemas muy relacionados pero no exactamente iguales: Valores medios de la variable respuesta.- En muchas situaciones, es muy interesante saber estimar (o predecir o pronosticar) el valor medio que tendrá la variable respuesta Y para todos aquellos casos o individuos en la población para los cuales X = x 0. Si nos conformamos con una estimación puntual, la respuesta es muy sencilla, ya que basta con utilizar la recta de regresión: ŷ 0 = ˆβ 0 + ˆβ 1 x 0 Por el contrario, si deseamos hacer una estimación con un nivel de confianza 1 α, recurriremos a un intervalo de confianza que, en este caso, es de la forma: 8

9 1 IC 1 α (Valor medio de Y ) = ŷ 0 ± t n 2;α/2 S R n + (x 0 x) 2 nv x Sobre este intervalo se pueden hacer algunas observaciones interesantes: (a) Cuando aumentamos el nivel de confianza 1 α (es decir, cuando aumentamos la probabilidad de que la estimación sea buena ), t n 2;α/2 aumenta, y la amplitud del intervalo también aumenta (es decir, nuestra estimación se hace menos precisa ). (b) Cuando aumentamos el tamaño de la muestra n, la amplitud del intervalo disminuye (es decir, nuestra estimación se hace más precisa ). (c) Cuando aumentamos la varianza v x correspondiente a los datos de la variable explicativa, la amplitud del intervalo disminuye (es decir, nuestra estimación se hace más precisa ). Por este motivo, conviene diseñar el experimento de modo que los valores de X que obtenemos estén lo más separados posibles, siempre que esto sea posible. (d) Cuando x 0 se aleja de x, la amplitud del intervalo aumenta (es decir, nuestra estimación se hace menos precisa ). Por lo tanto, las estimaciones del valor medio de Y son más precisas para valores cercanos a la media muestral de X. Valores individuales de la variable respuesta.- En muchas situaciones, es muy interesante saber estimar (o predecir o pronosticar) el valor individual que tendrá la variable respuesta Y para un nuevo caso o individuo para el cual X = x 0. Si nos conformamos con una estimación puntual, la respuesta es muy sencilla, ya que basta con utilizar la recta de regresión: ŷ 0 = ˆβ 0 + ˆβ 1 x 0 Por el contrario, si deseamos hacer una estimación con un nivel de confianza 1 α, recurriremos a un intervalo de confianza que, en este caso, es de la forma: IC 1 α (Valor individual de Y ) = ŷ 0 ± t n 2;α/2 S R n + (x 0 x) 2 nv x Sobre este intervalo se pueden hacer algunas observaciones interesantes: (a) Cuando aumentamos el nivel de confianza 1 α (es decir, cuando aumentamos la probabilidad de que la estimación sea buena ), t n 2;α/2 aumenta, y la amplitud del intervalo también aumenta (es decir, nuestra estimación se hace menos precisa ). (b) Cuando aumentamos el tamaño de la muestra n, la amplitud del intervalo disminuye (es decir, nuestra estimación se hace más precisa ). 9

10 (c) Cuando aumentamos la varianza v x correspondiente a los datos de la variable explicativa, la amplitud del intervalo disminuye (es decir, nuestra estimación se hace más precisa ). Por este motivo, conviene diseñar el experimento de modo que los valores de X que obtenemos estén lo más separados posibles, siempre que esto sea posible. (d) Cuando x 0 se aleja de x, la amplitud del intervalo aumenta (es decir, nuestra estimación se hace menos precisa ). Por lo tanto, las estimaciones del valor medio de Y son más precisas para valores cercanos a la media muestral de X. (e) El intervalo para estimar valores individuales siempre es mayor que el intervalo para estimar valores medios. La explicación intuitiva es que resulta más difícil acertar con las individualidades y, por eso, el intervalo es menos preciso. 9 Diagnosis de las hipótesis del modelo Como se indicó en la Sección 3 (Metodología), es conveniente hacer una diagnosis previa de las hipótesis del modelo: Normalidad, Linealidad y Homogeneidad de Varianzas. Este diagnóstico se puede llevar a cabo nuevamente utilizando unos análisis gráficos sencillos de los residuos. Para llevar a cabo este análisis gráfico, necesitamos dos cosas: Guardar los residuos de cada dato, que en este modelo son de la forma: Residuo = y i ŷ i = y i ˆβ 0 ˆβ 1 x i Guardar los valores pronosticados o estimados para cada dato, que en este modelo son de la forma: Valor pronosticado = ŷ i = ˆβ 0 + ˆβ 1 x i Con los residuos y los valores pronosticados podemos hacer un análisis visual de los siguientes gráficos: (a) Histograma de los residuos. La hipótesis de Normalidad de los datos será aceptable cuando este histograma muestre un razonable parecido con la curva Normal. (b) Gráfico de probabilidades normales de los residuos (probability plot). La hipótesis de Normalidad de los datos será aceptable cuando los puntos del gráfico estén razonablemente cerca de la diagonal del cuadrado. (c) Gráfico de dispersión de los residuos sobre los valores pronosticados (o sobre los valores de la variable explicativa). La hipótesis de Homocedasticidad (o igualdad de varianzas) de los datos será aceptable cuando la anchura vertical del gráfico de dispersión se mantenga razonablemente constante. La hipótesis de Linealidad de los datos será aceptable cuando la línea central del gráfico de dispersión sea razonablemente recta. 10

11 La gran ventaja de estos análisis gráficos es su sencillez. Sus grandes inconvenientes son que con pocos datos (como suele ser frecuente) no nos dicen prácticamente nada, y aunque dispongamos de muchos datos, las conclusiones son inevitablemente subjetivas (salvo situaciones muy claras que no son demasiado frecuentes con los datos reales). 10 Extensión a otros modelos Una de las grandes utilidades del modelo de regresión lineal es que es fácilmente exportable a varios modelos que no son lineales, pero que se pueden linealizar mediante sencillos cambios de variable. Vemos a continuación dos modelos muy interesantes que pueden ser linealizados, aunque no son los únicos. Modelo de regresión logarítimica.- En algunas situaciones, es muy adecuado pensar en un modelo de regresión logarítmica, Y = a + b ln X El modelo logarítmico sirve, por ejemplo, para describir empíricamente la relación entre el tamaño, Y, alcanzado por una planta y su concentración, X, de hormona del crecimiento. El modelo de regresión logarítmico se puede reducir fácilmente a un modelo de regresión lineal. Los pasos que tenemos que dar son los siguientes: Y = a+b ln X Definimos la nueva variable Z = ln X: Y = a+bz Obtenemos la recta de regresión de Y sobre Z, y deshacemos el cambio. Podemos confirmar de dos formas la validez del modelo de regresión logarítmica: (a) Desde un punto de vista gráfico, el diagrama de dispersión de Y sobre Z = ln X debería tener un aspecto razonablemente lineal. (b) Desde un punto de vista numérico, el coeficiente de correlación lineal entre Y y Z = ln X debería ser razonablemente próximo a +1. Modelo de regresión exponencial.- En otras situaciones, es muy adecuado pensar en un modelo de regresión exponencial, Y = ae bx El modelo exponencial sirve, por ejemplo, para describir empíricamente la evolución del tamaño de una población que crece (o decrece) un porcentaje fijo cada unidad de tiempo. El modelo de regresión exponencial se puede reducir fácilmente a un modelo de regresión lineal. Los pasos que tenemos que dar son los siguientes: Y = ae bx Tomamos logaritmos neperianos: ln Y = ln a + bx = a + bx Definimos la nueva variable Z = ln Y : Z = a + bx Obtenemos la recta de regresión de Z sobre X, deshacemos el cambio, y tomamos exponenciales. 11

12 Podemos confirmar de dos formas la validez del modelo de regresión exponencial: a) Desde un punto de vista gráfico, el diagrama de dispersión de Z = ln Y sobre X debería tener un aspecto razonablemente lineal. b) Desde un punto de vista numérico, el coeficiente de correlación lineal entre Z = ln Y y X debería ser razonablemente próximo a +1 ó a

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las

Más detalles

2 Modelo de Diseño de Experimentos con dos factores sin interacción. Hipótesis del modelo

2 Modelo de Diseño de Experimentos con dos factores sin interacción. Hipótesis del modelo MODELO DE DISEÑO DE EXPERIMENTOS (VARIOS FACTORES) Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Los modelos de diseño de experimentos sirven, en general, para tratar de explicar

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Tema 4. Regresión lineal simple

Tema 4. Regresión lineal simple Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

TEMA 4 Modelo de regresión múltiple

TEMA 4 Modelo de regresión múltiple TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 2 Diseño de experimentos: modelos con varios factores TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial

Más detalles

Tema 8: Regresión y Correlación

Tema 8: Regresión y Correlación Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice

Más detalles

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago

Más detalles

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)

Más detalles

T2. El modelo lineal simple

T2. El modelo lineal simple T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de

Más detalles

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

peso edad grasas Regresión lineal simple Los datos

peso edad grasas Regresión lineal simple Los datos Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009 Estadística; 3º CC. AA. Examen final, 3 de enero de 9 Apellidos Nombre: Grupo: DNI. (5 ptos.) En un estudio sobre las variables que influyen en el peso al nacer se han obtenido utilizando SPSS los resultados

Más detalles

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min. Estadística II Examen final junio - 17/06/16 Curso 201/16 Soluciones Duración del examen: 2 h. y 4 min. 1. (3, puntos) La publicidad de un fondo de inversión afirma que la rentabilidad media anual del

Más detalles

Julio Deride Silva. 4 de junio de 2010

Julio Deride Silva. 4 de junio de 2010 Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal

Más detalles

Definición de Correlación

Definición de Correlación Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del

Más detalles

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados

Más detalles

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Tema 1: Estadística descriptiva Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Introducción Objetivo: estudiar una característica o variable en una población. Ejemplos:

Más detalles

MATEMATICAS Primer curso de Ciencias Ambientales / Curso Soluciónes HOJA 4

MATEMATICAS Primer curso de Ciencias Ambientales / Curso Soluciónes HOJA 4 MATEMATICAS Primer curso de Ciencias Ambientales / Curso 006-00 Soluciónes HOJA 4 Problema 3: Los siguientes datos corresponden a la evolución del peso celular (en mgr./ml.) cantidad de nitrato en un cultivo

Más detalles

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes

Más detalles

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

Los estimadores mínimo cuadráticos bajo los supuestos clásicos Los estimadores mínimo cuadráticos bajo los supuestos clásicos Propiedades estadísticas e inferencia Mariana Marchionni marchionni.mariana@gmail.com Mariana Marchionni MCO bajo los supuestos clásicos 1

Más detalles

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que

Más detalles

FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M.

FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M. FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Una de las primeras necesidades que surgen en las Ciencias Experimentales es la de poder expresar, aproximadamente,

Más detalles

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado. NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido

Más detalles

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.

Más detalles

Tercera práctica de REGRESIÓN.

Tercera práctica de REGRESIÓN. Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

Prácticas Tema 2: El modelo lineal simple

Prácticas Tema 2: El modelo lineal simple Prácticas Tema 2: El modelo lineal simple Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 2.1- Se han analizado sobre una muestra de 10 familias las variables

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También

Más detalles

Estadística Diplomado

Estadística Diplomado Diplomado HRB UNAM 1 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 Estimación por Intervalos Cantidades Pivotales

Más detalles

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN 4.5.- En cuál de los siguientes casos se podría utilizar la varianza residual en lugar del coeficiente de determinación para medir la calidad del ajuste? Con el mismo conjunto de datos y dos ajustes distintos.

Más detalles

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 5 En una determinada investigación se estudió el rendimiento en matemáticas en función del estilo de aprendizaje de una serie de estudiantes de educación

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

4.1 Análisis bivariado de asociaciones

4.1 Análisis bivariado de asociaciones 4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento. UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre

Más detalles

Estadística Descriptiva II: Relación entre variables

Estadística Descriptiva II: Relación entre variables Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud MUI Ciencias de la Salud, UEx 25 de octubre de 2010 De qué trata? Descripción conjunto concreto de

Más detalles

CORRELACIÓN LINEAL SIMPLE

CORRELACIÓN LINEAL SIMPLE CORRELACIÓN LINEAL SIMPLE ANÁLISIS DE CORRELACIÓN Cuando se trabaja con dos variables, pueden surgir diferentes preguntas como: Existe relación entre lo que una empresa gasta en publicidad y el importe

Más detalles

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.

Más detalles

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal Estadística Inferencial Sesión No. 9 Regresión y correlación lineal Contextualización En la administración, las decisiones suelen basarse en la relación entre dos o más variables. En esta sesión se estudia

Más detalles

Tema 2: Regresión. Grado en Fisioterapia, 2010/11. Jesús Montanero Fernández. Cátedra de Bioestadística Universidad de Extremadura

Tema 2: Regresión. Grado en Fisioterapia, 2010/11. Jesús Montanero Fernández. Cátedra de Bioestadística Universidad de Extremadura Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 8 de noviembre de 2010 Índice 1 Regresión lineal simple 2 3 Índice 1 Regresión lineal simple 2 3 Índice 1 Regresión lineal

Más detalles

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16 Regresión Lineal Rodrigo A. Alfaro 2009 Rodrigo A. Alfaro (BCCh) Regresión Lineal 2009 1 / 16 Contenidos 1 Regresiones Lineales Regresión Clásica Paquetes estadísticos 2 Estadísticos de Ajuste Global 3

Más detalles

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE REGREIÓN LINEAL IMPLE ANÁLII DE REGREIÓN Al continuar con el estudio de la relación entre dos variables X y Y, ahora es pertinente considerar el caso en que es necesario pronosticar la variable dependiente

Más detalles

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos: 15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo

Más detalles

Lección 3. Análisis conjunto de dos variables

Lección 3. Análisis conjunto de dos variables Lección 3. Análisis conjunto de dos variables Estadística Descriptiva Parcialmente financiado a través del PIE13-04 (UMA) GARCÍA TEMA 3. ANÁLII CONJUNTO DE DO VARIABLE 3.1 COVARIANZA COEFICIENTE DE CORRELACIÓN

Más detalles

Ajuste por mínimos cuadrados

Ajuste por mínimos cuadrados Mathieu Departamento de Matemática Aplicada y Estadística Universidad Politécnica de Cartagena Cartagena, Enero 2010 Guión 1 Planteamiento 2 Criterio de mínimos cuadrados 3 Casos concretos: regresión lineal

Más detalles

Grado en Finanzas y Contabilidad

Grado en Finanzas y Contabilidad Econometría Grado en Finanzas y Contabilidad Apuntes basados en el libro Introduction to Econometrics: A modern Approach de Wooldridge 3.1 Colinealidad Exacta 3.2 Los efectos de la multicolinealidad Del

Más detalles

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA) ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA) El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de

Más detalles

Análisis de la Varianza (ANOVA) y Correlación

Análisis de la Varianza (ANOVA) y Correlación Universidad de Chile Rodrigo Assar FCFM MA34B Andrés Iturriaga DIM Víctor Riquelme Análisis de la Varianza (ANOVA) y Correlación Resumen El test ANOVA analiza la relación entre una variable numérica y

Más detalles

Práctica 3: Regresión simple con R

Práctica 3: Regresión simple con R Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

Intervalos de confianza con STATGRAPHICS

Intervalos de confianza con STATGRAPHICS Intervalos de confianza con STATGRAPHICS Ficheros empleados: TiempoaccesoWeb.sf3 ; TiempoBucle.sf3; 1. Ejemplo 1: Tiempo de acceso a una página Web Se desean construir intervalos de confianza para la media

Más detalles

Modelos lineales. Tema 1: Modelo de regresión lineal simple. 6 de febrero de Carmen Armero

Modelos lineales. Tema 1: Modelo de regresión lineal simple. 6 de febrero de Carmen Armero Carmen Armero 6 de febrero de 2012 Introducción Un poco de historia Definición y propiedades Mínimos cuadrados Máxima verosimilitud Ejemplo: Masa muscular y edad 1.I La edad es uno de los factores determinantes

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

1 El Análisis de Varianza

1 El Análisis de Varianza 1 El Análisis de Varianza Objetivo: Explicar (controlar las variaciones de una v.a. Y continua (numérica, mediante factores (variables cualitativas que definen categorías que controlamos (no aleatorios.

Más detalles

Qué es una regresión lineal?

Qué es una regresión lineal? Apéndice B Qué es una regresión lineal? José Miguel Benavente I. Introducción En varios capítulos de este libro se ocupan regresiones lineales y se afirma que el coeficiente de regresión indica cuánto

Más detalles

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas. Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas. ---Intervalo de probabilidad (IP) Permite predecir el comportamiento de las muestras. Si de una población se sacan

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 3: Estadística descriptiva bivariante y regresión lineal. Tema 3: Estadística bivariante 1 Relaciones entre variables y regresión El término regresión fue introducido por Galton

Más detalles

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar

Más detalles

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE PROBABILIDAD Y ESTADÍSTICA Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE 4.1 Regresión lineal simple y curvilínea 4.1.1 Variable dependiente e independiente 4.1.2 Ecuación de regresión 4.1.2.1 Aplicación

Más detalles

EXTENSIONES DEL MODELO DE REGRESIÓN

EXTENSIONES DEL MODELO DE REGRESIÓN EXTENSIONES DEL MODELO DE REGRESIÓN 1. Regresión exponencial 2. Regresión polinómica 3. Regresión con variables cualitativas M. Carmen Carollo, Beatriz Pateiro Página 1 1. Regresión exponencial Al tratar

Más detalles

Curso de nivelación Estadística y Matemática

Curso de nivelación Estadística y Matemática Modelo de Curso de nivelación Estadística y Matemática Pruebas de hipótesis, y Modelos ARIMA Programa Técnico en Riesgo, 2017 Agenda Modelo de 1 2 Asociación Medidas de asociación para variables intervalo

Más detalles

Resumen teórico de los principales conceptos estadísticos

Resumen teórico de los principales conceptos estadísticos Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Muestreo aleatorio simple Resumen teórico Resumen teórico de los principales conceptos estadísticos Muestreo aleatorio

Más detalles

El Movimiento Browniano en la modelización del par EUR/USD

El Movimiento Browniano en la modelización del par EUR/USD MÁSTER UNIVERSITARIO EN DIRECCIÓN FINANCIERA Y FISCAL TESINA FIN DE MÁSTER El Movimiento Browniano en la modelización del par EUR/USD Autor: José Vicente González Cervera Directores: Dr. Juan Carlos Cortés

Más detalles

Ejemplo 7.1. Heterocedasticidad. Pilar González y Susan Orbe. Dpto. Economía Aplicada III (Econometría y Estadística)

Ejemplo 7.1. Heterocedasticidad. Pilar González y Susan Orbe. Dpto. Economía Aplicada III (Econometría y Estadística) Ejemplo 7.1 Heterocedasticidad Pilar González y Susan Orbe Dpto. Economía Aplicada III (Econometría y Estadística) Pilar González y Susan Orbe OCW 2013 Ejemplo 7.1. Heterocedásticidad 1 / 22 Enunciado.

Más detalles

BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN

BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN Aproximación intutitiva a la inferencia estadística La Estadística es la ciencia que se ocupa de la ordenación y análisis de datos procedentes

Más detalles

Un modelo para representar una relación aproximadamente

Un modelo para representar una relación aproximadamente Regresión Se han visto algunos ejemplos donde parece que haya una relación aproximadamente lineal entre dos variables. Supongamos que queremos estimar la relación entre las dos variables. Cómo ajustamos

Más detalles

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada Estadística Descriptiva Bivariada En el aspecto conceptual, este estudio puede ser generalizado fácilmente para el caso de la información conjunta de L variables aunque las notaciones pueden resultar complicadas

Más detalles

Repaso Estadística Descriptiva

Repaso Estadística Descriptiva Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable

Más detalles

Tema VII. La predicción de variables

Tema VII. La predicción de variables 7.1. La ecuación lineal de regresión: - Variable dependiente e independiente (fijas ó aleatorias):. Fijas (modelo I de regresión). Aleatorias (modelo II; más complejo) - Objetivo predictivo (básico en

Más detalles

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no

Más detalles

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL) TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL) NOTA IMPORTANTE - Estas notas son complementarias a las notas de clase del primer semestre correspondientes a los temas de Regresión

Más detalles

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid 6. Inferencia con muestras grandes 1 Tema 6: Inferencia con muestras grandes 1. Intervalos de confianza para μ con muestras grandes 2. Determinación del tamaño muestral 3. Introducción al contraste de

Más detalles

Econometría Aplicada

Econometría Aplicada Econometría Aplicada Inferencia estadística, bondad de ajuste y predicción Víctor Medina Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza La pregunta que

Más detalles

Introducción a la Estadística Aplicada en la Química

Introducción a la Estadística Aplicada en la Química Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00

Más detalles

El Modelo de Regresión Lineal General Estimación

El Modelo de Regresión Lineal General Estimación Tema 5 El Modelo de Regresión Lineal General Estimación Pilar González y Susan Orbe Dpto Economía Aplicada III (Econometría y Estadística) Pilar González y Susan Orbe OCW 2013 Tema 5 MRLG: Estimación 1

Más detalles

El Modelo de Regresión Lineal

El Modelo de Regresión Lineal ECONOMETRÍA I El Modelo de Regresión Lineal Dante A. Urbina CONTENIDOS 1. Regresión Lineal Simple 2. Regresión Lineal Múltiple 3. Multicolinealidad 4. Heterocedasticidad 5. Autocorrelación 6. Variables

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.

Más detalles

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis

Más detalles

Modelo de Análisis de la Covarianza. Introducción al modelo de Medidas Repetidas

Modelo de Análisis de la Covarianza. Introducción al modelo de Medidas Repetidas Modelo de Análisis de la Covariza. Introducción al modelo de Medidas Repetidas Modelo de Análisis de la Covariza Introducción El diseño por bloques se considera para eliminar el efecto de los factores

Más detalles

ANÁLISIS DE REGRESIÓN N LINEAL

ANÁLISIS DE REGRESIÓN N LINEAL ANÁLISIS DE REGRESIÓN N LINEAL Varias partes tomadas de Julio H. Cole "Nociones de Regresión Lineal" en Enciclopedia Multimedia Virtual de Economía EMVI. http://eumed.net/cursecon/medir/index.htm Análisis

Más detalles

Regresión con variables independientes cualitativas

Regresión con variables independientes cualitativas Regresión con variables independientes cualitativas.- Introducción...2 2.- Regresión con variable cualitativa dicotómica...2 3.- Regresión con variable cualitativa de varias categorías...6 2.- Introducción.

Más detalles

Estadística para la Economía y la Gestión IN 3401

Estadística para la Economía y la Gestión IN 3401 Estadística para la Economía y la Gestión IN 3401 3 de junio de 2010 1 Modelo de Regresión con 2 Variables Método de Mínimos Cuadrados Ordinarios Supuestos detrás del método MCO Errores estándar de los

Más detalles

Tema 3. Modelo de regresión simple. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 3: Regresión simple 1

Tema 3. Modelo de regresión simple. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 3: Regresión simple 1 Tema 3. Modelo de regresión simple Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 3: Regresión simple 1 Introducción Objetivo del modelo de regresión simple: Explicar el comportamiento de

Más detalles

Estimación del modelo lineal con dos variables

Estimación del modelo lineal con dos variables Estimación del modelo lineal con dos variables el método de mínimos cuadrados ordinarios (MCO) Mariana Marchionni marchionni.mariana@gmail.com Mariana Marchionni Estimación del modelo lineal por MCO 1

Más detalles

TEMA 3 REGRESIÓN Y CORRELACIÓN

TEMA 3 REGRESIÓN Y CORRELACIÓN TEMA 3 REGRESIÓN Y CORRELACIÓN Regresión mínimo-cuadrática bidimensional Planteamiento del problema Dadas dos variables aleatorias X e Y definidas sobre un mismo espacio de probabilidad (asociadas a un

Más detalles

TEMA 3: Contrastes de Hipótesis en el MRL

TEMA 3: Contrastes de Hipótesis en el MRL TEMA 3: Contrastes de Hipótesis en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 3: Contrastes de Hipótesis Curso 2011-12

Más detalles

Regresión ponderada y falta de ajuste

Regresión ponderada y falta de ajuste Capítulo 4 Regresión ponderada y falta de ajuste 4.1. Introducción En este capítulo se presentan la regresión ponderada y la prueba de falta de ajuste como un conjunto adicional de herramientas usadas

Más detalles