REGRESIÓN MULTIPLE.
|
|
|
- Mariano Gutiérrez Montero
- hace 7 años
- Vistas:
Transcripción
1 1 REGRESIÓN MULTIPLE Planteamiento y análisis del modelo de regresión lineal múltiple. Requisitos del modelo. Multicolinealidad. Incorporación al modelo de una variable dicotómica. Extensión al modelo de regresión logística. Utilización del SPSS.
2 2 Las técnicas de Regresión lineal multiple parten de k+1 variables cuantitativas: La variable respuesta o dependiente (Y) Las variables explicativas (X 1,, X k ) Y tratan de explicar la Y mediante una función lineal de las x 1,, x k representada por el hiperplano: y = b 0 + b 1 x b k x k Debemos extender a k variables las ideas y técnicas de la regresión lineal simple
3 3 Modelo para la Regresión lineal múltiple Y x1,,xk = b 0 + b 1 x b k x k + U ( x1,, xk) Donde: Y x1, xk es la variable aleatoria que representa los valores que obtendremos cuando las Xs tomen los valores x 1,,x k b 0 + b 1 x b k x k es el valor esperado (medio) de la Y cuando las Xs tomen los valores x 1,,x k U representa la variabilidad aleatoria respecto al hiperplano y = b 0 + b 1 x b k x k Supondremos que U sigue una distribución N(0, s) igual sea cual sea el valor de las x s.
4 4 Datos y estimación de los parámetros Realizaremos una muestra aleatoria con n valores de las k+1 variables: n > k+1 Geométricamente, la nube de puntos ahora está en un espacio de dimensión k+1 Difícil de visualizar para k>2! Los programas informáticos proporcionan las estimaciones de los parámetros b 0, b 1,, b k y s
5 5 Cuatro hipótesis comunes con la regresión lineal simple Normalidad Homocedasticidad Linealidad Independencia Como siempre, las primeras las estudiaremos mediante los residuos:
6 6 Y un requisito adicional Ninguna de las X i es combinación lineal de las otras (ausencia de multicolinealidad) Si alguna de las X i es combinación lineal exacta de algunas de las otras X j, el modelo puede simplificarse con menos variables explicativas. También hay que tener cuidado si alguna de las X i está fuertemente correlacionada con otras. Ejemplo: con k=2, si x 2 = a+bx 1 tendremos: y = b 0 + b 1 x 1 + b 2 x 2 = (b 0 + b 2 a) + (b 1 + b 2 b) x 1 Es decir un modelo de regresión lineal simple.
7 7 Contrastes de hipótesis Rechazaremos H 0, al nivel a, si el cero no está en el intervalo de confianza 1- a para b i Lo que es equivalente a un contraste de la t de Student para cada parámetro b i (i = 1, 2,, k) Son k contrastes diferentes: uno para cada una de las k variables explicativas
8 8 Ejemplo 1 Estimación del tamaño de Trilobites En la mayoría de las condiciones de preservación, es difícil encontrar ejemplares completos de Trilobites. La cabeza (cephalon) suelta es mucho más común. Por ello, es útil poder estimar el tamaño del cuerpo en función de medidas sobre la cabeza, estableciendo cuáles de ellas constituyen la mejor determinación del tamaño total. El siguiente ejemplo está tomado de: Norman MacLeod Keeper of Palaeontology, The Natural History Museum, London
9 9 Dibujo de Sam Gon III
10 10 y = b 0 + b 1 x 1 + b 2 x 2
11 11 Ejemplo 1 Estimación del tamaño de Trilobites Coeficientes Error típico Estadístico t p-valor Inferior 95% Superior 95% Intercepción 3,9396 4,4531 0,8847 0,3887-5, ,3349 Gabella length 2,5664 0,8771 2,9259 0,0094 0,7159 4,4170 Glabella width 0,9387 1,0730 0,8749 0,3938-1,3250 3,2025
12 12 Análisis de la Varianza Objetivo: realizar el contraste H 0 : b 1 =... = b k = 0 (ninguna de las Xs influye, el modelo no es válido) H 1 : algún b i es distinto de cero (alguna de las variables influye) Para ello descompondremos la variabilidad total
13 13 Tabla Anova Rechazaremos H 0, al nivel a, si : Coeficiente de determinación SCT = nv y = (n-1)s y 2 SCE = nv y R 2 SCR = nv y (1-R 2 )
14 14 Ejemplo 1 Estimación del tamaño de Trilobites Gr. de libertad Suma de cuadrados cuadrados medios F p-valor Regresión , ,11 40,32 0, Residuos ,70 69,28 Total ,92 Estadísticas de la regresión Coeficiente de correlación múltiple 0,909 Coeficiente de determinación R^2 0,826 R^2 ajustado 0,805 Error típico 8,323 Observaciones 20
15 15 Resumen de los contrastes
16 16 Ejemplo 2 Respiración de líquenes Se estudia la tasa de respiración (en nmoles oxígeno g -1 min -1 ) del liquen Parmelia saxatilis en crecimiento bajo puntos de goteo con un recubrimiento galvanizado. El agua que cae sobre el liquen contiene Zinc y Potasio que se utilizan como variables explicativas. Los datos corresponden a: Wainwright (1993, J.Biol.Educ., 27(3), ).
17 17 Datos Respiration Rate Potassium ppm Zinc ppm De Schaude - self-made / selbst aufgenommen, GFDL, Variable N MEAN MEDIAN STDEV RespRate K ppm Zn ppm
18 18 Plano de regresión Tasa de respiración = b 0 + b 1 Potasio + b 2 Zinc * * * * * * * * * * * * Datos *
19 19 Regresión de la tasa de respiración (RespRate) sobre el Potasio (K) y el Zinc (Zn). La ecuación de regresión estimada es: RespRate = K Zn Predictor Coef Stdev t-ratio p Constant K ppm Zn ppm Análisis de la varianza (tabla ANOVA) Source df SS MS F p Regression Error Total
20 20 ANÁLISIS DE VARIANZA (sólo Zn) gr. Libertad Suma de cuadrados cuadrados medios F p-valor Regresión , ,58 30,51 0, Residuos 7 493,42 70,49 Total Estadísticas de la regresión Coeficiente de correlación múltiple 0,90 Coeficiente de determinación R^2 0,81 R^2 ajustado 0,79 Error típico 8,40 Observaciones 9 ANÁLISIS DE VARIANZA (sólo K) gr. Libertad Suma de cuadrados cuadrados medios F p-valor Regresión , ,51 6,22 0,04 Residuos ,49 199,93 Total Estadísticas de la regresión Coeficiente de correlación múltiple 0,69 Coeficiente de determinación R^2 0,47 R^2 ajustado 0,40 Error típico 14,14 Observaciones 9
21 21 Estimación de la respuesta media de Y para los valores x 10,, x k0 de las variables explicativas Error típico
22 22 Predicción de un nuevo valor de Y dados los valores x 10,, x k0 de las variables explicativas Error típico
23 23 Ejemplo 3 En un experimento sobre el efecto tóxico de un compuesto químico sobre las larvas del gusano de seda, se inyectaron distintas dosis del compuesto químico a 15 larvas de distintos pesos, midiéndose posteriormente su supervivencia. Se decidió realizar una regresión lineal múltiple entre las variables: Y = Log 10 (supervivencia) X 1 = Log 10 (dosis) X 2 = Log 10 (peso)
24 24 Supervivencia dosis peso Y X 1 X 2 685,49 1,41 2,66 2,84,15,43 924,70 1,64 2,75 2,97,21,44 486,41 3,07 2,00 2,69,49,30 477,53 3,23 2,11 2,68,51,33 671,43 3,72 2,35 2,83,57,37 276,69 3,92 1,24 2,44,59,09 263,63 4,37 1,38 2,42,64,14 399,94 6,04 2,55 2,60,78,41 359,75 5,48 2,31 2,56,74,36 276,06 6,79 1,43 2,44,83,16 263,03 7,33 1,77 2,42,87,25 274,79 8,02 1,90 2,44,90,28 242,66 8,75 1,38 2,39,94,14 283,14 12,30 1,95 2,45 1,09,29 224,39 15,63 1,56 2,35 1,19,19 Datos Datos transformados
25 25 Modelo 1 Regresión Res idual Total ANOVA b Suma de Media cuadrados gl cuadrática F Sig.,464 2,232 59,178,000 a,047 12,004, a. Variables predic toras: (Constante), Log10 (peso), Log10 (dos is) b. Variable dependiente: Log10 (superv iv encia) Modelo 1 Variables (Constante) Log10 (dosis) Log10 (pes o) Coeficientes a Coef icientes no est andarizados a. Variable dependiente: Log10 (superv iv encia) Estadíst ic os Coef icientes est andarizad os B Error típ. Beta t Sig. 2, 589,084 30, 966,000 -, 378,066 -, 580-5,702,000,875,172,516 5, 073,000
26 26
27 27 Gráficos de regresión simple Modelo 1 (Constante) Log10 (dosis) Regresión simple: sólo la dosis Coeficientes no estandarizados a. Variable dependiente: Log10 (superv ivencia) Coeficientes a Coeficientes estandarizados Interv alo de conf ianza para B al 95% Límite B Error típ. Beta t Sig. Límite inf erior superior 2, 952,074 40, 136,000 2, 793 3, 111 -, 550,097 -, 843-5,649,000 -, 760 -, 340
28 28 Aceptando el modelo completo Para una larva (L1) que pesa 1,58 qué dosis estimamos necesaria para que viva el mismo tiempo que una larva (L2) que pesa 2,51 y a la que se administra una dosis de 3,16? Solución Estimación de Log 10 (Supervivencia) de L2 = 2, ,875 Log 10 (2,51) 0,378Log 10 (3,16) = 2,75 Supervivencia estimada de L2 = = 562,34 Dosis estimada para L1 2,75 = 2, ,875 Log 10 (1,58) 0,378Log 10 (x) Despejando Log 10 (x) = 0,04 la dosis pedida es = 1,10
29 29 Ejemplo 4 Los siguientes resultados corresponden al análisis realizado sobre los cerezos negros en el Allegheny National Forest, Pennsylvania. Los datos corresponden al volumen (en pies cúbicos), la altura (en pies) y el diámetro (en pulgadas, a 54 pulgadas sobre la base) de 31 cerezos. Se trata de estimar el volumen de un árbol (y por tanto su cantidad de madera) dados su altura y su diámetro.
30 30 Correlaciones Diam Altura Volumen Diámetro 1 Altura 0,519 1 Volumen 0,967 0,598 1 Varianzas y covarianzas Diam Altura Volumen Diam 9,53 Altura 10,05 39,29 Volumen 48,28 60,64 261,49
31 31 Análisis de los residuos
32 32 Regresión simple (sólo el diámetro) cuál es la curva ajustada con el modelo potencial?
33 33 Regresión simple (sólo el diámetro) Residuos no tipificados justifican los residuos la elección del modelo potencial?
34 34 Predicciones puntuales Para un cerezo con una altura de 80 pies y un diámetro de 16 pulgadas Con el modelo lineal completo (diámetro y altura): Volumen estimado = -57, ,708 (16) +0,339 (80) = 44,46 pies cúbicos Con el modelo lineal (solo el diámetro): Volumen estimado = -36, ,066 (16) = 44,11 pies cúbicos Con el modelo potencial (sólo el diámetro): Volumen estimado = 0,095 (16) 2,2 = 42,34 pies cúbicos
35 35 Incorporación de una variable dicotómica Supongamos que, además de las k variables continuas, tenemos una variable cualitativa con dos valores (que codificaremos como 0 y 1) Esta nueva variable se puede incorporar a la regresión obteniéndose un coeficiente adicional b k+1 para ella. El análisis de la regresión nos indicará si el efecto de esta variable es significativo o no. El coeficiente b k+1 representa lo que se añade a la ecuación lineal y = b 0 + b 1 x b k x k en el caso de que la nueva variable tome el valor 1.
36 36 Ejemplo: datos antropométricos de estudiantes de Biología Se trata de explicar la altura de un estudiante en función de su braza y su anchura de la tibia, teniendo en cuenta el sexo (mujer= 0, hombre =1) Estadísticos descriptivos (mujeres) Media Desviació n típica Estatura en cm 164,0589 4, Braza en cm 163,9493 6, Anchura tibia cm 8,5041, N Estadísticos descriptivos (hombres) Media Desviació n típica Estatura en cm 176,8975 6, Braza en cm 178,9225 7, Anchura tibia cm 8,8625, N Correlaciones (todos juntos) Estatura Braza Anchura tibia Estatura 1,000,927,418 Braza,927 1,000,398 Anchura tibia,418,398 1,000
37 37 Coeficientes a Modelo 1 (todos) Coeficientes no estandarizados B Error típ. Beta Coeficientes tipificados (Constante) 53,413 6,720 7,948,000 Braza,634,041,773 15,292,000 Anchura tibia,795,461,063 1,725,087 sexo 3,066,822,179 3,730,000 a. Variable dependiente: Estatura en cm Coeficientes a Modelo 2 (solo mujeres) Coeficientes no estandarizados B Error típ. Beta Coeficientes tipificados (Constante) 61,093 8,999 6,789,000 Braza,615,051,819 12,008,000 Anchura tibia,252,521,033,483,630 a. Variable dependiente: Estatura en cm Coeficientes a Modelo 3 (solo hombres) Coeficientes no estandarizados B Error típ. Beta Coeficientes tipificados (Constante) 50,354 11,171 4,508,000 Braza,604,077,747 7,801,000 Anchura tibia 2,092,986,203 2,121,041 a. Variable dependiente: Estatura en cm t t t Sig. Sig. Sig. Anova p-valor = 0,000 en los 3 modelos Modelo R R^2 1,937 a,878 2,824 a,679 3,883 a,780 Un hombre 180 de braza 9 ancho tibia Una mujer 165 de braza 8 ancho tibia Predicción alturas Para el hombre Modelo 1: 177,7 Modelo 3: 178,0 Para la mujer Modelo 1: 164,4 Modelo 2: 164,6 Comentarios?
38 38 Modelo de regresión logística binaria Ejemplo introductorio El 4 de julio de 1999 una tormenta con vientos que excedían las 90 millas por hora azotó el nordeste de Minnesota causando graves daños en los bosques de un parque natural de la zona. Los científicos analizaron los efectos de la tormenta determinando para mas de arboles del parque las siguientes variables: Su diámetro en cm (variable D) Una medida de la fuerza de la tormenta relacionada con el porcentaje inerte de área basal* de cuatro de las especies (variable S) El registro de si cada árbol había muerto (Y = 1) o si había sobrevivido (Y = 0) La especie a la que pertenecía cada árbol (variable SSP). Tras un primer análisis descriptivo, parece que el diámetro D y la fuerza de la tormenta S pueden ser útiles para estimar la probabilidad de supervivencia de un árbol (Y) *El área de un terreno ocupada por la sección de los troncos de los arboles en la base.
39 39 El modelo de regresión logística que veremos se utiliza para investigar la relación entre una variable respuesta cualitativa que toma dos posibles valores (en el ejemplo, la variable Y: supervivencia si o no) y un conjunto de variables regresoras continuas (en el ejemplo, las variables D y S) Este modelo nos permitirá: describir la probabilidad de que un árbol sobreviva o no como función del resto de las variables explicativas, determinar si estas variables modifican significativamente dicha probabilidad (influyen en la Y) estimar en función de las variables regresoras la probabilidad de que un árbol sobreviva o no.
40 40 Descripción del modelo Tenemos una variable Y con dos valores (0= fracaso y 1= éxito) Por ejemplo, la variable que describe si un árbol sobrevive o no. Esta variable depende de los valores de otras x 1,, x k (continuas) Por ejemplo las variables D y S. Es decir: La probabilidad de éxito dependerá de los valores de las x s La fórmula (modelo) para esta probabilidad viene dada por la función logística:
41 41 Datos (ejemplo) D i es el diámetro del árbol i, S i mide la fuerza local de la tormenta en la posición del árbol i La supervivencia es: Y i = 1 si el árbol i no sobrevivió a la tormenta Y i = 0 en caso contrario. n = Diametro (D) Fuerza (S) Supervivencia Especie (SPP) (Y) 9,00 0,024 0 BF 7,00 0,028 0 BA 7,00 0,102 0 BS 13,00 0,102 0 C 15,00 0,210 0 C 9,00 0,210 0 PB 20,00 0,306 0 C 16,00 0,307 0 BS 13,00 0,426 1 JP 7,00 0,429 0 BF 18,00 0,509 1 PB 37,00 0,511 0 A 16,00 0,626 1 JP 15,00 0,628 1 BS 9,00 0,716 1 BF 15,00 0,717 1 BS 17,00 0,847 1 BS 14,00 0,847 0 RM 30,00 0,974 1 RP 8,00 0,983 1 BF etc. etc. etc. etc.
42 42 Estimación de los parámetros del modelo La estimación de los parámetros se obtiene por métodos numéricos (no hay expresión explícita.) Podremos calcular la probabilidad estimada de no supervivencia de cada árbol de la muestra Y compararla con la realidad de si dicho árbol sobrevivió o no
43 43 Análisis con SPSS Como variable dependiente elegimos la variable respuesta y en la ventana Covariables situamos las variables D y S. B da las estimaciones de los parámetros b i y E.T. es su error típico. Podemos calcular para el árbol i: Si en el botón Guardar... del cuadro de dialogo marcamos la opción Probabilidades, el programa calcula las probabilidades estimadas de p i para todos los árboles de la muestra.
44 44 Predicción para un nuevo caso con x 01,, x 0k La estimación de P(Y=1/ x 01,, x 0k ) es: Clasificación del nuevo caso En el ejemplo esto ocurre si: 0,097 D 0 + 4,424 S 0 > 3,543 Estimar la probabilidad de que no sobreviva un árbol cuyo diámetro es de 30 cm situado en una zona en la que la fuerza de la tormenta viene dada por S = 0,8.
45 45 En la figura siguiente se representan los puntos (Di; Si) para todos los árboles de la muestra, en color verde (no supervivientes) o color azul (supervivientes) junto con la representación gráfica de la recta que divide las regiones en las que clasificaremos un nuevo árbol como superviviente o no superviviente. Observado en la muestra Predicho por el modelo vive muere % aciertos vive % muere %
46 46 Ejemplo Se dispone de medidas en cm de la longitud y anchura del pétalo y el sépalo de 100 lirios correspondientes a dos especies diferentes: iris versicolor (y = 0) e iris virginica (y = 1). Se ha ajustado un modelo de regresión logística a los datos con el fin de estudiar la probabilidad de que un lirio pertenezca a cada una de las dos especies en función de las cuatro medidas.
y = b 0 + b 1 x 1 + + b k x k
Las técnicas de Regresión lineal multiple parten de k+1 variables cuantitativas: La variable respuesta (y) Las variables explicativas (x 1,, x k ) Y tratan de explicar la y mediante una función lineal
Modelo Muestra Aleatoria
Las técnicas de regresión lineal múltiple parten de k+1 variables cuantitativas: La variable respuesta (y) Las variables explicativas (x 1,, x k ) Y tratan de explicar la y mediante una función lineal
TEMA 4 Modelo de regresión múltiple
TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.
TEMA 4 Regresión logística
TEMA 4 Regresión logística José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Variable respuesta dicotómica. Ejemplo. El
Introducción al modelo de regresión logística
Introducción al modelo de regresión logística JOSÉ R BERRENDERO DEPARTAMENTO DE MATEMÁTICAS UNIVERSIDAD AUTÓNOMA DE MADRID INTRODUCCIÓN Y MOTIVACIÓN El modelo de regresión logística se utiliza para investigar
ANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas [email protected] 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Objetivo: Proponer modelos para analizar la influencia
TEMA 3: REGRESIÓN LINEAL SIMPLE Objetivo: Proponer modelos para analizar la influencia de una variable cuantitativa sobre un fenómeno que nos interesa estudiar. 1. Modelo lineal l de regresión 2. Estimación
Estadística aplicada al medio ambiente
Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de
Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
Estadística; 3º CC. AA. Examen final, 23 de enero de 2009
Estadística; 3º CC. AA. Examen final, 3 de enero de 9 Apellidos Nombre: Grupo: DNI. (5 ptos.) En un estudio sobre las variables que influyen en el peso al nacer se han obtenido utilizando SPSS los resultados
1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
TEMA 3 Modelo de regresión simple
TEMA 3 Modelo de regresión simple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Planteamiento del problema.
Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias
Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados
Tema 8: Regresión y Correlación
Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice
Regresión Lineal Simple y Múltiple Regresión Logística
Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión
Definición de Correlación
Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del
Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos
Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.
Tema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
La Normal bivariante (modelo de probabilidad) Ajuste de una recta a una nube de puntos (análisis de datos)
REGRESIÓN LINEAL SIMPLE Nuevos elementos La Normal bivariante (modelo de probabilidad) Ajuste de una recta a una nube de puntos (análisis de datos) 1 Distribución Normal Bivariante (parámetros m 1, m 2,
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado
PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar
Tema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
Bioestadística. Curso Práctica: La recta de regresión
Bioestadística. Curso 2012-2013 Carmen M a Cadarso, M a del Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Índice 1. Introducción 2 2. El diagrama de dispersión 2 3. Covarianza 4 4. Coeciente de correlación
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple
ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes
7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE
ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión
ESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.
1 DEFINICIONES PREVIAS Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. Correlación: es la cuantificación del grado de relación existente
Estadística Descriptiva II: Relación entre variables
Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud MUI Ciencias de la Salud, UEx 25 de octubre de 2010 De qué trata? Descripción conjunto concreto de
MÉTODOS ESTADÍSTICOS 4º Biológicas Septiembre 2009 PRIMER EJERCICIO
MÉTODOS ESTADÍSTICOS 4º Biológicas Septiembre 2009 PRIMER EJERCICIO Resultados obtenidos por los hombres ganadores de las medallas de oro en salto de longitud y salto de altura en las olimpiadas desde
Estadística II Ejercicios Tema 5
Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta
Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL
ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y
SPSS Aplicación práctica: Base de datos del HATCO
Aplicación práctica: Base de datos del HATCO Datos: observaciones de variables obtenidos desde encuentas a clientes de un distribuidor industrial. Variables de interés en la aplicación: Percepciones de
Tema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
ESTADISTICA AVANZADA MODULO I
ESTADISTICA AVANZADA MODULO I Análisis de Regresión Modelo Supuestos Multiple 20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0 Consumo Energetico Gráfico de Dispersión 110.000 105.000
1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.
MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las
Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)
Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión
peso edad grasas Regresión lineal simple Los datos
Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos
PRÁCTICA 2: LA RECTA DE REGRESIÓN
PRÁCTICA 2: LA RECTA DE REGRESIÓN Los contenidos están organizados para que pueda avanzar a la vez que hacer los ejercicios propuestos en la práctica 2 del cuadernillo de práticas. Asegúrate de entender
ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 11 - Junio - 2.010 SOLUCIONES Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras que,
Guía docente 2007/2008
Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación
ANALISIS DE LA ESTATURA
ANALISIS DE LA ESTATURA OBJETIVO El objetivo de este trabajo es realizar un estudio de la de distintos individuos. DATOS Se realizan los distintos análisis de regresión simple, así como el análisis de
1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. Los modelos de regresión sirven, en general, para tratar de expresar una variable respuesta (numérica) en
Lucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Práctica 9 REGRESION LINEAL Y CORRELACIÓN
Práctica 9. Regresión lineal y Correlación 1 Práctica 9 REGRESION LINEAL Y CORRELACIÓN Objetivos: En esta práctica utilizaremos el paquete SPSS para estudiar la regresión lineal entre dos variables y la
Javier Roca Pardiñas Prof. Titular de Universidade Dpto. Estatística e I.O. Universidade de Vigo
Javier Roca Pardiñas Prof. Titular de Universidade Dpto. Estatística e I.O. Universidade de Vigo 30/10/2013 Modelos Lineales de Regresión Índice 1. Planteamiento de modelo Caso práctico 2. Estimación y
ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 13 - Septiembre - 2.004 Primera Parte Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Regresión con variables independientes cualitativas
Regresión con variables independientes cualitativas.- Introducción...2 2.- Regresión con variable cualitativa dicotómica...2 3.- Regresión con variable cualitativa de varias categorías...6 2.- Introducción.
TEMA 2 Diseño de experimentos: modelos con varios factores
TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial
Estadística II Ejercicios Tema 4
Estadística II Ejercicios Tema 4 1. Los siguientes datos muestran la estatura (en cm.) y el peso (en Kg.) para una muestra de cinco alumnos de una clase: estatura (cm.) peso (Kg.) 154 60 158 62 162 61
Prueba t para muestras independientes
Prueba t para muestras independientes El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS
TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis
Prácticas Tema 4: Modelo con variables cualitativas
Prácticas Tema 4: Modelo con variables cualitativas Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 4.1- Se dispone de información sobre 16 familias sobre
INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
Análisis de regresión y correlación lineal
Análisis de regresión y correlación lineal En las unidades anteriores hemos aplicado metodologías estadísticas para analizar la información de una variable desde una o más muestras utilizando las herramientas
Curso de Estadística no-paramétrica
Curso de Estadística no-paramétrica Sesión 3: Regresión no paramétrica y Contrastes de Aleatoriedad y bondad de ajuste Facundo Muñoz Grup d Estadística espacial i Temporal Departament d Estadística en
Análisis Multivariado: Modelo Predictivo de Regresión Lineal Múltiple
Análisis Multivariado: Modelo Predictivo de Regresión Lineal Múltiple El modelo predictivo utilizado para realizar el presente análisis es el de regresión lineal múltiple (RLM) 1. Resulta plausible la
Repaso Estadística Descriptiva
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable
Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Tema 2: Regresión. Grado en Fisioterapia, 2010/11. Jesús Montanero Fernández. Cátedra de Bioestadística Universidad de Extremadura
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 8 de noviembre de 2010 Índice 1 Regresión lineal simple 2 3 Índice 1 Regresión lineal simple 2 3 Índice 1 Regresión lineal
Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 21 - Junio - 2.004 Primera Parte Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras que,
EXTENSIONES DEL MODELO DE REGRESIÓN
EXTENSIONES DEL MODELO DE REGRESIÓN 1. Regresión exponencial 2. Regresión polinómica 3. Regresión con variables cualitativas M. Carmen Carollo, Beatriz Pateiro Página 1 1. Regresión exponencial Al tratar
CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES
TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no
Tercera práctica de REGRESIÓN.
Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Econometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ [email protected] http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios
Elaborado por: Pelay, C. y Pérez, J. Prueba t para muestras independientes
Prueba t para muestras independientes 1 El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
Práctica 4: Regresión Lineal Múltiple (1).
Práctica : Lineal Múltiple () Esta práctica está dedicada a resolver un problema de Lineal sin atender a ninguna cuestión relativa al cumplimiento de los supuestos del modelo, a la presencia de valores
Método de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
3. RELACION ENTRE DOS CONJUNTOS DE DATOS.
3. RELACION ENTRE DOS CONJUNTOS DE DATOS. 3. 1 Introducción En la búsqueda de mejoras o en la solución de problemas es necesario, frecuentemente, investigar la relación entre variables. Para lo cual existen
GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS
GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS Se realizó un estudio a partir de una muestra aleatoria de mujeres atendidas por el departamento de obstetricia y ginecología de cierta clínica particular.
Práctica 10: Introducción a Modelos Lineales Generalizados.
Práctica : Introducción a Modelos Lineales Generalizados Esta última práctica está dedicada a estudiar brevememente algunos problemas que que se formalizan mediante un modelo similar al modelo lineal normal
Universidad Nacional Abierta Estadística Aplicada (Cód. 746) Vicerrectorado Académico Cód. Carrera: Área de Matemática Fecha:
Segunda Prueba Parcial Lapso 7-746 /6 Universidad Nacional Abierta Estadística Aplicada (Cód. 746) Vicerrectorado Académico Cód. Carrera: 6-6 - 6 Fecha: --8 MODELO DE RESPUESTAS Objetivos 5 al 8 OBJ 5
Capitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved
Capitulo 34 Describir la relación entre dos variables Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta fundamental debe ser si podemos utilizar el valor
Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018
MANUAL DE IDENTIDAD VSUAL CORPORATIVA PROGRAMA: Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018 Departamento de Formación Médica Continuada (ICOMEM) SUPERVIVENCIA Y REGRESIÓN
Teoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Econometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ [email protected] http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios
Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min
Estadística II Examen final enero 19/1/17 Curso 016/17 Soluciones Duración del examen: h y 15 min 1. 3 puntos El Instituto para la Diversificación y Ahorro de la Energía IDAE ha publicado un estudio sobre
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple Facultad de Ciencias Sociales - UdelaR Índice 7.1 Introducción 7.2 Análisis de regresión 7.3 El Modelo de Regresión
Modelación estadística: La regresión lineal simple
Modelación estadística: La regresión lineal simple Gabriel Cavada Ch. 1 1 División de Bioestadística, Escuela de Salud Pública, Universidad de Chile. Statistical modeling: Simple linear regression Cuando
U.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA
U.N.P.S.J.B. FACULTAD DE INGENIERÍA Cátedra de ESTADÍSTICA Cátedra ESTADISTICA TRABAJOS PRÁCTICOS Facultad de Ingeniería Universidad Nacional de La Patagonia S. J. B. Comodoro Rivadavia TEMA Nº.. REGRESIÓN
2. ESTADÍSTICA DESCRIPTIVA 15 Estadística descriptiva.. Variables aleatorias Descripción de variables cuantitativas
" INDICE PRÓLOGO... XXIII PREFACIO GUÍA DE LECTURA XXV XXIX 1. INTRODUCCIÓN A LA ESTADÍSTICA 1 1.1. Estadística 1 1.2. Historia 3 1.3. Población y muestra 4 1.4. Estadística aplicada 7 1.5. Aplicaciones
REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE
UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o
VARIABLES ESTADÍSTICAS BIDIMENSIONALES
VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes
