ANOVA. Análisis de regresión y modelo lineal

Documentos relacionados
Método de cuadrados mínimos

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Teoría de la decisión

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

ESTADÍSTICA. Tema 4 Regresión lineal simple

Capítulo 8. Análisis Discriminante

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Se asignaron al azar ratas en condiciones similares a cuatro dietas (A D). Dos semanas después se midió el tiempo de coagulación.

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

LAB 13 - Análisis de Covarianza - CLAVE

Tercera práctica de REGRESIÓN.

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Métodos Estadísticos Multivariados

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Pruebas de Hipótesis Multiples

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Análisis de la varianza ANOVA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

4.1 Análisis bivariado de asociaciones

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Estadística aplicada a la comunicación

Regresión y Correlación

Cómo se hace la Prueba t a mano?

Regresión con variables independientes cualitativas

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Tipo de punta (factor) (bloques)

en Enfermería del Trabajo

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor

Muestreo e inferencia

Contrastes de hipótesis. 1: Ideas generales

478 Índice alfabético

PRÁCTICA 5: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

Estadísticos Aplicados en el SPSS 2008

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Tema 3. Relación entre dos variables cuantitativas

Contrastes de Hipótesis paramétricos y no-paramétricos.

Segunda práctica de REGRESIÓN.

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

Introducción a la regresión ordinal

Estadística Convocatoria de Junio Facultad de Ciencias del Mar. Curso 2009/10 28/06/10

Modelos lineales: Regresión, ANOVA y ANCOVA

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

INDICE. Prólogo a la Segunda Edición

APUNTES DE QUIMIOMETRIA REGRESIO LINEAL

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

El ejemplo: Una encuesta de opinión

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

PATRONES DE DISTRIBUCIÓN ESPACIAL

Principios de Estadística. Intro. En R. Ejercicios

Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo

Tema 2. Regresión Lineal

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS AGRICOLA, PECUARIAS Y DEL MEDIO AMBIENTE ECAPMA

Análisis de regresión lineal simple

ANEXO I. ANÁLISIS DE LA VARIANZA.

Teorema Central del Límite (1)

Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

Distribución Chi (o Ji) cuadrada (χ( 2 )

Doc. Juan Morales Romero

Tema 5. Contraste de hipótesis (I)

Análisis de diferencias de medias entre centros educativos chilenos según grupo socioeconómico y dependencia administrativa

PRÁCTICA 3: Ejercicios del capítulo 5

Tema 8: Contraste de hipótesis

1. Cómo introducir datos en SPSS/PC? - Recordatorio

Práctica 9 REGRESION LINEAL Y CORRELACIÓN

Repaso Estadística Descriptiva

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

MÓDULO 1: GESTIÓN DE CARTERAS

1. Caso no lineal: ajuste de una función potencial

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

ÍNDICE INTRODUCCIÓN... 21

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Diplomatura en Ciencias Empresariales X Y

3. Correlación. Introducción. Diagrama de dispersión

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

DISTRIBUCIONES BIDIMENSIONALES

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

b.- Realiza las comparaciones múltiples mediante los métodos LSD, Bonferroni y Tuckey.

El análisis de la varianza de un factor es una extensión del test de t para dos muestras independientes, para comparar K muestras.

Ejemplos del Suplemento 1 resueltos con Minitab

Conceptos del contraste de hipótesis

TEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN

CAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA

Contrastes de hipótesis paramétricos

Análisis de datos Categóricos

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

Transcripción:

. Análisis de regresión y modelo lineal [0011] DEFAD. Métodos de contraste de hipótesis y diseño de experimentos 2014 15. Análisis de regresión y modelo lineal

1 Comparaciones múltiples 2 3. Análisis de regresión y modelo lineal

Comparaciones múltiples. Problemas Comparaciones múltiples. Análisis de regresión y modelo lineal

Comparaciones múltiples. Problemas Comparaciones múltiples. Problemas. Análisis de regresión y modelo lineal

Comparaciones múltiples. Problemas Ejemplo tratamiento. Enunciado Efectividad de un tratamiento en un conjunto de enfermos de una enfermedad rara. Tres pruebas de falta de capacidad de raciocinio: mes cero (antes), mes uno y mes tres. Cómo contrastar el raciocinio antes del tratamiento (m0) según la raza? trat <- read.table( "files/tratamiento.csv", sep = ";", head = TRUE ) head( trat, 5 ) ## id genero raza m0 m1 m3 ## 1 1 1 3 35 25 16 ## 2 2 2 1 37 23 12 ## 3 3 2 1 36 22 14 ## 4 4 1 2 34 21 13 ## 5 5 2 3 60 43 22. Análisis de regresión y modelo lineal

Comparaciones múltiples. Problemas Aumento del error de tipo I Si contrastemos diferentes hipótesis nulas (independientes) a la vez, con α = 0.05 hay más de un 5% de probabilidades de obtener un resultado significativo por azar. Si realizamos tres contrastes, la probabilidad de no cometer error de tipo I es 0.95 para cada test. Si son independientes: La probabilidad de no cometer error de tipo I es: (0.95) 3 = 0.875 La probabilidad de cometer error de tipo I es: 1 (0.95) 3 = 1 0.875 = 0.143 Cuantas más comparaciones hagamos más crece el error de tipo I. Para fijar el error general en 0.05 hemos de tomar en cada test α = 1 3 0.95 = 0.01695. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Introducción al. Análisis de regresión y modelo lineal

Introducción al Introducción al de una vía de dos vías para medidas repetidas mixto El (análisis de la varianza) sirve para comparar dos o más medias. Es una generalización de la prueba t de Student. Conocida también como Anova de Fisher o análisis de varianza de Fisher por utilizar la distribución F de Fisher en el contraste. Según los factores que tengamos: de una vía (factor entre sujetos) de dos vías (varios factores entre sujetos) para medidas repetidas (factor intra sujetos) mixto (factores entre e intra sujetos). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto según variables independientes o factores (vías) En, a la variable categórica que define los grupos que deseamos comparar la llamamos variable independiente o factor y a la variable cuantitativa en la que deseamos comparar los grupos la llamamos variable dependiente. Los factores pueden variar entre sujetos (between subjects) o dentro de los sujetos (within subjects). Los factores entre sujetos (between) son los que no se miden dos (o más) veces para un mismo sujeto. Ejemplo: edad, raza, género, etc. Los factores dentro de los sujetos (within) son los que se miden varias veces para el mismo sujeto. Ejemplo: muestras tomadas en varios momentos, peso antes y después, etc.. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. Lectura de datos str( trat ) ## 'data.frame': 18 obs. of 6 variables: ## $ id : int 1 2 3 4 5 6 7 8 9 10... ## $ genero: int 1 2 2 1 2 1 1 2 2 2... ## $ raza : int 3 1 1 2 3 3 2 2 3 2... ## $ m0 : int 35 37 36 34 60 54 50 60 48 47... ## $ m1 : int 25 23 22 21 43 46 46 47 35 32... ## $ m3 : int 16 12 14 13 22 26 23 25 20 19.... Análisis de regresión y modelo lineal

Ejemplo tratamiento. Factores Introducción al de una vía de dos vías para medidas repetidas mixto # Ejercicio: transforma en factores. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto de una vía. Análisis de regresión y modelo lineal

de una vía. Introducción Introducción al de una vía de dos vías para medidas repetidas mixto El de una vía (one-way ) o de un factor examina la igualdad de las medias de la población para un resultado cuantitativo y una única variable categórica con dos o más niveles. La hipótesis nula H 0 es que no hay diferencia entre las medias y la alternativa, H 1, es que al menos una de las medias difiere del resto.. Análisis de regresión y modelo lineal

de una vía. Supuestos Introducción al de una vía de dos vías para medidas repetidas mixto Supuestos: Independencia de las observaciones Normalidad (robusto). Alternativa: Kruskal-Wallis Homocedasticidad (robusto si muestras balanceadas). Alternativa: prueba de Welch. Análisis de regresión y modelo lineal

Ejemplo tratamiento. Normalidad Introducción al de una vía de dos vías para medidas repetidas mixto # Ejercicio: comprobar normalidad (Shapiro-Wilk). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. Homocedasticidad # Ejercicio: comprobar homocedasticidad (Bartlett). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. de una vía La hipótesis nula H 0 es que no hay diferencia entre las medias y la alternativa, H 1, que al menos una de las medias difiere del resto. fittrat <- aov( m0 ~ raza, data = trat ) summary( fittrat ) ## Df Sum Sq Mean Sq F value Pr(>F) ## raza 2 844.8 422.4 7.28 0.00617 ** ## Residuals 15 870.3 58.0 ## --- ## Signif. codes: ## 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. Suma de cuadrados Densidad total, sin grupo Density 0.000 0.030 10 20 30 40 50 60 70 80 N = 18 Bandwidth = 5.071 Densidad raza 1 Density 0.00 0.06 10 20 30 40 50 60 70 80 N = 6 Bandwidth = 2.411 Densidad raza 2 Density 0.00 0.03 10 20 30 40 50 60 70 80 N = 6 Bandwidth = 4.224 Densidad raza 3 Density 0.00 0.06 10 20 30 40 50 60 70 80 N = 6 Bandwidth = 2.581. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. Suma de cuadrados m0 30 35 40 45 50 55 60 Todos Raza 1 Raza 2 Raza 3. Análisis de regresión y modelo lineal

Ejemplo tratamiento. Introducción al de una vía de dos vías para medidas repetidas mixto Estadístico F F = varianza explicada varianza inexplicada P-valor Si es menor que 0.05 se rechaza a la hipótesis nula, es decir, el factor tiene un efecto significativo en el experimento.. Análisis de regresión y modelo lineal

Distribución F de Snedecor Introducción al de una vía de dos vías para medidas repetidas mixto Distribución F de Snedecor con grados de libertad 2 y 15 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. y regresión str( fittrat ) fittrat$ # tabulador para ver opciones fittrat$coefficients lm( m0 ~ raza, data = trat ). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento. No HOV, test de Welch oneway.test( m0 ~ raza, data = trat ) ## ## One-way analysis of means (not assuming ## equal variances) ## ## data: m0 and raza ## F = 10.516, num df = 2.0000, denom df = ## 8.4967, p-value = 0.005032. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Después del. Contrastes post-hoc Qué grupos son los que difieren? Contrastes dos a dos corrigiendo el nivel de significación. Contrastes post-hoc o no planificados: sin idea previa Menos de 6 niveles Bonferroni Holm 6 o más niveles LSD Fisher HSD Tukey Comparaciones planificadas: con idea previa. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Post-hoc. Pruebas t con ajuste de Bonferroni Bonferroni, Holm, LSD Fisher #?p.adjust pairwise.t.test( trat$m0, trat$raza, p.adj = "holm") HSD Tukey fittrat <- aov( m0 ~ raza, data = trat ) TukeyHSD( fittrat ). Análisis de regresión y modelo lineal

Ejercicio Comparaciones múltiples Introducción al de una vía de dos vías para medidas repetidas mixto El conjunto de datos de R PlantGrowth muestra el peso que tiene un tipo de planta al no ser expuestas a ningún tipo de tratamiento (control) y al ser expuestas a dos tipos de tratamiento diferentes (trt1 y trt2). Hay diferencias entre los tratamientos? Entre cuáles?. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto de dos vías. Análisis de regresión y modelo lineal

de dos vías. Introducción Introducción al de una vía de dos vías para medidas repetidas mixto El de dos vías (two-way ) o de dos factores examina la igualdad de las medias de la población para un resultado cuantitativo y dos variables categóricas o factores. El modelo de dos vías evalúa, además de los efectos de los factores sobre la variable independiente, los efectos de la interacción entre ellas.. Análisis de regresión y modelo lineal

de dos vías. Supuestos Introducción al de una vía de dos vías para medidas repetidas mixto Mismos supuestos que el de una vía para ambos factores: Supuestos: Independencia de las observaciones Normalidad (robusto) Homocedasticidad (robusto si muestras balanceadas). Análisis de regresión y modelo lineal

Ejemplo tratamiento 2. Datos Introducción al de una vía de dos vías para medidas repetidas mixto En la base de datos tratamiento.csv Cómo contrastar el raciocinio antes del tratamiento (m0) según la raza y el género? head( trat ) ## id genero raza m0 m1 m3 ## 1 1 1 3 35 25 16 ## 2 2 2 1 37 23 12 ## 3 3 2 1 36 22 14 ## 4 4 1 2 34 21 13 ## 5 5 2 3 60 43 22 ## 6 6 1 3 54 46 26. Análisis de regresión y modelo lineal

Ejemplo tratamiento 2. Supuestos Introducción al de una vía de dos vías para medidas repetidas mixto Es necesario comprobar la homocedasticidad para ambos factores: género y raza, y comprobar la normalidad para todos los niveles de cada factor. En este ejemplo, faltarían los supuestos para la variable género (los de raza se han realizado anteriormente). bartlett.test( trat$m0 ~ trat$genero ) shapiro.test( trat$m0[ trat$genero==1 ] ) shapiro.test( trat$m0[ trat$genero==2 ] ). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento 2. de dos vías fittrat2 <- aov( m0 ~ raza * genero, data = trat ) summary( fittrat2 ) ## Df Sum Sq Mean Sq F value Pr(>F) ## raza 2 844.8 422.4 6.950 0.00989 ** ## genero 1 138.9 138.9 2.285 0.15649 ## raza:genero 2 2.1 1.1 0.017 0.98281 ## Residuals 12 729.3 60.8 ## --- ## Signif. codes: ## 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 La variable raza tiene un efecto significativo, el género no y no hay interacción entre ambas, esto es, se acepta la hipótesis nula.. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento 2. Interaction plot media del valor antes 10 20 30 40 50 60 genero 2 1 1 2 3 raza. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto de dos vías. Importa el orden? aov( m0 ~ raza * genero, data = trat ) aov( m0 ~ genero * raza, data = trat ) Si los datos son balanceados no importa el orden. Si no son balanceados, sí. Esto se debe al tipo de suma de cuadrados. Y si mis datos no son balanceados? Lo recomendable es utilizar la función Anova() del paquete car con suma de cuadrados tipo III. options( contrasts = c("contr.sum", "contr.poly") ) fitdatos <- aov( m0 ~ genero * raza, data = trat ) library( car ) Anova( fitdatos, type = "III" ). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto para medidas repetidas. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto para medidas repetidas. Introducción Se utiliza cuando se tienen varias medidas para el mismo sujeto en condiciones diferentes. No hay independencia. Una ventaja es que se tienen más datos con los mismos sujetos. Se controla mejor la variabilidad interna. Supuestos: Normalidad. Alternativa: Friedman Esfericidad: varianzas de las diferencias iguales. Test de Mauchly (H 0 : hay esfericidad) Si no hay esfericidad: corrección de Greenhouse Geisser y corrección de Huynh Feldt. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto para medidas repetidas. Reestructurar los datos Antes: sujeto n1 n2 n3 n4 S1 7 5 6 2 S2 1 0 3 0 S3 8 8 6 1 S4 4 3 1 2. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto con medidas repetidas. Reestructurar los datos Ahora: sujeto nivel medida S1 n1 7 S1 n2 1 S1 n3 8 S1 n4 4 S2 n1 5 S2 n2 0......... S4 n4 2. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento 3. Reestructurar los datos Se utiliza la función melt del paquete reshape2. library( reshape2 ) tratre <- melt( trat, id = c( "id", "genero", "raza" ), measure = c( "m0", "m1", "m3" ), variable.name = "mes", value.name = "faltarac" ) head( tratre ) ## id genero raza mes faltarac ## 1 1 1 3 m0 35 ## 2 2 2 1 m0 37 ## 3 3 2 1 m0 36 ## 4 4 1 2 m0 34 ## 5 5 2 3 m0 60 ## 6 6 1 3 m0 54. Análisis de regresión y modelo lineal

Ejemplo tratamiento 3. Función aov Introducción al de una vía de dos vías para medidas repetidas mixto summary( aov( faltarac ~ mes + Error( id / mes ), data = tratre ) ) ## ## Error: id ## Df Sum Sq Mean Sq F value Pr(>F) ## Residuals 17 3247 191 ## ## Error: id:mes ## Df Sum Sq Mean Sq F value Pr(>F) ## mes 2 5684 2842 142.1 <2e-16 *** ## Residuals 34 680 20 ## --- ## Signif. codes: ## 0 '***' 0.001 '**' 00R0.01 Team '*'. 0.05 Análisis'.' de regresión 0.1 y modelo ' ' lineal 1

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento 3. Función ez del paquete ez La función ez() del paquete ez además del modelo lleva a cabo el análisis de supuestos previo: library( ez ) options( contrasts = c( "contr.sum", "contr.poly" ) ) ez( data = tratre, dv = faltarac, wid = id, within = mes, type = 3 ). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Ejemplo tratamiento 3. Función ez del paquete ez ## $ ## Effect DFn DFd F p p<.05 ges ## 2 mes 2 34 142.0733 3.093681e-17 * 0.5913851 ## ## $`Mauchly's Test for Sphericity` ## Effect W p p<.05 ## 2 mes 0.523408 0.005632782 * ## ## $`Sphericity Corrections` ## Effect GGe p[gg] p[gg]<.05 HFe p[hf] p[hf]<.05 ## 2 mes 0.6772352 2.298217e-12 * 0.7152351 6.12003e-13 *. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto de medidas repetidas con R. ez() correcciones Si el test de Mauchly nos da significativo quiere decir que no podemos asumir esfericidad y hay que considerar las correcciones. Pautas: ( ) Greenhouse Geisser calcula ε 1 k 1, 1 (k número de grupos) Si ε > 0.75 mirar Huynh Feld Si ε < 0.4 no son válidos los resultados (la violación de la esfericidad afecta a los p-valores). Análisis de regresión y modelo lineal

Ejercicio cáncer Comparaciones múltiples Introducción al de una vía de dos vías para medidas repetidas mixto El conjunto de datos cancer.csv contiene los resultados de un estudio que mide las capacidades orales de enfermos de cáncer de garganta. Las medidas están tomadas inicialmente y a las 2, 4 y 6 semanas de tratamiento. Además las variables edad, peso inicial y estado inicial del cáncer (del 1 al 4) fueron medidas para cada paciente. En el hospital, a un grupo se le administra un placebo (0) y al otro un tratamiento (1). Se desea determinar si la semana de tratamiento influye en las capacidades orales de aquellos que están sometidos al tratamiento 1.. Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto mixto. Análisis de regresión y modelo lineal

mixto. Introducción Introducción al de una vía de dos vías para medidas repetidas mixto Se utiliza cuando tenemos varios tipos de factores: tanto entre sujetos como intra sujetos. summary( aov( faltarac ~ genero * mes + Error( id / mes ), data = tratre ) ). Análisis de regresión y modelo lineal

Introducción al de una vía de dos vías para medidas repetidas mixto Modelos mixtos con R. ez() options( contrasts = c( "contr.sum", "contr.poly" ) ) ez( data = tratre, dv = faltarac, wid = id, between = genero, within = mes, type = 3 ). Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Introducción al modelo de regresión. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Regresión lineal. Introducción La base de datos produccion.csv contiene el tiempo (minutos) que dura un proceso de fabricación de un número de artículos. prod <- read.table( "files/produccion.csv", sep = ";", head = TRUE ) head( prod, 4 ) ## caso tiempo articulos ## 1 1 195 175 ## 2 2 215 189 ## 3 3 243 344 ## 4 4 162 88 # mean( prod$tiempo ) # 202.05. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Regresión lineal. Introducción Tiempo 160 180 200 220 240 50 100 150 200 250 300 350 Artículos. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Regresión lineal. Introducción La regresión es el conjunto de técnicas usadas para estudiar la relación entre variables. Estamos interesados en conocer el efecto que una o varias variables pueden causar sobre otra predecir en mayor o menor grado valores de una variable a partir de otra. Se trata de una técnica para explorar y cuantificar la relación de dependencia entre una variable cuantitativa llamada variable dependiente o respuesta (Y ) una o más variables independientes llamadas variables predictoras (X 1, X 2,, X k ).. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Regresión lineal. Introducción Modelizaremos la relación lineal entre dos o más variables mediante una ecuación lineal de la forma Regresión lineal simple Y = β 0 + β 1 X 1 + + β n X k relación entre dos variables ecuación de una recta y = mx + n. Regresión lineal múltiple relación entre tres o más variables un plano o un hiperplano.. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Estimación recta de regresión Este ajuste consiste en estimar los coeficientes de regresión β 0 y β 1 para obtener la recta ŷ = ˆβ 0 + ˆβ 1 x, donde ŷ es el valor ajustado por el modelo para el valor observado x. ˆβ 0 es la ordenada en el origen (punto de corte con el eje Y ). ˆβ 1 la pendiente de la recta del modelo de regresión.. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Ajuste de la recta de regresión Y y^ = β^0 + β^1 x β^1 1 β^0 x x+1 X. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Regresión lineal simple. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Introducción El modelo tiene la forma Y = β 0 + β 1 X + e, con β 0 y β 1 los coeficientes de regresión β 0 es el valor medio de la variable dependiente cuando la predictora es cero. β 1 es el efecto medio (positivo o negativo) sobre la variable dependiente al aumentar en una unidad el valor de la predictora X.. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Residuos Consideramos los residuos, las distancias verticales entre cada punto y la recta e i = y i ŷ i Y e i X. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Método de mínimos cuadrados Para estimar la ecuación de la recta de regresión podemos a utilizar el criterio de mínimos cuadrados, por ser el de mayor aceptación. Al ajustar cualquier recta a un conjunto de datos existen pequeñas diferencias entre los valores estimados por la recta los valores reales observados.. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Método de mínimos cuadrados Si sumamos diferencias positivas y negativas estas tienden a cancelarse unas con otras. Elevamos al cuadrado las diferencias antes de sumarlas. Con el criterio de mínimos cuadrados calculamos β 0 y β 1 haciendo mínima la suma de los cuadrados de los residuos n SS E = e 2 i i=1 Existe una única recta que minimiza los residuos.. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Ejemplo producción. Ajuste del modelo modelo <- lm( tiempo ~ articulos, data = prod) modelo ## ## Call: ## lm(formula = tiempo ~ articulos, data = prod) ## ## Coefficients: ## (Intercept) articulos ## 149.7477 0.2592 El modelo ajustado es tiempo = 150 + 0.26 articulos. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Ejemplo producción. Recta regresión Tiempo 160 180 200 220 240 50 100 150 200 250 300 350 Artículos. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Bondad de ajuste del modelo La variabilidad del modelo se puede descomponer como SS T = SS M + SS R. El coeficiente de determinación R 2 = SS M SS T variabilidad total de la respuesta que es explicada por el modelo. El estadístico F se define como F = MS M MS R contrasta si el modelo tiene significativa capacidad predictiva si la SS M es suficientemente grande con respecto al número de varibles involucradas en el modelo.. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Ejemplo producción. Resumen del modelo summary( modelo ) ## ## Call: ## lm(formula = tiempo ~ articulos, data = prod) ## ## Residuals: ## Min 1Q Median 3Q Max ## -28.597-11.079 3.329 8.302 29.627 ## ## Coefficients: ## Estimate Std. Error t value Pr(> t ) ## (Intercept) 149.74770 8.32815 17.98 6.00e-13 *** ## articulos 0.25924 0.03714 6.98 1.61e-06 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 16.25 on 18 degrees of freedom ## Multiple R-squared: 0.7302, Adjusted R-squared: 0.7152 ## F-statistic: 48.72 on 1 and 18 DF, p-value: 1.615e-06. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Ejercicio anscombe # Ajusta la recta para cada pareja y~x anscombe <- read.table( "files/anscombe.csv", sep = ";", head = TRUE ) head( anscombe ) ## case x1 x2 x3 x4 y1 y2 y3 y4 ## 1 1 10 10 10 8 8.04 9.14 7.46 6.58 ## 2 2 8 8 8 8 6.95 8.14 6.77 5.76 ## 3 3 13 13 13 8 7.58 8.74 12.74 7.71 ## 4 4 9 9 9 8 8.81 8.77 7.11 8.84 ## 5 5 11 11 11 8 8.33 9.26 7.81 8.47 ## 6 6 14 14 14 8 9.96 8.10 8.84 7.04. Análisis de regresión y modelo lineal

Introducción al modelo de regresión Regresión lineal simple Diagnóstico del modelo No basta con ver gráficamente que es un modelo útil. Debemos comprobar ciertos supuestos matemáticos que nos hablan de la bondad y calidad del modelo. Las hipótesis son: Linealidad, homocedasticidad e independencia (gráficamente) Media cero, varianza constante, incorrelación y normalidad de los residuos (analíticamente).. Análisis de regresión y modelo lineal