Modelo de Análisis de la Covarianza. Introducción al modelo de Medidas Repetidas

Documentos relacionados
Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Métodos Estadísticos Multivariados

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

ESTADÍSTICA. Tema 4 Regresión lineal simple

Curso de nivelación Estadística y Matemática

2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

Tema 7: Modelos de diseños de experimentos

Método de cuadrados mínimos

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Tema 3: Análisis de datos bivariantes

Regresión Lineal Múltiple

Diseño de Bloques al azar. Diseño de experimentos p. 1/25

Teoría de la decisión

Escuela Nacional de Estadística e Informática ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA

Análisis de la varianza

APUNTES DE QUIMIOMETRIA REGRESIO LINEAL

Ejemplos Resueltos Tema 4

Teorema Central del Límite (1)

1. Objetivos. Introducción 2. ANOVA. Tema 8: Relaciones entre variables Test de hipótesis para el ANOVA. M. Iniesta Universidad de Murcia

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México

Estadísticas Pueden ser

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

4.1 Análisis bivariado de asociaciones

478 Índice alfabético

bloques SC Suma de Cuadrados k trat bloques

PROYECTO DEL CURSO DE ESTADÍSTICA INFERENCIAL

TEMA 3: Contrastes de Hipótesis en el MRL

INTRODUCCIÓN DIAGRAMA DE DISPERSIÓN. Figura1

Pruebas de Hipótesis Multiples

RESULTADOS. 4.1 ADAPTABILIDAD DEL SISTEMA. Los resultados de adaptabilidad del sistema cromatografico se detallan en la tabla 4.1

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

CAPITULO ANÁLISIS ESTADÍSTICO MULTIVARIADO /1/ /2/ En el presente capítulo se realiza el análisis estadístico multivariado de los

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

DISEÑOS MULTIFACTORIALES CON RESTRICCIONES DE ALEATORIZACIÓN. Diseños en bloques completos aleatorizados con dos tratamientos

Econometría II Grado en finanzas y contabilidad

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Prueba de Hipótesis. Para dos muestras

Hoja de Ejercicios 4 Análisis de regresión con información cualitativa

Práctica 9: Anova (2).

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Multiple Linear Regression

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Análisis Estadístico de Datos Climáticos. Pruebas de Hipótesis (Wilks, cap. 5)

Diseños en cuadrados greco-latinos

Contrastes de hipótesis. 1: Ideas generales

Regresión y Correlación

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

3. Correlación. Introducción. Diagrama de dispersión

Conceptos del contraste de hipótesis

Objetivos. Epígrafes 3-1. Francisco José García Álvarez

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

1. Ejercicios. 2 a parte

APUNTES DE ÁLGEBRA LINEAL TEMA 2. SISTEMAS DE ECUACIONES LINEALES

Diseños en bloques aleatorizados

En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener

Revista Colombiana de Estadística ISSN: Universidad Nacional de Colombia Colombia

Sistemas lineales de ecuaciones diferenciales. Juan-Miguel Gracia

Unidad IV: Distribuciones muestrales

Teoría de la decisión Estadística

Ejercicio 1 (20 puntos)

Pruebas de hipótesis

Diseño Estadístico de Experimentos

OPTIMIZACIÓN EXPERIMENTAL. Ing. José Luis Zamorano E.

Estadística Descriptiva II: Relación entre variables

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

Tema 8: Contraste de hipótesis

Distribuciones Probabilísticas. Curso de Estadística TAE,2005 J.J. Gómez Cadenas

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor

Métodos Matemáticos 2 Ecuaciones Diferenciales de Orden Superior

Contrastes de Hipótesis paramétricos y no-paramétricos.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Departamento de Matemática Aplicada a las T.I.C. SOLUCIONES

Matemáticas 2.º Bachillerato. Matemáticas 2.º Bachillerato. Matemáticas 2.º Bachillerato. Ejemplo:

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

ANEXO I. ANÁLISIS DE LA VARIANZA.

Aplicación de Correlación en la Investigación Correlation Application in Research

6.4 Método de solución de las ecuaciones diferenciales parciales (directos, equiparables con las ordinarias, separación de variables)

Diseños factoriales con tres factores

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Tema 2 Datos multivariantes

APLICACIÓN DEL SISTEMA FLOWDRILL EN PLACAS DE ACERO INOXIDABLES

RESOLUCIÓN DE SISTEMAS MEDIANTE DETERMINANTES

ECONOMETRÍA I. Tema 3: El Modelo de Regresión Lineal Múltiple: estimación


Ejercicio 1(10 puntos)

PRÁCTICA 3: Ejercicios del capítulo 5

Diseño de Experimentos

1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA

3. CORRELACIÓN Y REGRE-

Tema 4: Probabilidad y Teoría de Muestras

Transcripción:

Modelo de Análisis de la Covariza. Introducción al modelo de Medidas Repetidas Modelo de Análisis de la Covariza Introducción El diseño por bloques se considera para eliminar el efecto de los factores de ruido que no son controlables. El álisis de la covariza es otro método que se utiliza para un problema semejte: supongamos un experimento con una variable respuesta, y, donde existe otra variable, x, de modo que ambas están relacionadas linealmente. Supongamos, además, que x no es una variable controlable por el experimentador pero que puede ser observada junto con y. A la variable x se le denomina covariable o variable concomitte. El álisis de la covariza sirve para ajustar la variable respuesta por el efecto de la covariable. En caso de no hacerlo, la media de cuadrados del error puede aumentar mucho y hacer que las verdaderas diferencias en la respuesta debido a los tratamientos se difíciles de detectar. El álisis de la covariza resulta ser una combinación entre elanovayelálisisderegresión. Modelo Suponemos un modelo con un solo factor y una covariable y asumimos una relación lineal entre la variable respuesta y la covariable: y ij = µ + α i + β(x ij x )+ε ij 1

para i =1,...,a j =1,...,n En el modelo, y ij es la j -ésima observación bajo el i-ésimo nivel del tratamiento. x ij es la medida de la covariable que se hace para y ij x es la media de los valores de x ij µ es el valor medio global. α i es el efecto del nivel i-ésimo del tratamiento β coeficiente de regresión que relaciona y ij con la covariable x ij ε ij error aleatorio Se asume que ε ij N(0,σ 2 ) son independientes entre sí, β 6= 0, P a α i =0yla covariable x no está afectada por los tratamientos. Se utiliza la siguiente notación: S yy = S xx = S xy = (y ij ȳ ) 2 = (x ij x ) 2 = (x ij x )(y ij ȳ ) = y 2 ij y2 x 2 ij x2 x ij y ij (x )(y ) T yy = n (ȳ i ȳ ) 2 = 1 yi 2 y2 n T xx = n ( x i x ) 2 = 1 x 2 i x2 n T xy = n ( x i x )(ȳ i ȳ ) = 1 x i y i x y n E yy = = E xy = (y ij ȳ i ) 2 = S yy T yy (x ij x i ) 2 = S xx T xx (x ij x i )(y ij ȳ i ) =S xy T xy 2

En general, S = T + E donde los símbolos S, T y E son las sumas de cuadrados y los dobles productos para el total, los tratamientos y el error respectivamente. Los estimadores por mínimos cuadrados son La suma de cuadrados del error es ˆµ = ȳ ˆα i = ȳ i ȳ ˆβ( x i x ) ˆβ = E xy con a(n 1) 1 grados de libertad. SCE = E yy E2 xy, La variza del error experimental es, así, MCE = SCE a(n 1) 1. Supongamos que no hay efecto del tratamiento, entonces el modelo queda reducido a y ij = µ + β(x ij x )+ε ij Los estimadores por mínimos cuadrados son ˆµ = ȳ ˆβ = E xy. La suma de cuadrados del error en el modelo reducido queda como con ( 2) grados de libertad. SCE = S yy S2 xy S xx La ctidad S2 xy S xx es la reducción de la suma de cuadrados de y, obtenida por la regresión lineal de y en x.además,sce < SCE porque el modelo completo incluye los parámetros 3

adicionales Así, SCE SCE es una reducción en la suma de cuadrados debida a los términos α i. De esta mera, a partir de SCE SCE se tiene una suma de cuadrados con (a 1) grados de libertad para contrastar la hipótesis de que no hay efectos de los tratamientos. Para contrastar la hipótesis H 0 α i =0, i se calcula SCE SCE F 0 = a 1 SCE a(n 1) 1 que, si la hipótesis nula es cierta, se distribuye como una F de Snedecor: F a 1,a(n 1) 1, de modo que se rechaza H 0 al nivel α si F 0 >F a 1,a(n 1) 1;α Se obtiene la siguiente tabla: Sumas de productos F. Variación g. l. x xy y Tratamientos a 1 T xx T xy T yy Error a(n 1) E xy E yy Total 1 S xx S xy S yy Ajuste por Regresión F. Variación y g. l. Cuadrados medios Tratamientos SCE = E yy E2 xy Error SCE = S yy S2 xy S xx a(n 1) 1 MCE = SCE a(n 1) 1 Total 2 Tratamientos Ajustados SCE SCE SCE a 1 SCE a 1 4

También es importte efectuar un contraste también sobre el termino de regresión β. Se calcul las medias ajustadas por la regresión: Ajust_ȳ i =ȳ i ˆβ( x i x ) para i =1, 2,...,a, donde ˆβ = E xy. Esta media ajustada es el estimador de mínimos cuadrados de µ + α i, donde i =1,...,a. Por otro lado, el error estándar de la media ajustada de cada tratamiento es S Ajust_ȳi = µ 1 MCE n + ( x i x ) 2 1 2. Finalmente, con respecto al coeficiente de regresión se puede contrastar la hipótesis H 0 β =0medite el estadístico F 0 = E 2 xy MCE, que, si la hipótesis nula es cierta, se distribuye como una F de Snedecor, F 1,a(n 1) 1. De este modo, se rechaza H 0 β =0, ivelα si F 0 >F 1,a(n 1) 1,α. Ejemplo. Se considera un estudio para determinar si existen diferencias en la resistencia de una fibra producida por tres máquinas diferentes. Se piensa que el grosor de las fibras (x) influye también, obteniéndose los siguientes valores Máquina 1 Máquina 2 Máquina 3 y x y x y x 36 20 40 22 35 21 41 25 48 28 37 23 39 24 39 22 42 26 42 25 45 30 34 21 49 32 44 28 32 15 207 126 216 130 180 106 5

Se trata de eliminar el efecto del grosor (x) en la resistencia de las fibras para poder comparar el efecto de las tres máquinas. S yy = S xx = S xy = y 2 ij y2 =362 +41 2 + +32 2 6032 3 5 =346,4 x 2 ij x2 =202 +25 2 + +15 2 3622 3 5 =261,73 x ij y ij (x )(y ) =20 36 + +15 32 362 603 3 5 =282,6 T yy = 1 n T xx = 1 n T xy = 1 n y 2 i y2 = 1 5 (2072 +216 2 +180 2 ) 6032 3 5 =140,4 x 2 i x2 = 1 5 (1262 +130 2 +106 2 ) 3622 3 5 =66,13 x i y i x y = 1 362 603 (207 126 + 216 130 + 180 106) =96 5 3 5 E yy = S yy T yy = 206 = S xx T xx =195,6 E xy = S xy T xy =186,6 Por otro lado SCE = S yy S2 xy =346,4 282,62 S xx 261,73 =41,27 con ( 2) = 3 5 2=13grados de libertad, y SCE = E yy E2 xy =206 186,62 195,6 =27,99 con a(n 1) 1=3(5 1) 1=11grados de libertad. La suma de cuadrados para contrastar H 0 α i =0, para i =1, 2, 3 es SCE SCE =41,27 27,99 = 13,28 con a 1=3 1=2grados de libertad. 6

Así, se calcula Como, para α =0,10, F 0 = SCE SCE a 1 SCE a(n 1) 1 = 13,28 2 27,99 2,54 =2,61. F 0 =2,61 <F a 1,a(n 1) 1;α = F 2,11;0 0 10 =2,86 se acepta la hipótesis nula.h 0 α i =0, para i =1, 2, 3. Se estima el coeficiente de regresión ˆβ = E xy = 186,6 195,6 =0,954. Para contrastar la hipótesis H 0 β =0se usa el estadístico F 0 = E 2 xy 186,62 MCE = 195,6 2,54 =70,08 Como F 1,a(n 1) 1 = F 1,11;0 0 10 =9,65, se rechaza H 0 β =0, ivel0,10. Con lo cual la corrección medite el álisis de la covariza es necesario. Lasmediasdelostratamientosajustadasson Ajust_ȳ i = ȳ i ˆβ( x i x ) = Ajust_ȳ 1 = 41,4 0,954 (25,2 24,13) = 40,38 Ajust_ȳ 2 = 43,2 0,954 (26. 24,13) = 41,42 Ajust_ȳ 3 = 36 0,954 (21,2. 24,13) = 38,8 Si se compar las medias de los tratamientos sin ajustar con las ajustadas, se observa que estas últimas están mucho más próximas entre sí, lo cual es otra indicación de la necesidad de hacer un álisis de la covariza. 7

Modelo de Medidas Repetidas En numerosas ocasiones, los sujetos que se estudi son sujetos que pueden presentar numerosas diferencias entre ellos te el mismo tratamiento, introduciéndose, entonces, una mayor fuente de error experimental. Aumenta, así, la media de cuadrados de los errores haciendo difícil distinguir las diferencias entre los tratamientos. Una mera de controlar esta variabilidad entre los sujetos, consiste en aplicar a cada uno de ellos los a tratamientos. Este diseño se denomina de medidas repetidas. Equivale a un diseño por bloques completos, donde la variable bloque son los sujetos, siendo ésta de efectos aleatorios. Supongamos un experimento donde aparece un factor con a tratamientos, y que cada tratamiento se aplica exactamente sobre cada uno de los n individuos: Sujetos Tratamientos 1 2 n Totales 1 y 11 y 12 y 1n y 1 2 y 21 y 22 y 2n y 2........ a y a1 y a2 y y a Totales y 1 y 2 y n y La observación y ij es la respuesta del sujeto j al tratamiento i ysóloseusn sujetos. El modelo se escribe como y ij = µ + α i + β j + ε ij, donde α i es el efecto del i ésimo tratamiento y β j el efecto del j -ésimo sujeto. Se supone que α i =0, y que los individuos son una muestra aleatoria de una población dada, de modo que los individuos actú como un efecto aleatorio β j N(0,σ 2 β). 8

Dado que β j es común a todos los a tratamientos medidos sobre el mismo sujeto j, la covariza entre y ij e y i 0 j es, en general, diferente de 0, asumiéndose que es constte sobre los tratamientos y los sujetos. La suma total de cuadrados se parte en dos sumatorios: (y ij ȳ ) 2 = a (ȳ j ȳ ) 2 + (y ij ȳ j ) 2 El primer término de la suma de cuadrados recoge la diferencia entre sujetos y el segundo término la diferencia dentro de sujetos, esto es, SCT = SC entre + SC dentro de modo que ambas sumas de cuadrados son independientes entre sí con 1=(n 1) + n(a 1) grados de libertad. Las diferencias dentro de los sujetos dependen tto de las diferencias en los efectos de los tratamientos como del ruido. Así, se descompone la suma de cuadrados dentro de sujetosdelasiguienteforma: (y ij ȳ j ) 2 = n (ȳ i ȳ ) 2 + (y ij ȳ i ȳ j +ȳ ) 2. El primer término mide la contribución de las diferencias entre las medias de los tratamientos a la suma de cuadrados dentro de los sujetos, y el segundo término es la variación residual debido al error. Ambos términos son independientes. Así, SC dentro = SCTra + SCE con grados de libertad respectivamente. n(a 1) = (a 1) + (a 1)(n 1) 9

Se contrasta H 0 α i =0, i =1,...,a H 1 α i 6=0, para algún i usándose el cociente F 0 = SCTra a 1 SCE (a 1)(n 1) = MCTra MCE que, cudo H 0 es cierta, se distribuye como una F de Snedecor F a 1,(a 1)(n 1). Se rechaza H 0 ivelα cudo La tabla de álisis de la variza es F 0 >F a 1,(a 1)(n 1). Fuentes Variación Suma de Cuadrados grados libertad F P Entre Sujetos n y 2 j y2 n 1 a P Dentro Sujetos a P n y2 ij P n y 2 j n(a 1) a Tratamientos SCTra = P a yi 2 y2 a 1 F a 0 = SCTra a 1 Residual SCE =(2) (3) (a 1)(n 1) P Total a P n y2 ij y2 1 SCE (a 1)(n 1) 10