Regresión Múltiple. Muestra StatFolio: multiple reg.sgp

Documentos relacionados
Height (altura) Extraction (extracción)

Regresión Binomial Negativa

Regresión de Datos de Vida

CAPÍTULO 3 DIAGNÓSTICOS DE REGRESIÓN

Riesgos Proporcionales de Cox

Regresión Logística. StatFolio Muestra: logistic.sgp

Organización y resumen de datos cuantitativos

DISTRIBUCION DE RENDIMIENTOS: APLICACIONES

Comparación de Tasas. Ejemplo StatFolio: comparerates.sgp

CAPÍTULO 4 MARCO TEÓRICO

Aspectos fundamentales en el análisis de asociación

Regresión y correlación Tema Contraste sobre β 1.2 Regresión en formato ANOVA. 2. Correlación. Contraste sobre ρ xy

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

4. REPRESENTACIONES GRÁFICAS PARA DATOS CATEGÓRICOS.

Pregunta Hoy está nublado, cuál es la probabilidad de que mañana continúe nublado? cuál es la probabilidad de que está nublado pasado mañana?

Modelos lineales Regresión simple y múl3ple

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

Análisis de Varianza no paramétricos

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

CLAVE - Laboratorio 1: Introducción

Tablas de Vida (Intervalos)

Análisis de Regresión y Correlación

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

Tema 6. Estadística descriptiva bivariable con variables numéricas

a) Qué población (la de hombres o la de mujeres) presenta un salario medio mayor? b) Qué porcentaje de varones gana más de 900?

Análisis de Capabilidad (Defectos Por Unidad)

Inferencia en Regresión Lineal Simple

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

Figura 1

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Análisis estadístico de incertidumbres aleatorias

Tema 21: Distribución muestral de un estadístico

CORRELACION Y REGRESION

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

Análisis de Resultados con Errores

Problemas donde intervienen dos o más variables numéricas

Ejercicios y Talleres. puedes enviarlos a

Regresión Lineal Simple y Correlación

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

Relación 2: Regresión Lineal.

Especialista en Estadística y Docencia Universitaria REGRESION LINEAL MULTIPLE

Examen Final de Econometría Grado

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)}

Medidas de Variabilidad

CAPITULO CUATRO MEDIDAS DE DISPERSION, ASIMETRIA Y CURTOSIS

REGRESION LINEAL SIMPLE

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

-.GEOMETRÍA.- a) 37 cm y 45 cm. b) 16 cm y 30 cm. En estos dos, se dan la hipotenusa y un cateto, y se pide el otro cateto:

REGRESION LINEAL SIMPLE

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas

REGRESION Y CORRELACION

El Impacto de las Remesas en el PIB y el Consumo en México, 2015

Modelo Lineal Múltiple. Clase 03. Profesor: Carlos R. Pitta. ICPM050, Econometría. Universidad Austral de Chile Escuela de Ingeniería Comercial

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

Estimación de incertidumbres en calibración de Osciladores

CASO PRÁCTICO TEORÍA. 1 i (REGRESIÓN LINEAL CON PESOS ESTADÍSTICOS OBTENIDOS DE RÉPLICAS)

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

Un estimado de intervalo o intervalo de confianza ( IC

MODELOS DE SECUENCIACIÓN EN MÁQUINAS 1

VII. Solución numérica de ecuaciones diferenciales

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

Estructura de tabla. Crear una tabla de base de datos. Paso previo a la creación i

Tema 2.- Regresión lineal múltiple (I) Introducción 2.2. Especificación del modelo de regresión lineal múltiple. 2.3.

) para toda permutación (p p 1 p

56. Qué significan los llamados Grados de libertad 1?

Análisis de la Varianza de dos factores con replicaciones: Caso Balanceado (Scheffé, 1959)

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

CAPÍTULO IV METODOLOGÍA. Para llevar a cabo la investigación se ha tenido en cuenta el siguiente diseño:

Relaciones entre las tablas

Santiago de la Fuente Fernández. Regresión logística

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

Distribuciones de probabilidad

Facultad de Ingeniería División de Ciencias Básicas Coordinación de Ciencias Aplicadas Departamento de Probabilidad y Estadística

a) DIAGRAMA DE DISPERSION

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

EDO: Ecuación Diferencial Ordinaria Soluciones numéricas. Jorge Eduardo Ortiz Triviño

Regresión y Correlación

EJERCICIOS SOBRE INTERPOLACIÓN POLINOMIAL. x x0 y y0. Deducir la fórmula para el polinomio de Lagrange de grado a lo más uno que Interpola la tabla.

1 EY ( ) o de E( Y u ) que hace que g E ( Y ) sea lineal. Por ejemplo,

75.12 ANÁLISIS NUMÉRICO I GUÍA DE PROBLEMAS INTEGRACIÓN

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Resolución. Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos.

6.9 El trazador cúbico

En el panel de navegación, haga doble clic en el nombre de la tabla o de la consulta a la que desee agregar registros.

Tema 6: Multicolinealidad

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA

Comparación de Líneas de Regresión

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

1-5 ESTUDIO DE LA CAÍDA LIBRE

Una matriz es un conjunto de elementos de cualquier naturaleza aunque, en general, son números ordenados en filas y columnas.

3. VARIABLES ALEATORIAS.

Solución Taller No. 10 Econometría II Prof. Bernal

Transcripción:

Regresón Múltple Resumen El procedmento de Regresón Múltple está dseñado para construr un modelo estadístco descrbendo el mpacto de dos o más factores cuanttatvos X sobre una varable dependente Y. El procedmento ncluye una opcón para realzar regresón por pasos, en la cual se seleccona una de las varables X antes establecdas. El modelo colocado puede ser usado para hacer predccones, ncluyendo límtes de confanza y límtes de predccón. Los resduos pueden tambén ser grafcados observando la manera en que nfluyen. El procedmento contene opcones adconales para transformar los datos usando una transformacón Box-Cox o Cochrane-Orcutt. La prmera opcón es útl para establecer la varabldad de los datos, mentras que la segunda es útl para manejar datos de seres de tempo, en los que los resduos exhben correlacón seral. Muestra StatFolo: multple reg.sgp Datos de muestra: El archvo 93cars.sf3 contene nformacón sobre 26 varables por n = 93 marcas y modelos de automóvles, tomadas de Lock (1993). La tabla a contnuacón muestra una lsta parcal de 4 columnas de ese archvo: Mark (Marca) Model (Modelo) MPG Hghway (MPG en Autopsta) Weght (Peso) Horsepower (Caballos de fuerza) Wheelbase (Dstanca entre ejes) Drvetran Acura Integra 31 2705 140 102 frontal Acura Legend 25 3560 200 115 frontal Aud 90 26 3375 172 102 frontal Aud 100 26 3405 172 106 frontal BMW 535 30 3640 208 109 trasera Buck Century 31 2880 110 105 frontal Buck LeSabre 28 3470 170 111 frontal Buck Roadmaster 25 4105 180 116 trasera Buck Rvera 27 3495 170 108 frontal Cadllac DeVlle 25 3620 200 114 frontal Cadllac Sevlle 25 3935 295 111 frontal Chevrolet Cavaler 36 2490 110 101 frontal Se desea que un modelo pueda predecr MPG Carretera a partr de Peso, Horsepower, Wheelbase y Drvetran. 2006 por StatPont, Inc. Regresón Multple - 1

Datos de entrada La ventana de dalogo de datos de entrada necesta los nombres de las columnas que contenen la varable dependente Y y las varables ndependentes X: Varable Dependente: columna numérca que contene las n observacones para la varable dependente Y. Varables Independentes: columnas numércas que contenen los n valores para las varables ndependentes X. Pueden ser ngresados los nombres de las columnas o expresones STATGRAPHICS. Seleccón: Subconjunto a selecconar. Ponderacones: una columna numérca opconal que contene pesos para ser aplcados a los cuadrados de los resduos cuando se realce un ajuste de mínmos cuadrados ponderados. En el ejemplo, note el uso de la expresón Weght^2 para añadr un térmno de segundo orden que nvolucra el peso del vehículo. Esto fue añaddo después de examnar la gráfca X-Y que mostró una curvatura sgnfcatva con respecto a Peso. El factor categórco Drvetran ha sdo tambén ntroducdo en el modelo a través de la expresón booleana Drvetran= front, la cual establece una varable ndcadora que toma el valor de 1 s es verdadero y 0 s es falso. El modelo para ser ajustado toma la forma: MPG Carretera = β 0 + β 1 Peso + β 2 Peso 2 + β 3 Caballos de fuerza + β 4 Dstanca entre ejes + β 5 X 5 (1) 2006 por StatPont, Inc. Regresón Multple - 2

donde 1 X 5 = s 0 Drvetran = front Drvetran = rear (2) Resumen del análss El Resumen del análss muestra la nformacón acerca del modelo ajustado. Regresón Múltple - MPG Hghway Varable dependente: MPG Hghway (mles per gallon n hghway drvng) Varables ndependentes: Weght (pounds) Wenght^2 Horsepower (maxmum) Wheelbase (nches) Drve Tran="front" Error Estadístco Parámetro Estmacón Estándar T Valor-P CONSTANTE 49.8458 10.5262 4.73539 0.0000 Análss Wegght de Varanza -0.0273685 0.00530942-5.1547 0.0000 Weght^2 Fuente Suma de 0.00000261405 Cuadrados Gl 8.383E-7 Cuadrado Medo 3.11827 Razón-F 0.0025 Valor-P Horsepower Modelo 1902.180.0145764 5 0.009668 380.435 1.5076946.41 0.1353 0.0000 Wheelbase Resduo 713.1360.338687 87 0.103479 8.19696 3.273 0.0015 R-cuadrada Drve Total (Corr.) Tran="front" = 72.7323 2615.31 porcento 0.632343 92 0.73879 0.855918 0.3944 R-cuadrado (ajustado para g.l.) = 71.1652 porcento Error Estándar Est. = 2.86303 Error Absoluto medo = 2.13575 Estadístco Durbn-Watson = 1.685 (P=0.0601) Autocorrelacón de resduos en Retraso 1 = 0.156111 Están ncludas en la salda: Varables: dentfcacón de la varable dependente. La forma general del modelo es Y = β 0 + β 1 X 1 + β 2 X 2 + + β k X k (3) Donde k es el número de varables ndependentes. Coefcentes: los coefcentes estmados, errores estándar, estadístco t y P-valores. Las estmacones de los coefcentes del modelo pueden ser usadas para escrbr la ecuacón ajustada, que en el ejemplo es MPG Carretera = 49.8458-0.0273685*Peso + 0.00000261405*Peso 2 + 0.0145764*Horsepower + 0.338687*Wheelbase + 0.632343*Drve Tran="front" (4) El estadístco t evalúa la hpótess nula que corresponde al parámetro del modelo gual a 0, basado en la suma de cuadrados Tpo 3 (la suma extra de cuadrados atrbuble a cada varable s se ngresa en el modelo). P-Valores grandes (mayores que o guales a 0.05 s operan a un 2006 por StatPont, Inc. Regresón Multple - 3

nvel de sgnfcanca de 5%) ndcan que un termno puede ser descartado sn degradar sgnfcatvamente el modelo provsto de todas los demás varables en el modelo. En este caso, ambos Caballos de fuerza y Traccón no son sgnfcatvos. Por lo tanto, cualquer varable (pero no necesaramente ambas) puede ser descartada del modelo sn dañar su poder predctvo sgnfcatvamente. Análss de varanza: descomposcón de la varabldad de la varable dependente Y en un modelo de suma de cuadrados y un resduo o suma de errores cuadrátcos. De nterés partcular es el F-prueba y su asocado P-valor, el cual evalúa la sgnfcanca estadístca del modelo ajustado. Un P-valor pequeño (menor a 0.05 s se opera a un nvel de sgnfcanca de 5%) ndca que una relacón sgnfcatva de la forma especfcada exste entre Y y las varables ndependentes. En los datos de muestra, el modelo es altamente sgnfcatvo. Estadístcos: resumen de estadístcos para el modelo ajustado, ncluyendo: R-cuadrado - representa el porcentaje de varabldad de Y que se ha explcado medante el modelo ajustado de regresón, osclando de 0% a 100%. Para los datos de muestra, la regresón ha computado alrededor de 72.7% de la varabldad en las mllas por galón. El restante 27.3% es atrbudo a las desvacones del modelo, las cuales pueden aparecer debdo a otros factores, errores de medcón o fallas del modelo actual para ajustar los datos adecuadamente. R-cuadrados ajustados el estadístco R-cuadrado, ajustado para el número de coefcentes en el modelo. Este valor es regularmente usado para comparar modelos con dferentes números de coefcentes. Error estándar de Est. La desvacón estándar estmada de los resduos (las desvacones alrededor del modelo). Este valor es usado para crear límtes de predccones para nuevas observacones. Error medo absoluto el valor absoluto del promedo de los resduos. Estadístco Durbn-Watson una medda de correlacón seral en los resduos. S los resduos varían aleatoramente, este valor debe ser cercano a 2. Un P-valor pequeño ndca un patrón no aleatoro en los resduos. Para datos grabados a través del tempo, un P-valor pequeño podría ndcar que alguna tendenca a través del tempo no ha sdo computada. En el ejemplo, el P-valor es mayor que 0.05, entonces no hay una correlacón sgnfcatva al nvel de sgnfcanca de 5%. Autocorrelacón resdual Lag 1 la correlacón estmada entre resduos consecutvos, en la escala de -1 a 1. Valores lejanos de 0 ndcan que la estructura sgnfcatva permanece sn computar por el modelo. 2006 por StatPont, Inc. Regresón Multple - 4

Opcones de análss STATGRAPHICS Rev. 25/04/2007 Ajuste especfca s todas las varables ndependentes especfcadas en el cuadro de dálogo de entrada de datos debe ser ncludo en el modelo fnal, o s una seleccón de varables por pasos debe aplcarse. La seleccón por pasos trata de encontrar el mejor modelo que contenga sólo varables estadístcamente sgnfcatvas. Para la regresón por pasos. Un ejemplo de regresón por pasos es ncluda más adelante. Constante en Modelo S esta opcón no es marcada, el térmno β 0 será omtdo del modelo. Elmnar el térmno permte hacer la regresón. F para Agregar - En una regresón por pasos, las varables serán ngresadas en el modelo a un paso dado s sus F valores son mayores que o guales al valor especfcado de F para Agregar. F para Qutar En una regresón paso por paso, las varables serán elmnadas del modelo a un paso dado s sus F valores son menores que el valor especfcado de F para Qutar. Máx. Pasos número máxmo de pasos permtdo cuando se hace una regresón por pasos. Mostrar Desplegar o no los resultados a cada paso cuándo se hace una regresón por pasos. Transformacón de Box-Cox S se seleccona, una transformacón Box-Cox será aplcada a la varable dependente. Las transformacones Box-Cox son un método para manejar stuacones en las que las desvacones del modelo de regresón no tenen una varanza constante. Usted puede especfcar los parámetros Box-Cox o pedrle al programa que automátcamente encuentre la potenca óptma. Para ver más detalles, vea la documentacón Transformacones Box-Cox. Transformacón de Cochrane-Orcutt provee un mecansmo para manejar stuacones en las que los resduos del modelo no son ndependentes. Usted puede especfcar la autocorrelacón lag 1 usada en la transformacón y dejar que el programa la determne 2006 por StatPont, Inc. Regresón Multple - 5

medante teracones. La transformacón Cochran-Orcutt es lustrada más adelante en este documento. Ejemplo Regresón por pasos El modelo se ajusta a los datos de los automóvles mostrando 2 varables nsgnfcantes. Para elmnarlas del modelo se usa Opcones de análss para ejecutar una seleccón por pasos ascendente o descendente. Seleccón ascendente Comenza con un modelo que nvolucra un solo térmno constante e ngresa una varable a un tempo basado en su sgnfcanca estadístca s se añade al modelo actual. En cada paso, el algortmo trae en el modelo la varable que será estadístcamente la más sgnfcatva s se ngresa. La seleccón de varables se basa en una evaluacón de F para Agregar. La varable más sgnfcatva será traída dentro del modelo Mentras que tenga un valor F mayor o gual al especfcado en el cuadro de dálogo Resumen del análss. La seleccón de varables termna cuando nnguna varable tene un valor F sufcentemente grande. Además, las varables traídas al modelo con anterordad en el procedmento pueden ser elmnadas más tarde s sus valores F caen debajo del crtero F para Qutar. Seleccón descendente Comenza con un modelo que nvolucra todas las varables especfcadas en el cuadro de dálogo de entrada de datos y elmna una varable a la vez basándose en su mportanca estadístca en el modelo actual. En cada paso, el algortmo elmna del modelo la varable que es estadístcamente de menor mportanca. La elmnacón de las varables se basa en una evaluacón F para Qutar. S la varable menos sgnfcatva tene un valor F menor que el especfcado en el cuadro de dálogo Resumen del análss, será elmnada del modelo. Cuándo todas las varables restantes tenen valores F grandes, el procedmento se detene. Además, las varables elmnadas del modelo con anterordad medante el procedmento, pueden ser rengresadas más tarde s sus valores F alcanzan el crtero F para Agregar. En el presente ejemplo, una seleccón descendente permte lo sguente: Regresón por Pasos Método: Seleccón Haca Atrás F para Introducr: 4.0 F para Elmnar: 4.0 Paso 0: 5 varable(s) en el modelo. 87 g.l. para el error. R-cuadrado = 72.73% R-cuadrado ajustado = 71.17% CME = 8.19696 Paso 1: Elmnando varable Drve Tran="front" con F para elmnar =0.732595 4 varable(s) en el modelo. 88 g.l. para el error. R-cuadrado = 72.50% R-cuadrado ajustado = 71.25% CME = 8.17206 Paso 2: Elmnando varable Horsepower con F para elmnar =2.22011 3 varable(s) en el modelo. 89 g.l. para el error. R-cuadrado = 71.81% R-cuadrado ajustado = 70.86% CME = 8.28409 Modelo Fnal selecconado. En el prmer paso, es elmnada Traccón pues es la menos sgnfcatva. En el segundo paso, se elmna Caballos de fuerza. El algortmo entonces se detene, debdo a que todas las varables 2006 por StatPont, Inc. Regresón Multple - 6

restantes tenen valores F para elmnar las mayores a 4, y todas las anterormente elmnadas tenen valores F para ngresar menores que 4. El modelo reducdo es resumdo a contnuacón: Regresón Múltple - MPG Hghway Varable dependente: MPG Hghway (mles per gallon n hghway drvng) Varables ndependentes: Weght (pounds) Weght^2 Horsepower (maxmum) Wheelbase (nches) Drve Tran="front" Error Estadístco Parámetro Estmacón Estándar T Valor-P CONSTANTE 51.8628 10.2179 5.07569 0.0000 Weght -0.0245435 0.00506191-4.84867 0.0000 Weght^2 0.00000236841 8.25606E-7 2.86869 0.0051 Wheelbase 0.28345 0.0899993 3.14947 0.0022 Análss de Varanza Fuente Suma de Cuadrados Gl Cuadrado Medo Razón-F Valor-P Modelo 1878.03 3 626.009 75.57 0.0000 Resduo 737.284 89 8.28409 Total (Corr.) 2615.31 92 R-cuadrada = 71.809 porcento R-cuadrado (ajustado para g.l.) = 70.8587 porcento Error estándar del est. = 2.87821 Error absoluto medo = 2.19976 2006 por StatPont, Inc. Regresón Multple - 7

Estadístco Durbn-Watson = 1.67296 (P=0.0558) Autocorrelacón de resduos en retraso 1 = 0.162386 STATGRAPHICS Rev. 25/04/2007 NOTA: de aquí en adelante en este documento, los resultados se basarán en el modelo reducdo sn Drvetran o Wheelbase. Ejemplo Transformacón Box-Cox S se sospecha que la varabldad de Y camba conforme su nvel varía, es útl consderar el uso de una transformacón sobre Y. Las transformacones Box-Cox son en general de la sguente forma: Y λ ( + λ ) 1 Y = 2 (5) Donde los datos se eleven a la potenca λ 1 después de correrse una certa cantdad λ 2. Frecuentemente, el parámetro de corrmento λ 2 se establece como 0. Esta clase ncluye raíces cuadradas, logartmos, recíprocos y otras transformacones comunes, dependendo de la potenca. Ejemplos: 2006 por StatPont, Inc. Regresón Multple - 8

Potenca Transformacón Descrpcón λ 1 = 2 2 Y = Y Cuadrado λ 1 = 1 Y = Y Dato sn transformar λ 1 = 0.5 Y = Y Raíz cuadrada λ 1 = 0.333 Y = 3 Y Raíz cúbca λ 1 = 0 Y = ln(y ) Logartmo λ 1 = -0.5 1 Inverso de raíz cuadrada Y = Y λ 1 = -1 1 Y Recíproco = Y STATGRAPHICS Rev. 25/04/2007 Usando Opcones de análss, usted puede especfcar valores para λ 1 o λ 2, o sólo λ 2 y el programa encontrará el valor óptmo para λ 1 usando los métodos propuestos por Box y Cox (1964). Para los datos de muestra, una gráfca de resduos contra valores predchos muestra algún cambo en la varabldad de acuerdo a las fluctuacones del valor predcho: 4.3 Gráfco de Resduos Redduo Estudentzado 2.3 0.3-1.7-3.7 20 25 30 35 40 45 50 predcho MPG Hghway Los coches más pequeños tenden a ser un poco más varables que los coches mayores. Cuando se le pde al programa optmzar la transformacón de Box- Cox obtenemos lo sguente: 2006 por StatPont, Inc. Regresón Multple - 9

Regresón Múltple - MPG Hghway Varable dependente: MPG Hghway (mles per gallon n hghway drvng) Varables ndependentes: Weght (pounds) Weght^2 Wheelbase (nches) Transformacón Box-Cox aplcada: potenca = -0.440625 Cambo = 0.0 Error Estadístco Parámetro Estmacón Estándar T Valor-P CONSTANTE 230.703 9.37335 24.6126 0.0000 Weght -0.0129299 0.00464353-2.78451 0.0065 Weght^2 6.18885E-7 7.57367E-7 0.817153 0.4160 Wheelbase 0.229684 0.0825606 2.782 0.0066 Análss de Varanza Fuente Suma de Cuadrados Gl Cuadrado Medo Razón-F Valor-P Modelo 1568.28 3 522.761 74.99 0.0000 Resduo 620.444 89 6.97128 Total (Corr.) 2188.73 92 R-cuadrada = 71.6528 porcento R-cuadrado (ajustado para g.l.) = 70.6972 porcento Error estándar Est. = 2.64032 Error Absoluto medo = 2.08197 Estadístco Durbn-Watson = 1.70034 (P=0.0727) Autocorrelacón de resduos en Retraso 1 = 0.148826 Aparentemente, un nverso de la raíz cuadrada de MPG Carretera mejora las propedades de los resduos, como se lustra en la nueva gráfca de resduos: 2006 por StatPont, Inc. Regresón Multple - 10

Gráfco de Resduos 4.4 Redduo Estudentzado 2.4 0.4-1.6-3.6 20 25 30 35 40 45 50 predcho MPG Hghway Nota: se necesta tener cudado aquí, debdo a que la trasformacón puede verse nfluencada fuertemente por una o dos aparcones. Para smplfcar la sguente dscusón, el resto de este documento tratará con el modelo no transformado. Gráfca de efectos de componente Grafcar un modelo de regresón múltple no es tan fácl como grafcar un modelo de regresón smple, ya que el espaco de las varables X es multdmensonal. Una manera útl para lustrar los resultados es la Gráfca de efectos de componente, que grafca una porcón del modelo de regresón ajustado que corresponde a cualquer varable. 12 Gráfco Componente+Resduo para MPG Hghway efecto de componente 8 4 0-4 -8-12 90 95 100 105 110 115 120 Wheelbase La línea en la gráfca está defnda por βˆ j ( x x ) j j (6) 2006 por StatPont, Inc. Regresón Multple - 11

donde βˆ j es el coefcente de regresón estmado para la varable j, x j representa el valor de la varable j cómo se grafcó en el eje horzontal, y x j es el valor promedo de la varable ndependente selecconada entre las n observacones usadas para ajustar el modelo. Usted puede juzgar la mportanca de un factor estudando qué tanto camba el efecto de la componente sobre un rango de la varable selecconada. Por ejemplo, al cambar Wheelbase de 90 a 120, el efecto de la componente camba alrededor de -4 a +4. Esto mplca que las dferencas en Wheelbase generan una osclacón de alrededor de 8 mllas por galón. Los puntos en la gráfca anteror representan cada uno de los n = 93 automóvles en el conjunto de datos. Las poscones vertcales son guales al efecto de la componente más el resduo del modelo ajustado. Esto permte evaluar la mportanca relatva de un factor comparado con los resduos. En la gráfca anteror, algunos resduos son tan grandes como, s no es que mayores, que el efecto de Wheelbase, ndcando que otros factores mportantes pueden estar faltando en el modelo. 2006 por StatPont, Inc. Regresón Multple - 12

Panel de Opcones STATGRAPHICS Rev. 25/04/2007 Grafcar contra: el factor usado para defnr el efecto de la componente. Suma de cuadrados condconal El panel de Sumas de cuadrados condconales desplega una tabla mostrando la sgnfcanca estadístca de cada coefcente en el modelo como se va añadendo al ajuste: ANOVA adconal para Varables en el Orden Ajustado Fuente Suma de Cuadrados Gl Meda Cuadrátca Razón-F Valor-P Weght 1718.7 1 1718.7 207.47 0.0000 Weght^2 77.1615 1 77.1615 9.31 0.0030 Wheelbase 82.1713 1 82.1713 9.92 0.0022 Modelo 1878.03 3 La tabla descompone el modelo de suma de cuadrados SSR en contrbucones debdas a cada coefcente, mostrando el ncremento en SSR cuando cada térmno se añade al modelo. Estas sumas de cuadrados son regularmente llamadas Sumas de cuadrados Tpo I. Los F-rados comparan la meda cuadrada para cada térmno con el MSE del modelo ajustado. Estas sumas de cuadrados son útles cuando se ajustan modelos polnomales, como se dscute en la documentacón de Regresón Polnomal. 2006 por StatPont, Inc. Regresón Multple - 13

En la tabla anteror, todas las varables son sgnfcatvas estadístcamente al nvel de sgnfcanca de 1% porque sus P-valores están por debajo de 0.01 2006 por StatPont, Inc. Regresón Multple - 14

Observado contra Predcho La gráfca Observado contra Predcho muestra los valores observados de Y en el eje vertcal y los valores predchos Yˆ en el eje horzontal. 50 45 Gráfco de MPG Hghway observado 40 35 30 25 20 20 25 30 35 40 45 50 predcho S el modelo se ajusta ben, los puntos se deben dspersar aleatoramente alrededor de la línea dagonal. Cualquer cambo en la varabldad de los valores bajos de Y o de los valores altos de Y podría ndcar la necesdad de transformar la varable dependente antes de ajustar un modelo a los datos. En la gráfca anteror, la varabldad ncrementa al momento que los valores predchos se hacen mayores. Gráfca de resduos Al gual que con todos los modelos estadístcos, es una buena práctca el examnar los resduos. En una regresón, los resduos son defndos por: e ˆ = y y (7) Por ejemplo, los resduos son las dferencas entre los valores de los datos observados y el modelo ajustado. El procedmento Regresón múltple crea 3 gráfcas de resduos: 1. contra X. 2. contra el valor predcho Yˆ. 3. contra un número de la lsta. 2006 por StatPont, Inc. Regresón Multple - 15

Resduos contra X Esta gráfca es de gran ayuda para vsualzar cualquer curvatura que se haya perddo con respecto a la varable selecconada. 4.3 Gráfco de Resduos Redduo Estudentzado 2.3 0.3-1.7-3.7 1600 2100 2600 3100 3600 4100 4600 Weght No es obvo ver una curvatura en la gráfca anteror. Resduos contra Predchos Esta gráfca ayuda a detector cualquer heteroscedastcdad en los datos. 4.3 Gráfco de Resduos Redduo Estudentzado 2.3 0.3-1.7-3.7 20 25 30 35 40 45 50 predcho MPG Hghway La heteroscedastcdad ocurre cuando la varabldad de los datos camba según camba la meda y puede hacerse necesaro transformar los datos antes de ajustar el modelo de regresón. Regularmente queda en evdenca medante un patrón de forma embudo en la gráfca de resduos. En la gráfca anteror, se puede aprecar que la varabldad ncrementa en mllas por galón cuando los valores predchos son altos, lo que corresponde a coches pequeños. Para los coches más pequeños, las mllas por galón parecen varar más que por los coches mayores. 2006 por StatPont, Inc. Regresón Multple - 16

Resduos contra Observacón Esta gráfca muestra los resduos contra números en fla de la hoja de datos: 4.3 Gráfco de Resduos Redduo Estudentzado 2.3 0.3-1.7-3.7 0 20 40 60 80 100 número de fla S los datos son arreglados en orden cronológco, cualquer patrón en los datos puede ndcar una nfluenca externa. En la gráfca anteror, no hay presente una tendenca obva, aún cuando hay un resduo estandarzado superor a 3.5, ndcando que las desvacones estándar de la curva ajustada son mayores a 3.5. Panel de Opcones Grafcar: Los sguentes resduos pueden ser grafcados en cada gráfca de resduos: 1. Resduos los resduos del ajuste por mínmos cuadrados. 2. Resduos estudentzados la dferenca entre los valores observados y y los valores predchos ŷ cuando el modelo se ajusta usando todas las observacones excepto la - ésma, dvdda entre el error estándar estmado. Estos resduos son algunas veces llamados resduos borrados externamente, debdo a que mden que tan lejos está cada valor del modelo ajustado cuando ese modelo se ajusta usando todos los datos excepto el punto a ser consderado. Es mportante debdo a que de otra manera podrían surgr puntos 2006 por StatPont, Inc. Regresón Multple - 17

lejanos que afecten el modelo tanto que no sería extraño que apareceran muy lejos de la línea. Grafcar contra: La varable ndependente a ser grafcada en el eje horzontal, en caso de ser relevante. Resduos Atípcos Una vez que el modelo ha sdo ajustado, es útl estudar los resduos para determnar s exste algún brote que pudera ser elmnado de los datos. El panel de Resduos Atípcos enlsta todas las observacones que tenen resduos Studentzados de 2.0 o mayores en valor absoluto. Resduos Atípcos Y Resduo Fla Y Predcha Resduo Estudentzado 31 33.0 40.1526-7.15265-2.81 36 20.0 26.9631-6.96309-2.62 39 50.0 43.4269 6.5731 2.72 42 46.0 36.4604 9.53958 3.66 60 26.0 32.8753-6.8753-2.50 73 41.0 35.3266 5.67338 2.04 Los resduos estudentzados cuyo valor absoluto es mayor que 3 corresponden a puntos localzados a más de 3 desvacones estándar del modelo ajustado, lo que es un evento muy raro para una dstrbucón normal. En los datos de muestra, la fla #42 está a más de 3.5 desvacones estándar. La fla #42 es un Honda Cvc, que fue enlstado en el conjunto de datos como s alcanzara 46 mllas por galón, mentras que el modelo predce menos de 37. Los puntos pueden ser elmnados del ajuste, mentras se examna cualquera de las gráfcas de resduos, pnchando sobre un punto y después presonando el botón Exclur/Inclur en la barra de herramentas de análss. Puntos Influyentes Al ajustar un modelo de regresón, no todas las observacones tenen la msma nfluenca en el parámetro estmado en el modelo ajustado. Aquellas con valores nusuales de las varables ndependentes tenden a tener más nfluenca que las otras. El panel Puntos Influyentes desplega cualquer otra observacón que tenga una alta nfluenca en el modelo ajustado: Puntos Influyentes Dstanca de Fla Influenca Influenca meda de un Mahalanobs solo punto = 0.0430108 DFITS 19 0.134534 13.1566 0.267983 28 0.237072 27.2882 0.835252 31 0.154695 15.6643-1.20009 36 0.0936668 8.41545-0.843505 39 0.244866 28.5193 1.54944 42 0.0667751 5.5222 0.979671 60 0.0298137 1.80729-0.437436 los valores ajustados. 83 0.10049 9.17701 0.475259 Se ponen puntos en esta lsta por una de las sguentes razones: Influenca mde qué tanto dsta una observacón de la meda de las n observacones en el espaco de varables ndependentes. A mayor nfluenca, mayor el mpacto del punto sobre ŷ Se ponen puntos en la lsta s su nfluenca es al menos tres veces mayor que un punto promedo. Dstanca de Mahalanobs mde la dstanca de un punto al centro de la coleccón de puntos en el espaco multvarado de varables ndependentes. Como la dstanca está relaconada con la nfluenca, ésta no se usa para selecconar puntos para la tabla. 2006 por StatPont, Inc. Regresón Multple - 18

DFITS mde la dferenca entre los valores predchos ŷ cuando el modelo es ajustado con y sn el -ésmo punto. Los puntos se ponen en la lsta s el valor absoluto de DFITS excede 2 p / n, donde p es el número de coefcentes en el modelo ajustado. En los datos muestra, las flas #28 y #39 muestran un valor de nfluenca cerca de 6 veces el de un punto promedo. Las flas #31 y #39 tenen los mayores valores de DFITS. No se recomenda remover puntos altamente nfluyentes en una rutna básca. Sn embargo, es mportante estar concente de su mpacto en el modelo estmado. Intervalos de Confanza El panel Intervalos de Confanza muestra error de estmacón potencal asocado a cada coefcente del modelo. Intervalos de confanza del 95.0% para las estmacones de los coefcentes Error Parámetro Estmacón Estándar Límte Inferor Límte Superor CONSTANTE 51.8628 10.2179 31.5601 72.1656 Weght -0.0245435 0.00506191-0.0346015-0.0144856 Weght^2 0.00000236841 8.25606E-7 7.27941E-7 0.00000400887 Wheelbase 0.28345 0.0899993 0.104623 0.462277 Panel de Opcones Nvel de Confanza: porcentaje de nvel de los ntervalos de confanza. Matrz de Correlacón La Matrz de Correlacón desplega estmadores de la correlacón entre los coefcentes estmados. Matrz de Correlacón para las estmacones de los coefcentes CONSTANTE Weght Weght^2 Wheelbase CONSTANTE 1.0000-0.6355 0.7510-0.6832 Weght -0.6355 1.0000-0.9787-0.1232 Weght^2 0.7510-0.9787 1.0000-0.0566 Wheelbase -0.6832-0.1232-0.0566 1.0000 Esta tabla puede ser de ayuda al determnar que tan ben se han separado los efectos de varables ndependentes dstntas. Note la alta correlacón entre los coefcentes de Weght y Weght 2. Esto es normal cada vez que se ajuste un polnomo no centrado y smplemente sgnfca que los coefcentes puderon cambar dramátcamente s se hubese selecconado un polnomo de orden 2006 por StatPont, Inc. Regresón Multple - 19

dstnto. El hecho de que la correlacón entre los coefcentes de Weght y Wheelbase sea pequeña es más nteresante, pues mplca que hay un poco de confusón entre los efectos estmados de esas varables. Confundr o mezclar los efectos de dos varables es un problema común al ntentar nterpretar modelos estmados a partr de datos que no fueron recolectados a partr de un expermento dseñado. Informes El panel Informes crea predccones usando el modelo ajustado de mínmos cuadrados. Por defecto, la tabla ncluye una línea para cada fla de la hoja de datos que contene nformacón completa de las X varables y un valor faltante para la Y varable. Esto le permte añadr flas en la parte baja de la hoja de datos correspondentes a nveles a los que quere las predccones sn afectar el modelo ajustado. Por ejemplo, suponga que se desea una predccón para un carro con un Peso de 3500 y una Wheelbase de 105. En la fla #94 de la hoja de datos, esos valores serían añaddos pero la columna MPG Carretera se dejaría en blanco. La tabla resultante se muestra a contnuacón: Resultados de la Regresón para MPG Hghway Ajustado Error Est. Inferor 95.0% Superor 95.0% Inferor 95.0% Superor 95.0% Fla LC para Pronóstco LC para Pronóstco LC para Pronóstco LC para la Meda LC para la Meda 94 24.7357 2.91778 18.9381 30.5333 23.7842 25.6872 Se ncluyen en la tabla: Fla el número de fla en la hoja de datos. Valor ajustado el valor predcho de la varable dependente usando el modelo ajustado. Error estándar para Pronóstco el error estándar estmado de predecr una nueva observacón. Límtes de Confanza para Pronóstco los límtes de predccón de nuevas observacones al nvel selecconado de confanza. Límtes de Confanza para Meda límtes de confanza para el valor medo de Y al nvel de confanza selecconado. Para la fla #94, las mles per gallon predchas son 24.7. Puede esperarse que modelos con esas característcas alcancen entre 18.9 y 30.5 mllas por galón manejando en carretera. Usando el Panel de Opcones, se puede nclur nformacón adconal acerca de los valores predchos y de los resduales de los datos usados para ajustar el modelo. Panel de Opcones 2006 por StatPont, Inc. Regresón Multple - 20

Usted puede nclur: Y Observada los valores observados de la varable dependente. Y Ajustada los valores predchos a partr del modelo ajustado. Resduos los resduales ordnaros (observados menos predchos). Resduos Estudentzados los resduales studentzados borrados como se descrbó prevamente. Errores Estándar para el Pronóstco los errores estándar para nuevas observacones en valores de las varables ndependentes correspondentes a cada fla de la hoja de datos. Límtes de Confanza para Pronóstcos Indvduales ntervalos de confanza para nuevas observacones. Límtes de Confanza para Medas Pronostcadas ntervalos de confanza para el valor medo de Y a valores de las varables ndependentes correspondentes a cada fla de la hoja de datos. Gráfcas de Intervalos El panel Gráfcas de Intervalos crea varos tpos nteresantes de gráfcas. La grafca sguente muestra cómo las mles per gallon de un automóvl pueden predecrse precsamente. 50 45 Gráfco de MPG Hghway con Valores Predchos MPG Hghway 40 35 30 25 20 20 25 30 35 40 45 50 valor predcho 2006 por StatPont, Inc. Regresón Multple - 21

Se dbuja un ntervalo por cada observacón de la hoja de datos, mostrando los límtes de predccón del 95% para una observacón nueva al valor predcho correspondente. Panel de Opcones Grafcar Límtes para: tpo de límtes a nclurse. Valores Predchos grafca límtes de predccón en el escenaro de las varables ndependentes correspondentes a cada una de las n observacones usadas para ajustar el modelo. Medas grafca límtes de confanza para el valor medo de Y correspondente a cada una de las n observacones. Pronóstcos grafca límtes de predccón para flas de la hoja de datos que tengan valores para Y faltantes. Medas Predchas grafca límtes de confanza para el valor medo de Y correspondente a cada fla de la hoja de datos que tengan valores para Y faltantes. Grafcar contra: el valor a grafcar en el eje horzontal. Nvel de Confanza: el porcentaje de confanza usado para los ntervalos. Datos Autocorrelaconados Cuando se usan modelos de regresón para ajustar datos regstrados a lo largo del tempo, las desvacones del modelo ajustado son frecuentemente dependentes. Esto puede llevar a estmacones nefcentes de los coefcentes del modelo de regresón y P-valores que exageren la sgnfcanca estadístca del modelo ajustado. Como lustracón, consdere los datos sguentes de Neter et al. (1996), contendos en el archvo company.sf3: Quatre (Año y trmestre) company sales (Ventas de la Compañía, $ mllones) ndustry sales (Ventas de la Industra, $ mllones) 2006 por StatPont, Inc. Regresón Multple - 22

1983: Q1 20.96 127.3 1983: Q2 21.40 130.0 1983: Q3 21.96 132.7 1983: Q4 21.52 129.4 1984: Q1 22.39 135.0 1984: Q2 22.76 137.1 1984: Q3 23.48 141.2 1984: Q4 23.66 142.8 1985: Q1 24.10 145.5 1985: Q2 24.01 145.3 1985: Q3 24.54 148.3 1985: Q4 24.30 146.4 1986: Q1 25.00 150.2 1986: Q2 25.64 153.1 1986: Q3 26.36 157.3 1986: Q4 26.98 160.7 1987: Q1 27.52 164.2 1987: Q2 27.78 165.6 1987: Q3 28.24 168.7 1987: Q4 28.78 171.7 Hacer regresón de las ventas de las compañía contra las de la ndustra resulta en un muy buen ajuste lneal, con una R-Cuadrada muy alta: 2006 por StatPont, Inc. Regresón Multple - 23

Regresón Múltple - company sales Varable dependente: company sales Varables ndependentes: ndustry sales Error Estadístco Parámetro Estmacón Estándar T Valor-P CONSTANTE -1.45475 0.214146-6.79326 0.0000 ndustry sales 0.176283 0.00144474 122.017 0.0000 Análss de Varanza Fuente Suma de Cuadrados Gl Cuadrada Meda Razón-F Valor-P Modelo 110.257 1 110.257 14888.14 0.0000 Resduo 0.133302 18 0.00740568 Total (Corr.) 110.39 19 R-cuadrada = 99.8792 porcento R-cuadrado (ajustado para g.l.) = 99.8725 porcento Error estándar del est. = 0.0860563 Error absoluto medo = 0.0691186 Estadístco Durbn-Watson = 0.734726 (P=0.0002) Autocorrelacón de resduos en retraso 1 = 0.626005 2006 por StatPont, Inc. Regresón Multple - 24

Sn embargo, el estadístco de Durbn-Watson es muy mportante, y la autocorrelacón lag 1 estmada es gual a 0.626. Una gráfca de resduales contra número de fla muestra cambos marcados alrededor de cero. 2.7 Gráfco de Resduos Redduo Estudentzado 1.7 0.7-0.3-1.3-2.3 0 4 8 12 16 20 número de fla Claramente, los resduales no están dstrbudos aleatoramente alrededor de la línea de regresón. Para contar las autocorrelacones de las desvacones desde la línea de regresón, puede asumrse una estructura de error más complcada. Una extensón lógca del modelo de error aleatoro es dejar que los errores tengan una estructura autorregresva de prmer orden, en los que la desvacón al tempo t es dependente de la desvacón al tempo t-1 de la sguente manera: y t = β 0 + β1x t + ε t (8) ε t = ρε t 1 + ut (9) donde ρ < 1 y u t son muestras ndependentes de una dstrbucón normal con meda 0 y desvacón estándar σ. En tal caso, transformar tanto la varable dependente como la ndependente de acuerdo a t = yt yt 1 y ρ (10) t = xt xt 1 x ρ (11) lleva al modelo ( ρ) + x t ut t = 0 1 β1 y β + (12) que es una regresón lneal con térmnos de error aleatoros El cuadro de dálogo Opcones de Análss le permte ajustar un modelo de la forma anteror usando el procedmento de Cochrane-Orcutt: 2006 por StatPont, Inc. Regresón Multple - 25

Usted puede o especfcar el valor de ρ en el campo Autocorrelacón, o selecconar Optmzar y dejar que el valor de ρ sea determnado teratvamente usando el valor especfcado como un punto ncal. En el últmo caso, se usa el sguente procedmento: Paso 1: El modelo es ajustado usando valores transformados de varables basados en el valor ncal de ρ. Paso 2: El valor de ρ es re-estmado usando los valores de ε t obtendos a partr del ajuste del Paso 1. Paso 3: Los pasos 1 y 2 son repetdos entre 4 y 25 veces hasta que el cambo en el valor dervado de ρ comparado con el paso prevo sea menor que 0.01. Los resultados se resumen a contnuacón usando los datos de muestra: Regresón Múltple - company sales Varable dependente: company sales Varables ndependentes: ndustry sales Transformacón Cochrane-Orcutt aplcada: autocorrelacón = 0.91878 2006 por StatPont, Inc. Regresón Multple - 26

Error Estadístco Parámetro Estmacón Estándar T Valor-P CONSTANTE 0.832561 1.11118 0.749258 0.4639 ndustry sales 0.163206 0.0062571 26.0834 0.0000 STATGRAPHICS Rev. 25/04/2007 Análss de Varanza Fuente Suma de Cuadrados Gl Cuadrada Meda Razón-F Valor-P Modelo 2.89395 1 2.89395 680.34 0.0000 Resduo 0.0723123 17 0.00425367 Total (Corr.) 2.96627 18 R-cuadrada = 97.5622 porcento R-cuadrado (ajustado para g.l.) = 97.4188 porcento Error estándar del est. = 0.0652201 Error absoluto medo = 0.0511754 Estadístco Durbn-Watson = 1.69906 Autocorrelacón de resduos en retraso 1 = 0.119621 El resultado anteror muestra que, al valor fnal de ρ = 0.919, el estadístco de Durbn-Watson y la autocorrelacón lag 1 resdual, calculados usando los resduales de la regresón nvolucrando las varables transformadas, son mucho más en línea que o esperado s los errores fuesen aleatoros. El modelo tambén camba de algún modo. Guardar Resultados Los sguentes resultados pueden salvarse en la hoja de datos: 2006 por StatPont, Inc. Regresón Multple - 27

1. Predccones el valor predcho de Y correspondente a cada una de las n observacones. 2. Error Estándar de las Predccones los errores estándar para los n valores predchos. 3. Límte Inferor para las Predccones los límtes nferores de predccón para cada valor predcho. 4. Límte Superor par alas Predccones los límtes superores de predccón para cada valor predcho. 5. Error Estándar de las Medas los errores estándar para el valor medo de Y en cada uno de los n valores de X. 6. Límte Inferor para las Medas Pronostcadas los límtes nferores de confanza para el valor medo de Y en cada uno de los n valores de X. 7. Límte Superor para las Medas Pronostcadas los límtes superores de confanza para el valor medo de Y en cada uno de los n valores de X. 8. Resduos los n resduales. 9. Resduos Estudentzados los n resduales Studentzados. 10. Influencas los valores de nfluenca correspondentes a los n valores de X. 11. Estadístco DFITS el valor del estadístco DFITS correspondente a los n valores de X. 12. Dstancas de Mahalanobs la dstanca Mahalanobs correspondente a los n valores de X. Cálculos Modelo de Regresón Y = β + β X + β X +... + β 0 1 1 2 2 k X k (13) Suma de Errores Cuadrátcos n No ponderada: ( ˆ ˆ ˆ ˆ ) 2 SSE = y β x β x... β x = 1 β (14) n Ponderada: ( ˆ ˆ ˆ ˆ ) 2 SSE = w y β x β x... β x Coefcentes Estmados = 1 1 ( X WX ) ( X WY ) 0 0 1 1 2 2 2 2 k k β (15) ˆ β = (16) { } = MSE( X WX ) 1 s β (17) 2 ˆ SSE MSE = n p (18) k k donde βˆ es un vector columna que contene los coefcentes estmados de regresón, X es una matrz (n, p) que contene un 1 en la prmera columna (s el modelo contene un térmno constante) y las confguracones de las k varables predctoras en las otras columnas, Y es un 2006 por StatPont, Inc. Regresón Multple - 28

vector columna con los valores de la varable dependente, y W es una matrz dagonal (n, n) que contene los pesos w en la dagonal para una regresón ponderada o 1 s en la dagonal s no se especfcan los pesos. Se usa un algortmo de barrda modfcado para resolver las ecuacones luego de centrar y reescalar las varables ndependentes. 2006 por StatPont, Inc. Regresón Multple - 29

Análss de Varanza STATGRAPHICS Rev. 25/04/2007 Con térmno constante Fuente Suma de Cuadrados Df Meda Cuadrátca F-Rado n 2 SSR MSR Modelo w y k MSR = F = k MSE = 1 SSR = b X WY n w = 1 Resdual Total (corr.) SSE SSE = Y WY b X WY n-k-1 MSE = n k 1 n = 1 ( ) 2 y y SSTO = w n-1 Sn térmno constante: Fuente Suma de Cuadrados Df Meda Cuadrátca Modelo SSR SSR = b X WY k MSR = k Resdual SSE SSE = Y WY b X WY n-k MSE = n k F-Rado MSR F = MSE Total SSTO = Y WY n R-Cuadrada 2 SSR R = 100 % SSR + SSE (19) R-Cuadrada Ajustada 2 n 1 SSE R adj = 100 1 % (20) n p SSR + SSE 2006 por StatPont, Inc. Regresón Multple - 30

Error Estándar de Est. STATGRAPHICS Rev. 25/04/2007 σˆ = MSE (21) Resduales e = y ˆ β ˆ β x... ˆ β x (22) o 1 1 k k Error Absoluto Medo MAE n = 1 = n w = 1 w e (23) Estadístco de Durbn-Watson D n = 2 = n ( e e ) = 1 e 2 1 2 (24) S n > 500, entonces D 2 * D = (25) 4 / n se compara con una dstrbucón normal estándar. Para 100 < n 500, D/4 se compara con dstrbucón beta con parámetros n 1 α = β = (26) 2 Para muestras más pequeñas, D/4 se compara con dstrbucón beta con parámetros que se basan en la traza de certas matrces relaconadas con las matrz X, como lo descrben Durbn y Watson (1951) en la seccón 4 de su clásco paper. Autocorrelacón Resdual Lag 1 n ee 1 = 2 r1 = n (27) e = 1 2 2006 por StatPont, Inc. Regresón Multple - 31

Influenca STATGRAPHICS Rev. 25/04/2007 h 1 { X ( X WX ) X } w = dag (28) p h = (29) n Resduales Studentzados d = e MSE w ( 1 h ) (30) Dstanca Mahalanobs n h w / w = 1 n( n 2) MD = 1 h n 1 (31) DFITS DFITS = d w h 1 h (32) Error Estándar para Pronóstcos s { } ( 1 Y = MSE + X X WX ) X h ( new) 1 h h (33) Límte de Confanza para Pronóstcos Yˆ { Y } h ± t α / 2, n ps h ( new ) (34) Límte de Confanza para Medas h n p MSE / 2, h 1 ( X ( X WX ) X ) Yˆ ± t α (35) h 2006 por StatPont, Inc. Regresón Multple - 32