5. Regresión Lineal Múltiple

Documentos relacionados
Estadística para la toma de decisiones

ESTADÍSTICA. Tema 4 Regresión lineal simple

Estadística para la toma de decisiones

Estadística FAD - 15 Galaz Lorca, Mirtha Kazmier, Leonard Hanke, John; Wichern, Dean

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

2. Análisis de varianza

Tema 1.- Correlación Lineal

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

6. Series de tiempo. Introducción. Serie de tiempo. Componentes de una serie de tiempo

Tema 2. Descripción Conjunta de Varias Variables

UNIVERSIDAD CENTROAMERICANA JOSE SIMEON CAÑAS FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ADMINISTRACIÓN DE EMPRESAS

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Matemáticas Universitarias

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Funciones. Catedrática Recinto Universitario de Mayagüez AFAMaC Residencial Sept. 4 de 2010

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

ESTADÍSTICA GUÍA PROGRAMÁTICA (EDICIÓN 2016) L ICDA.CL AUDIA J U DIT H MORAL E S L ÓPE Z

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

APÉNDICE I. Calibración de la señal cromatográfica como función de la concentración: Sistema Ternario

Programa de Asignatura Estadística

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Medidas de dispersión

PENDIENTE MEDIDA DE LA INCLINACIÓN

FUNCIONES 1. DEFINICION DOMINIO Y RANGO

Pontificia Universidad Católica del Ecuador Facultad de Ingeniería

Regresión múltiple. Modelos y Simulación. I. Introducción II. Marco teórico III. Aplicación IV. Conclusiones V. Bibliografía

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Un número índice simple, mide del cambio que se produce en un artículo o servicio en particular entre dos períodos.

PROBABILIDAD Y ESTADISTICA

ACTIVIDAD DE APRENDIZAJE

FUNDAMENTOS DEL ÁLGEBRA. Folleto De Trabajo Para La Clase ECUACIONES LINEALES EN DOS VARIABLES

Indicaciones para el lector... xv Prólogo... xvii

MÓDULO 1: GESTIÓN DE CARTERAS

Tema 8. Análisis de dos variables Ejercicios resueltos 1

DIAGRAMA DE FLUJO. Pasos: DEFINICIÓN:

PROGRAMA ANALITICO Y DE EXAMENES FINALES

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

1. CURSO: ESTADÍSTICA DESCRIPTIVA Y NOCIONES DE ESTADÍSTICA INFERENCIAL. 2. EN EL MARCO DE ACTIVIDADES DE POSGRADO: Acreditado para Doctorado.

2.- Tablas de frecuencias

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

En la notación C(3) se indica el valor de la cuenta para 3 kilowatts-hora: C(3) = 60 (3) = 1.253

TÉCNICO SUPERIOR UNIVERSITARIO EN PROCESOS INDUSTRIALES ÁREA SISTEMAS DE GESTIÓN DE LA CALIDAD EN COMPETENCIAS PROFESIONALES

LISTA DE COTEJO TRABAJO Nº 2 CALIFICACIÓN

Funciones y gráficas (1)

Exactitud y Linearidad del Calibrador

UNIVERSIDAD INTERAMERICANA DE PUERTO RiCO VICEPRESIDENCIA DE ASUNTOS ACADEMICOS, ESTUDIANTILES Y PLANIFICACION SISTEMICA

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

CAPITULO II ANÁLISIS DEL CRECIMIENTO POBLACIONAL Y CALCULO DE CAUDALES DE DISEÑO

Matemáticas Avanzadas I

Estadística para la toma de decisiones

Facultad de Ciencias Sociales - Universidad de la República

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UN PROBLEMA DE OPTIMIZACIÓN CON CABRI: LA REGRESIÓN LINEAL.

Tercera práctica de REGRESIÓN.

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

La distribución de Probabilidad normal, dada por la ecuación:

USO HERRAMIENTAS EXCEL PARA LA PREDICCION

SITUACIÓN DEL EMPLEO Y LA DESOCUPACIÓN

SILABO Estadística (Plan de Estudios vigente 2004)

SECRETARIA DE EDUCACIÓN DE TAMAULIPAS SUBSECRETARIA DE PLANEACIÓN DIRECCIÓN DE EVALUACIÓN TABLA DE ESPECIFICACIONES PARA CONSTRUIR REACTIVOS

1º CURSO BIOESTADÍSTICA

1. IDENTIFICACION DE LA ASIGNATURA

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

A qué nos referimos con medidas de dispersión?

MATEMÁTICAS 9. TALLER DE FUNCIONES No 1

Para analizar datos económicos a menudo es necesario buscar relaciones entre las variables económicas. Para estas relaciones podemos usar:

7 Código: MAT 2 Duración del Ciclo en Semanas: 2 Duración /Hora Clase: 50 Académico:

1. Caso no lineal: ajuste de una función potencial

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos

Técnicas de Planeación y Control

UNIDAD 6. Estadística

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

Curso de nivelación Estadística y Matemática

Notas de clase A. Leonardo Bañuelos Saucedo Nayelli Manzanarez Gómez

Colegio Decroly Americano Matemática 7th Core, Contenidos I Período

EC = (f(x) p 1 )dx EP = (p 1 g(x))dx. El valor promedio de una función y = f(x) en su dominio [a, b], viene dado por. V P = 1 b.

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

CONTENIDOS MÍNIMOS SEPTIEMBRE. DEPARTAMENTO DE MATEMÁTICAS

2. Calcula las raíces o soluciones para cada ecuación cuadrática.

11. Introducción a la teoría de decisiones

No es otra cosa, que la representación de los resultados de una función sobre el plano carteciano.

El coste de producción. Sofía Jaramillo, Michel Jabbour, Juan David Guevara

Problemas. 1.- Se muestran en seguida las tasas de interés para 12 meses consecutivos de Bonos corporativos triple A.

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual

Conceptos básicos estadísticos

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

TÉCNICO SUPERIOR UNIVERSITARIO EN DESARROLLO DE NEGOCIOS

Modelos matemáticos y estadística para la toma de decisiones en marketing

MODELO DE REGRESIÓN LINEAL Y MÚLTIPLE ESTADÍSTICA APLICADA AL MEDIO AMBIENTE Grado en Ciencias Ambientales

Análisis de datos Categóricos

Transcripción:

1 5. Regresión Lineal Múltiple Introducción La regresión lineal simple es en base a una variable independiente y una dependiente; en el caso de la regresión línea múltiple, solamente es una variable dependiente y más de una independiente. Análisis de regresión múltiple Técnica para desarrollar la ecuación de regresión y proporcionar los valores estimados para más de una variable independiente. Desde el punto de vista de la matemática, una ecuación lineal tiene la forma de Y=a + bx; en donde b se conoce como la pendiente de la ecuación y a es el intercepto en el eje Y. La fórmula general de una ecuación de regresión lineal se denota como: ECUACIÓN DE REGRESIÓN MÚLTIPLE Y = a + b 1 X 1 + b 2 X 2 + + b n X n Donde: Y : Valor de pronóstico X i : Variables independientes a : Intersección en Y b i : Pendientes de la ecuación de regresión múltiple Las tablas que forman la muestra tendrían la siguiente forma: Descripción (Y) (X 1 ) (X 2 ) (X 3 ) Si la ecuación solamente tiene dos variables independientes, su notación será la siguiente: ECUACIÓN DE REGRESIÓN MÚLTIPLE DE 3 VARIABLES. Y = a + b 1 X 1 + b 2 X 2 Los coeficientes b i se obtienen mediante el método de mínimos cuadrados; pero, usualmente se utilizan paquetes estadísticos para obtener los resultados. Entre los paquetes más populares se puede mencionar: - Excel - Minitab - SPSS - PhStat2 - SAS

2 Ejemplo 5.1 1. Suponer que el rendimiento por galón de combustible de un vehículo tiene una relación directa con el octanaje de la gasolina (X 1 ) y una relación inversa con el peso del automóvil (X 2 ). El valor de pronóstico indica la cantidad de millas por galón que recorrería el vehículo y la ecuación de regresión lineal múltiple es la siguiente: Y = 6. 3 + 0. 2X 1 0. 001X 2 Calcular el pronóstico para un vehículo con peso de 2,000 libras y con 92 octanos. Clasificación de las variables: X 1 = 92 Octanaje X 2 = 2000 Peso del vehículo Y = 6. 3 + 0. 2X 1 0. 001X 2 Y = 6. 3 + 0. 2(92) 0. 001(2000) Y = 6. 3 + 18. 4 2 Y = 22. 7 El automóvil recorre 22.7 millas por galón 2. El director de marketing en Productos Ivory estudia las ventas mensuales de la Distribuidora Internacional; seleccionó tres variables independientes como estimadores de las ventas: población regional, ingreso per cápita y la tasa de desempleo regional. La ecuación de regresión se calculó (en dólares): Y = 64100 + 0. 394X 1 + 9. 6X 2 11600X 3 Cuáles son las ventas anuales estimadas para una región particular con una población de 796,000 habitantes, un ingreso per cápita de L.6,940 y una tasa de desempleo de 6% Clasificación de las variables X 1 = 64100 Población regional X 2 = 6940 Ingreso per cápita X 3 = 6. 0 Tasa de desempleo Y = 64100 + 0. 394X 1 + 9. 6X 2 11600X 3 Y = 64100 + 0. 394(64100) + 9. 6(6940) 11600(6) Y = 374 748 Las ventas anuales que se podrían obtener son de 374 748 dólares

3 Error estándar de estimación múltiple Por lo general, no todos los puntos del diagrama de dispersión están ubicados sobre la recta que resulta de la ecuación de regresión lineal; en el trazo de toda ecuación de regresión siempre se presenta un error por las múltiples variaciones que se presentan; a este error se le llama Error estándar de estimación. ERROR ESTÁNDAR DE ESTIMACIÓN: Medida de dispersión de los valores observados respecto de la recta de regresión. (Lind Marchal Wathen, 2008, p.478). Si el error estándar de la estimación es pequeño, los datos están relativamente cercanos a la recta de la ecuación de regresión lineal y significa que se predice Y con poco error; si es grande, los datos están muy dispersos de la recta de la ecuación de regresión lineal y no proporciona una estimación precisa de Y. 2 ERROR ESTÁNDAR DE LA ESTIMACIÓN (Y Y ) MÚLTIPLE n (k + 1) Donde: Y : Observación actual Y : Valor de pronóstico n : Tamaño de la muestra k : Número de variables independientes Ejemplo 5.2 1. En una empresa inmobiliaria de desea determinar el gasto de electricidad durante el invierno en la costa este de Estados Unidos. Al departamento de investigación se le pidió desarrollar algunas directrices respecto de los costos de calefacción de casas unifamiliares. Se considera que tres variables se relacionan con los costos de calefacción: 1) la temperatura externa diaria media, 2) el número de pulgadas de aislamiento en el ático y 3) la antigüedad en anos del calentador. Para el estudio, se seleccionó una muestra aleatoria de casas de venta reciente. Se determinó el costo de calefacción de cada casa en enero pasado, así como la temperatura externa en enero en la región, el número de pulgadas de aislamiento en el ático y la edad del calentador. Obteniendo los siguientes resultados: Casa Costo de Calefacción $ (Y) externa media F (X 1 ) Aislamiento del ático (Pulg.) (X 2 ) Antigüedad del calentador (años) (X 3 ) 1 250 35 3 6 2 360 29 4 10 3 165 36 7 3 4 43 60 6 9 5 92 65 5 6 6 200 30 5 5 7 200 10 6 7 8 355 7 10 10

4 La ecuación para calcular el pronóstico es la siguiente: Y = 427. 194 4. 583X 1 14. 83X 2 + 6. 101X 3 Calcular el error estándar de la estimación. - Calcular el pronóstico de la tabla: Casa 1 250 35 3 6 258.9 2 360 29 4 10 296.0 3 165 36 7 3 176.7 4 43 60 6 9 118.1 5 92 65 5 6 91.8 6 200 30 5 5 246.1 7 200 10 6 7 335.1 8 355 7 10 10 307.8 1,830.4 - Calcular el error estándar de la estimación 2 (Y Y ) n (k + 1) 1830. 4 8 (3 + 1) 1830. 4 4 s Y X = 21. 39 Costo de Calefacción $ (Y) externa media F (X 1 ) Aislamiento del ático (Pulg.) 2. Celulon, fabricante de aislamiento para casas, desea desarrollar guías para informar a constructores y consumidores sobre la forma como el espesor del aislamiento en el ático de una casa y la temperatura externa afectan el consumo de gas natural. En el laboratorio se varió el espesor del aislamiento y la temperatura, algunos resultados fueron: Consumo de gas mensual (pies cúbicos) Y Espesor del aislamiento (pulgadas) X 1 externa ( F) 30.3 6 40 26.9 12 40 22.1 8 49 25.3 10 41 Con base en los resultados muestrales, la ecuación de regresión es: Y = 62. 65 1. 86X 1 0. 52X 2 (X 2 ) Calcular el error estándar de la estimación X 2 antigüedad del calentador (años) (X 3 ) Pronóstico Y

5 Calcular el pronóstico de la tabla Espesor del aislamiento (pulgadas) Consumo de gas mensual (pies cúbicos) Y 94.80 - Calcular el error estándar de la estimación 2 (Y Y ) n (k + 1) 94. 80 4 (2 + 1) 94. 8 1 s Y X = 9. 74 X 1 externa ( F) X 2 30.3 6 40 30.58 26.9 12 40 19.42 22.1 8 49 22.18 25.3 10 41 22.62 Y Coeficiente de determinación múltiple Porcentaje de variación en la variable dependiente, Y, explicada por el conjunto de variables independientes, X 1, X 2, X 3,, X k. Las características del coeficiente de determinación múltiple son: 1. Se representa por una letra R mayúscula al cuadrado. En otras palabras, se escribe como R 2 debido a que se comporta como el cuadrado de un coeficiente de Correlación. 2. Puede variar de 0 a 1. Un valor cercano a 0 indica poca asociación entre el conjunto de variables independientes y la variable dependiente. Un valor cercano a 1 significa Una asociación fuerte. 3. No puede adoptar valores negativos. Ningún número que se eleve al cuadrado o se eleve a la segunda potencia puede ser negativo. 4. Es fácil de interpretar. Como R2 es un valor entre 0 y 1 es fácil de interpretar, comparar y comprender. El coeficiente de determinación se calcula a partir de la información determinada en la Tabla ANOVA. Se utiliza la columna de suma de cuadrados normal la suma de cuadrados de la regresión. R 2 = VT VT + VA

6 BIBLIOGRAFÍA o Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGraw-Hill o David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para Administración. (4 edición). Naucalpan de Juárez, México.: Pearson Prentice Hall