TALLER DE INTRODUCCIÓN A LOS NEGOCIOS

Documentos relacionados
TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

Análisis de regresión y correlación lineal

AJUSTE PLANTEAMIENTO DEL PROBLEMA

Lección 3. Análisis conjunto de dos variables

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Análisis de Regresión y Correlación Lineal

4.1 Análisis bivariado de asociaciones

Análisis de regresión lineal simple

ANÁLISIS DE REGRESIÓN

3 Regresión y correlación lineales

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Capitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

Método de cuadrados mínimos

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Tema 2. Regresión Lineal

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Tema 3: Análisis de datos bivariantes

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Teoría de la decisión

1 JESTADIS\REGRES.DOC

Tema 2: Análisis de datos bivariantes

Coeficiente de Correlación

Unidad IV Introducción a la Regresión y Correlación

Regresión lineal

Tema 2: Análisis de datos bivariantes

Estadística Inferencial

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

Prueba de Hipótesis. Para dos muestras

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

que represente lo mejor posible la relación entre valores X e Y permitiéndonos inferir un valor a partir del otro.

ESTADISTICA AVANZADA MODULO I

Estadística Estadística descriptiva bivariante

Modelo de Regresión Lineal Simple

La línea recta: Serie1

Unidad Temática 3: Estadística Analítica. Unidad 9 Correlación y Regresión Lineal Simple

U ED Tudela Introducción al Análisis de Datos - Tema 5

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

CORRELACIÓN LINEAL SIMPLE

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS

ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS

3. RELACION ENTRE DOS CONJUNTOS DE DATOS.

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Definición de Correlación

4. Regresión Lineal Simple

Julio Deride Silva. 4 de junio de 2010

Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

ESTADÍSTICA. Tema 4 Regresión lineal simple

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

Tema 2. Descripción Conjunta de Varias Variables

APUNTES SOBRE SERIES HISTÓRICAS O CRONOLÓGICAS

Estadística de dos variables

U ED Tudela Introducción al Análisis de Datos - Tema 4

PyE_ EF1_TIPO1_

Regresión lineal simple y correlación

ANÁLISIS DE REGRESIÓN N LINEAL

Distribuciones bidimensionales

Universidad Nacional Abierta Estadística Aplicada (Cód. 746) Vicerrectorado Académico Cód. Carrera: Área de Matemática Fecha:

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.

UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez. Facultad Nacional de Salud Pública Héctor Abad Gómez

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN

Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda.

Unidad 3. Separacion de costos fijos y costos variables. Objetivos especificos de aprendizaje

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE

ADMINISTRACION DE OPERACIONES

5. Regresión Lineal Múltiple

1. DEFINICIONES BÁSICAS

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

Pruebas estadís,cas para evaluar relaciones

Tema 3. Relación entre dos variables cuantitativas

Regresión Lineal Simple. Dr. Víctor Aguirre Torres, ITAM. Guión 11.

Regresión y Correlación

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Tema 4. Regresión lineal simple

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Relación entre la altura y la distancia del suelo al ombligo

Matemáticas Aplicadas I: Ev2 Recuperación febrero 2018

Tema VII. La predicción de variables

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias

ESTADÍSTICA Hoja 2

2. ESTADÍSTICAS BIDIMENSIONALES

Generalmente, el objetivo de cualquier estudio de econometría es la. búsqueda de relaciones matemáticas que permitan explicar el comportamiento

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

ESTADÍSTICA Hoja 2

ESTADÍSTICA. DISTRIBUCIÓN BIDIMENSIONAL

Lectura No. 8. Contextualización. Nombre: Métodos de Análisis ANÁLISIS FINANCIERO 1

PRESENTACIÓN. Los Autores

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

GUIA DE EXCEL PARA ANÁLISIS ESTADÍSTICO BÁSICO DE DATOS EXPERIMENTALES

REGRESIÓN LINEAL SIMPLE

Transcripción:

REGRESIÓN LINEAL SIMPLE INTRODUCCIÓN Si sabemos que existe una relación entre una variable denominada dependiente y otras denominadas independientes (como por ejemplo las existentes entre: la experiencia profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de personas, la producción agraria y la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que la dependiente asuma múltiples valores para una combinación de valores de las independientes. La dependencia a la que hacemos referencia es relacional matemática y no necesariamente de causalidad. Así, para un mismo número de unidades producidas, pueden existir niveles de costo, que varían empresa a empresa. Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresión en los cuales se obtiene una nueva relación pero de un tipo especial denominado función, en la cual la variable independiente se asocia con un indicador de tendencia central de la variable dependiente. Cabe recordar que en términos generales, una función es un tipo de relación en la cual para cada valor de la variable independiente le corresponde uno y sólo un valor de la variable dependiente. REGRESIÓN SIMPLE Y CORRELACIÓN ASPECTOS TEÓRICOS La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple. 1

"Y es una función de X" Y = f(x) TALLER DE INTRODUCCIÓN A LOS Como Y depende de X, Y es la variable dependiente, y X es la variable independiente. En el Modelo de Regresión es muy importante identificar cuál es la variable dependiente y cuál es la variable independiente. En el Modelo de Regresión Simple se establece que Y es una función de sólo una variable independiente, razón por la cual se le denomina también Regresión Divariada porque sólo hay dos variables, una dependiente y otra independiente y se representa así: Y = f (X) "Y está regresando por X" La variable dependiente es la variable que se desea explicar, predecir. También se le llama REGRESANDO ó VARIABLE DE RESPUESTA. La variable Independiente X se le denomina VARIABLE EXPLICATIVA ó REGRESOR y se le utiliza para EXPLICAR Y. ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEAL SIMPLE En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación: Y = a + b X + e 2

Donde: a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y. b es el coeficiente de regresión poblacional (pendiente de la línea recta) e es el error SUPOSICIONES DE LA REGRESIÓN LINEAL 1. Los valores de la variable independiente X son fijos, medidos sin error. 2. La variable Y es aleatoria 3. Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y) 4. Las variancias de las subpoblaciones Y son todas iguales. 5. Todas las medias de las subpoblaciones de Y están sobre la recta. 6. Los valores de Y están normalmente distribuidos y son estadísticamente independientes. Ejemplos: Recta de mejor ajuste (Recta de regresión) Empezamos intentando construir una función lineal de demanda. Suponga que su investigación de mercado muestra las siguientes estadísticas de venta para casas de varios precios durante el año pasado: Precio (Miles de dólares) 160 180 200 220 240 260 280 Ventas de nueva casas este año 126 103 82 75 82 40 20 Queremos utilizar estos datos para construir una función de demanda para el mercado de los bienes raíces. (Recuerde que una función de demanda especifica la demanda, y, medida aquí por ventas anual, como una función del precio, x.) Aquí está una traza de y contra x: 3

Los datos sugiera una recta, más o menos, y entonces una relación lineal entre y y x. Aquí son varias rectas que se acercan a los puntos: P Cuál recta ajusta los puntos lo más estrechamente que posible? 4

R Nos gustaría que las ventas que pronosticara la recta (los valores pronosticados) estuvieran tan cerca como fuera posible de las ventas reales (los valores observados). Las diferencias entre los valores esperados y los valores pronosticados, que son los errores residuales, son las distancias verticales que se marcan in la figura más abajo. Error residual = Valor observado - Valor pronosticado P Entonces como podemos hacerlo? R Sumamos primero todos los cuadrados de los errores residuales para obtener un solo error que se llama el suma de los errores al cuadrado (SSE -- siglas en inglés de "Sum of Squares Error") y escogemos la recta que se da el más pequeño valor de SSE. Esta recta se llama la recta de mejor ajuste, recta de regresión, o recta de mínimos cuadrados asociada a los datos. Ejemplo 1: Calculando SSE para una recta dada Supóngase que nos gustaría calcular SSE para una recta especifica, como y= x+300 como mostrada más abajo: 5

Tenemos la siguiente tabla de valores: Entonces, para la recta y= x+300 6

SSE = Suma de los valores de errores residuales = - 14-17 - 18-5 + 22 + 0 + 0 = -32 P Muy bien. Ahora sabemos cómo se calcula el valor de SSE para una recta ya dada. Cómo hallamos la recta de mejor ajuste; es decir, la recta para que SSE es lo menor? R Presentaremos aquí la formula que la determina. Justificarla necesita cálculo; puede consultar el capítulo de funciones de varias variables en Cálculo Aplicado para una explicación detallada. El uso de las formulas as bastante fácil, como se muestra el siguiente ejemplo. 7

Ejemplo 2: Calculando la recta de regresión a mano Determine la recta de regresión asociada a los siguientes datos: X 1 2 3 4 Y 1.5 1.6 2.1 3.0 TALLER DE INTRODUCCIÓN A LOS Solución Para aplicar las formulas, es mejor organizar los datos en forma de tabla como sigue: (Cuando ha rellenado los valores de xy y x2 correctamente, pulse "Sumas" para obtener la suma de cada columna.) Sustituyendo los valores correctos de la tabla más arriba en las formulas, obtenemos Por lo tanto, la recta de regresión es: y=0 5x+0 8 Antes de seguir... Aquí esta una traza de los pontos de dados y la recta de regresión. 8

Observe que ni siquiera pasa la recta por uno de los puntos, pero es la recta que se ajusta mejor a los puntos. Regresamos a los datos sobre la demanda para el mercado de los bienes raíces con la que empezamos este tema. Ejemplo 3: Función de demanda Obtenga la ecuación de demanda que se ajusta mejor a los siguientes datos, y úsela para pronosticar ventas anuales de casas preciadas a $140,000. Precio (Miles de dólares) 160 180 200 220 240 260 280 Ventas de nueva casas este año 126 103 82 75 82 40 20 Solución Aquí esta una tabla como la que usamos más arriba para organizar las calculaciones: 9

Sustituyendo estos valores en la formula (con n=7), obtenemos Observe que usamos el valor más exacto que pudimos obtener en la calculadora, m 0 7928571429, en lugar del valor redondeado ( 0 7929) en la calculación de b. Eso ilustra la siguiente regla general: Al calcular, no redondee los resultados intermedios; en vez de eso, utilice los resultados más exactos que puede obtener, usando los valores guardados en su computadora o calculadora si es posible. Por lo tanto, la recta de regresión es y= 0 7929x+249 9 10

Ahora podemos utilizar esta ecuación pronosticar las ventas anuales de casa cuyo precio es $140,000: Ventas anuales de casas preciadas a $140,000 = 139 X= Precio en miles de dólares = 140. Pues y=-0.7929(140)+249.9=139 Antes de seguir... Más abajo está una traza de la recta de regresión. P Si mis puntos están en una recta, está la recta de mejor ajuste? R Sí. Si los puntos están en una recta, el valor mínimo posible de SSE es cero, y eso sucede si se usa la recta que pasa por todos los puntos. Una consecuencia de este hecho es que se puede usar la herramienta regresión en su graficadora para calcular la ecuación de la recta que pasa por dos puntos especificados. P Si no todos los untos están en una recta, cómo puedo saber cuánto se acercan a una recta? R Hay un número que mide la "bondad de ajuste" de la recta de regresión llamado coeficiente de correlación. Este número, que se representa por r, está entre 1 y 1. Cuanto más se acerca r a 1 o 1, el ajuste es mejor. Si el ajuste es malo, se acerca r a 0. Si el ajusto es 11

exacto, r= 1 para una recta con pendiente negativa, o r=1 para una recta de pendiente positiva. La figura más abajo muestra varios conjuntos de puntos con sus rectas de regresión, y los valores correspondientes de r. El coeficiente de correlación se puede calcular con la siguiente formula. Para obtener la se requieren buenos conocimientos de estadística. Estimación de la recta de regresión y del coeficiente de determinación En la práctica, los cálculos relacionados con un análisis de regresión se efectúan por medio de programas de computadora, por lo que los cálculos detallados en esta sección se incluyen únicamente a título de ilustración. Para estimar los coeficientes por medio de mínimos cuadrados, se utilizan las siguientes fórmulas (DATOS AL FINAL DEL DOCUMENTO): 12

En nuestro ejemplo, aplicando estas fórmulas tenemos: Expresando los resultados en términos de la recta de regresión, tenemos: Podemos concluir que por cada milla adicional recorrida, los costos de operación aumentan en aproximadamente 4.5 centavos esto podría interpretarse como el costo marginal para la empresa de recorrer una milla adicional mientras que el coeficiente b0 nos estaría indicando la parte del costo mensual que no varía directamente con la cantidad de millas recorridas (aproximadamente 64,960 libras mensuales). Diagrama de dispersión 13

Coeficiente de Determinación (R 2 ). Una pregunta importante que se plantea en el análisis de regresión es la siguiente: Qué porcentaje de la variación total en Y se debe a la variación en X? En otras palabras, cuál es la proporción de la variación total en Y que puede ser explicada por la variación en X? El estadístico que mide esta proporción o porcentaje se denomina coeficiente de determinación: En este caso, al hacer los cálculos respectivos, se obtiene un valor de 0.946. Esto significa que la variación en las millas recorridas explica 94.6 % de la variación en el gasto de operación mensual. 14