Primera práctica de REGRESIÓN.

Documentos relacionados
Segunda práctica de REGRESIÓN.

Tercera práctica de REGRESIÓN.

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Técnicas Cuantitativas para el Management y los Negocios

Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo

Análisis de Regresión no lineal

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

T R A B A J O D E I N V E S T I G A C I O N D E O P E R A C I O N E S I

Método de cuadrados mínimos

LAB 13 - Análisis de Covarianza - CLAVE

Ejemplos del Suplemento 1 resueltos con Minitab

v = V max[s] K m +[S]

Regresión con variables independientes cualitativas

log a A B = log a A + log a B

Universidade de Vigo. Linealidad. El comportamiento esperado de la variable dependiente

Métodos Estadísticos Multivariados

Análisis de Regresión y Correlación con MINITAB

9. REGRESIÓN LINEAL. Dr. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

Cointegración El caso bivariado

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

4.1 Análisis bivariado de asociaciones

ESTADÍSTICA. Tema 4 Regresión lineal simple

Regresión con Variables Ficticias

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

1. Cómo introducir datos en SPSS/PC? - Recordatorio

1. Caso no lineal: ajuste de una función potencial

Diplomatura en Ciencias Empresariales X Y

Práctica 9 REGRESION LINEAL Y CORRELACIÓN

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS AGRICOLA, PECUARIAS Y DEL MEDIO AMBIENTE ECAPMA

Trabajando en la ventana de comandos en el programa gretl.

Estadística I. Finanzas y Contabilidad

Antes de iniciar el tema se deben de tener los siguientes conocimientos básicos:

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Chapter Audio Summary for McDougal Littell Algebra 2

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

2 Resolución de algunos ejemplos y ejercicios del tema 2.

Tema 1: Otros tipos de ecuaciones. En este tema trataremos otras ecuaciones distintas a las de primer y segundo grado.

Bloque 1. Aritmética y Álgebra

EJERCICIOS PROPUESTOS - ANÁLISIS DE REGRESION MULTIPLE

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

Multiple Linear Regression

El Análisis de Correspondencias tiene dos objetivos básicos:

Modelos de Regresión y Correlación

Correlación entre variables

Regresión. Teresa Villagarcía

Materia: Matemáticas de 4to año. Tema: Logaritmos naturales y base 10. Marco Teórico

ANOVA (Análisis de varianza)

2. OPERACIONES ALGEBRAICAS BÁSICAS.

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

2. El Modelo de Regresión Lineal Simple

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Proceso de análisis de regresión múltiple

FUNCIONES EXPONENCIAL Y LOGARÍTMICA

En la notación C(3) se indica el valor de la cuenta para 3 kilowatts-hora: C(3) = 60 (3) = 1.253

Análisis de datos del Aguacate Hass (presentación caja 10 kilogramos)

Departamento de Matemática Aplicada Matemáticas Licenciatura en CC. Químicas (Curso ) Estadística unidimensional con EXCEL.

Utilizamos el fichero importado

Práctica de AJUSTE DE DISTRIBUCIONES II (ajuste de datos)

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Tema 3. Relación entre dos variables cuantitativas

log = = Las ecuaciones de cancelación cuando se aplican las funciones f x = a x y f 1 = log a x, se convierten en:

CAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA

Instrucciones de uso de EViews.

Aplicaciones de Estadística Descriptiva

Tema 3 Álgebra Matemáticas I 1º Bachillerato. 1

Introducción al Análisis de Series Temporales

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Práctica 1: Introducción a MATLAB.

CLAVE-LAB 3-Supuestos del Análisis de la Varianza

Trabajando en la ventana de comandos en el programa gretl.

Tema 3. Modelo de regresión simple. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 3: Regresión simple 1

Regresión con variables cualitativas

T0. TRANSFORMADAS DE LAPLACE

Transformaciones de Box-Cox

ANÁLISIS DE DATOS MULTIVARIANTE

APUNTES DE QUIMIOMETRIA REGRESIO LINEAL

Tema 7: Geometría Analítica. Rectas.

Regresión Lineal Simple

FUNCIONES POLINÓMICAS

RESOLUCIÓN DE SISTEMAS MEDIANTE DETERMINANTES

SISTEMAS DE ECUACIONES LINEALES. Método de reducción o de Gauss. 1º DE BACHILLERATO DPTO DE MATEMÁTICAS COLEGIO MARAVILLAS AUTORA: Teresa González.

A c) Determinantes. Ejercicio 1. Calcula los siguientes determinantes:

1. Conocimientos previos. 1 Funciones exponenciales y logarítmicas.

Experiencia P33: Intensidad de la Luz frente a distancia Sensor de Luz, Sensor de Movimiento rotatorio

Análisis de datos Categóricos

Variables estadísticas bidimensionales: problemas resueltos

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

Álgebra y Trigonometría Clase 4 Inversas, exponenciales y logarítmicas

6 Sexta. 6.1 Parte básica. Unidad Didáctica "REGRESIÓN Y CORRELACIÓN"

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

LA PARIDAD DEL PODER DE COMPRA ENTRE PERÚ y ESTADOS ( )

REGRESION simple. Correlación Lineal:

Regresión con heterocedasticidad y autocorrelación

Transcripción:

Primera práctica de REGRESIÓN. DATOS: fichero practica regresión 1.sf3 1. Objetivo: El objetivo de esta práctica es aprender cuándo se puede utilizar el análisis de regresión. En la primera parte se presentan unos conjuntos de datos para que decidir si son adecuados o no. Esta decisión ha de tomarse teniendo en cuenta si los datos cumplen las hipótesis del modelo (Linealidad, homocedasticidad...) En caso de que no las cumplan será preciso transformar los datos hasta conseguir que cumplan las hipótesis. Este proceso se desarrolla en el apartado 2 de la práctica. Finalmente en el tercer apartado, se van a ajustar algunas regresiones simples. El objetivo es aprender a hacer el ajuste con datos adecuados y leer la ecuación de regresión. La interpretación y contrastes será el objetivo de la segunda práctica. 2. Análisis gráfico y transformaciones. Vamos a utilizar el fichero practica regresión 1.sf3. El fichero contiene 6 pares de variables X-Y. El aspecto del fichero es: El primer paso en cualquier regresión es comprobar las hipótesis del modelo: a. Linealidad.

Los datos deben ser lineales, lo que implica que su gráfico de dispersión XY debe presentar un aspecto razonablemente recto. Para realizar el gráfico se pincha en PLOT-SCATTERPLOTS-XY PLOT: También puede hacerse directamente pinchando en el icono SCATTERPLOT:

Se abre el menú del gráfico y seleccionamos las variables adecuadas: Si hacemos un gráfico de dispersión con los datos de las variables X1-Y1 obtenemos: 8 Plot of Y1 vs X1 6 Y1 4 2 4 8 12 16 2 X1 Este gráfico presenta un aspecto claramente lineal por lo que los datos X1, Y1 cumplen la primera hipótesis. b. Hipótesis de homocedasticidad: Los datos deben tener la misma varianza (grosor) por lo que el aspecto en el gráfico de dispersión debe ser de grosor constante. En el caso que estamos estudiando,

Plot of Y1 vs X1 8 6 Y1 4 2 4 8 12 16 2 X1 vemos que el grosor de los datos es constante. Por lo que se cumple la segunda hipótesis. Si los datos hubieran sido: (X 1,E6) 1,8 Y,6,4,2 2 4 6 8 (X 1) X la dispersión (grosor) no sería constante y no se cumpliría la segunda hipótesis. Estos datos requieren una transformación. c. Hipótesis de independencia. Esta hipótesis es muy importante. Simplemente hay que tener en cuenta que la regresión no es adecuada para ser utilizada con datos temporales. Por ejemplo, no se debe aplicar la regresión a datos como los siguientes:

Año Coches vendidos (Miles) Teléfonos vendidos (Miles) 1981 768 124 1982 78 135 1983 793 236 1984 81 397 1984 799 45 1986 83 457 Los datos temporales son aquellos en cada observación se refiere a un periodo de tiempo concreto. d. Hipótesis de Normalidad Esta hipótesis se comprobará en la diagnosis del modelo (en la segunda práctica) Transformaciones: Si los datos no cumplen las hipótesis, es preciso transformarlos. Vamos a hacer un gráfico de las variables X2-Y2 del fichero de prácticas: Y2 6 5 4 3 2 1 Plot of Y2 vs X2 4 8 12 16 2 24 X2 Evidentemente estos datos no son lineales. Es preciso transformarlos. Para ver qué transformación es necesaria, en el menú del gráfico de dispersión se van probando diversas transformaciones. Las más habituales son: Logaritmos: Log(X1) o Log(Y1) Logaritmo de ambas variables. Exponenciales: exp(x1) o exp(y1) Inversas: 1/Y1 o 1/X1 Cuadrados: (X1)^2 o (Y1)^2 Raíz cuadrada: SQRT(X1) o SQRT(Y1) En nuestro caso la transformación adecuada es Log(Y2) frente X2 sin transformar. En el menú del gráfico de dispersión se escribe en el lugar de la variable Y log(y2). En el lugar de la variable X se escribe X2.

Obteniendo un gráfico lineal y homocedástico. 8 Plot of log(y2) vs X2 6 log(y2) 4 2 4 8 12 16 2 24 X2 En este caso, habrá que ajustar el modelo de regresión: log( yi ) = β + β1xi + u i Primera parte de la práctica: Estudiar las parejas de variables X1-Y1, X2- Y2, etc y determinar si cumplen las hipótesis de linealidad y homocedasticidad para realizar el análsis de regresión. En caso de que no las cumplan, transformar las variables hasta obtener una relación lineal y homocedástica.

Variable Variable Trasformación de X Transformación de Y X1 Y1 No es necesario No es necesario X2 Y2 No es necesario Log(Y2) X3 Y3 X4 Y4 X5 Y5 X6 Y6 3. Regresión simple. Ajuste Una vez que los datos son normales y homocedásticos hay que ajustar un modelo de regresión. El proceso es muy simple: Se pincha en RELATE-SIMPLE REGRESIÓN Se obtiene un menú que pide la variable Y y la variable X:

El resultado es: La ventana de la izquierda presenta la regresión. Pinchando dos veces sobre la ventana se amplía.

Regression Analysis - Linear model: Y = a + b*x Dependent variable: Y1 Independent variable: X1 Standard T Parameter Estimate Error Statistic P-Value Intercept 84,271 9,29135 9,6974, Slope 3,412,79758 37,6654, Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 3,2929E6 1 3,2929E6 1418,68, Residual 227468, 98 2321,1 Total (Corr.) 3,5236E6 99 Correlation Coefficient =,967153 R-squared = 93,5385 percent Standard Error of Est. = 48,1778 La ecuación de regresión se obtiene en la columna Estimate. El valor Intercept es la estimación de la constante y Slope el valor de la pendiente. En este caso la regresión vale: yˆ = 84.27 + 3 i x i ŷ indica valor previsto de Y para i x. i Si hubiéramos realizado la regresión con los datos X2-Y2, en los que era preciso transformar Y2 a Log(Y2), tendríamos que haber puesto en el menú de regresión como variable Y, la transformación Log(Y2).

Y el resultado es: Regression Analysis - Linear model: Y = a + b*x Dependent variable: log(y2) Independent variable: X2 Standard T Parameter Estimate Error Statistic P-Value Intercept,6838,797732 7,62547, Slope,249962,665152 37,5798, Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 227,979 1 227,979 1412,24, Residual 15,822 98,161431 Total (Corr.) 243,799 99 Correlation Coefficient =,96711 R-squared = 93,511 percent Standard Error of Est. =,41784 log( + yˆ ) =,61. 25x 2 i 2 i Segunda parte de la práctica: Estimar las regresiones simples para las parejas de variables X1-Y1, X2-Y2, etc teniendo en cuenta las transformaciones adecuadas que se encontraron en la primera parte de la práctica.

Variable Variable X1 Y1 X2 Y2 X3 Y3 Regresión: yˆ = 84.27 + 3 x i i yˆ ) =,61. 25x 2 i 2 i log( + X4 X5 X6 Y4 Y5 Y6