PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

Documentos relacionados
PRÁCTICA 4. REGRESIÓN CURVILÍNEA. INTRODUCCIÓN DE VARIABLES ARTIFICIALES EN REGRESIÓN LINEAL

ESTADÍSTICA. Tema 4 Regresión lineal simple

Teoría de la decisión

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Tipo de punta (factor) (bloques)

1. Cómo introducir datos en SPSS/PC? - Recordatorio

Regresión con variables independientes cualitativas

Método de cuadrados mínimos

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

Práctica 9 REGRESION LINEAL Y CORRELACIÓN

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

REGRESIÓN LINEAL CON SPSS

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Métodos Estadísticos Multivariados

Grado en NHyD 23 de junio de 2014

Análisis de la varianza ANOVA

Capítulo 8. Análisis Discriminante

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

4.1 Análisis bivariado de asociaciones

Modelo Econométrico sobre el Turismo

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Tercera práctica de REGRESIÓN.

MODELO DE REGRESIÓN LINEAL Y MÚLTIPLE ESTADÍSTICA APLICADA AL MEDIO AMBIENTE Grado en Ciencias Ambientales

Regresión con variables cualitativas

Doc. Juan Morales Romero

Análisis Probit. StatFolio de Ejemplo: probit.sgp

El Análisis de Correspondencias tiene dos objetivos básicos:

Análisis de Componentes de la Varianza

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

CLASE 10: RESUMEN DEL CURSO

INDICE. Prólogo a la Segunda Edición

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Diagramas de Dispersión simples

Análisis de regresión lineal simple

Práctica 9: Anova (2).

ÍNDICE INTRODUCCIÓN... 21

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

CAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo

Bioestadística. Tema 3: Estadística descriptiva bivariante y regresión lineal. Relaciones entre variables y regresión

Estadística aplicada a la comunicación

Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp

Estadísticos Aplicados en el SPSS 2008

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara

Diplomatura en Ciencias Empresariales X Y

TEMA 3: Contrastes de Hipótesis en el MRL

Inferencia estadística III. Análisis de Correlación. La inferencia estadística también se puede aplicar para:

Tema 2. Descripción Conjunta de Varias Variables

478 Índice alfabético

Técnicas Cuantitativas para el Management y los Negocios

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Tema: Medidas de Asociación con SPSS

Repaso Estadística Descriptiva

Tema 3. Relación entre dos variables cuantitativas

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

Transformaciones de Box-Cox

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL

El Modelo de Regresión Simple

Práctica 2: Intervalos de confianza y contrastes con SPSS 1

Segunda práctica de REGRESIÓN.

GUÍA DOCENTE DE LA ASIGNATURA ESTADÍSTICA APLICADA

REGRESION simple. Correlación Lineal:

Práctica 5 MÉTODOS DESCRIPTIVOS PARA DETERMINAR LA NORMALIDAD

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Scientia Et Technica ISSN: Universidad Tecnológica de Pereira Colombia

y = b 0 + b 1 x b k x k

DISTRIBUCIONES BIDIMENSIONALES

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Carrera: EMM Participantes Representante de las academias de ingeniería Electromecánica de los Institutos Tecnológicos.

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Evaluación de Regnum 25 EC en el cultivo de maíz para la producción de grano. Rodolfo Alberto Rubio Chávez. Maíz (Zea mays)

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Cómo se hace la Prueba t a mano?

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

PROPUESTA DE PROYECTO DE ESTADÍSTICA: UN MODELO DE REGRESIÓN LINEAL SIMPLE PARA PRONOSTICAR LA CONCENTRACIÓN DE CO2 DEL VOLCÁN MAUNA LOA

Regresión lineal múltiple

Análisis de Regresión

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

ENUNCIADOS DE PROBLEMAS

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

Transcripción:

PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar los datos? 3.5 Estudio de las hipótesis requeridas para utilizar este modelo 3.6 Inferencias para los parámetros 3.7 Inferencias para las predicciones 3.8 Ejercicio Ejemplo: Con los datos del archivo miel.sav vamos a estudiar un modelo de regresión lineal simple que permita predecir la acidez total a partir de la acidez libre. M. Carmen Carollo, Beatriz Pateiro Página 1

3.1. Gráfico de dispersión Dibujamos un gráfico de dispersión de la acidez total (AcTot) frente a la acidez libre (AcLib). Gráficos/Dispersión-puntos Eje de las X: Acidez libre Eje de las Y: Acided total. Establecer marcas por: zona M. Carmen Carollo, Beatriz Pateiro Página 2

3.2. Ajuste de un modelo de regresión lineal simple Ajustamos un modelo de regresión lineal simple para explicar la acidez total (AcTot) frente a la acidez libre (AcLib). Analizar/egresión/ Lineal Variable dependiente: Acidez total. Método: introducir Obtenemos la tabla siguiente tabla de coeficientes: Model Coeficientes no estandarizados B Error típ. Constante 4.469 1.260 aclib.990.036 Que nos lleva a que la recta ajustada es la siguiente: Yˆ = 4.469 + 0.990X 3.3. Porcentaje de variabilidad explicado Veamos qué porcentaje de variabilidad de la acidez total queda explicada por la acidez libre. Dentro del procedimiento anterior el SPSS nos da la siguiente tabla de resumen: esumen del modelo Model cuadrado cuadrado corregida Error típ. de la estimación.960(a).922.921 2.6762 a Variables predictoras: (Constante), aclib M. Carmen Carollo, Beatriz Pateiro Página 3

Vemos que la acidez libre nos explica el 92,2% de la variabilidad de la acidez total. 3.4 Es adecuado este modelo para ajustar los datos? El modelo es adecuado si podemos afirmar que existe dependencia lineal entre las dos variables. De la tabla de los coeficientes vemos que b=.990 es distinto de cero por lo que parece que hay una relación lineal. Además es positivo por lo que la relación es directa. Sin embargo no sabemos si ese coeficiente es significativamente distinto de cero. Para comprobarlo debemos realizar el contraste de regresión. H 0 1 : β = 0 H : β 0 En este caso este contraste equivale a contrastar que el coeficiente de correlación poblacional es significativamente distinto de cero. Dentro del procedimiento anterior el SPSS nos da la siguiente tabla : ANOVA Model o Suma de cuadrados gl Media cuadrática F Sig. 1 egresión 5442.731 1 5442.731 759.928.000 esidual 458.379 64 7.162 Total 5901.110 65 El valor de F =759,928 tiene un P_valor igual a 0 < 0,05 por lo que rechazamos la hipótesis nula y concluimos que la dependencia lineal es estadísticamente significativa. Por lo tanto el modelo es adecuado. M. Carmen Carollo, Beatriz Pateiro Página 4

3.5 Estudio de las hipótesis requeridas para utilizar este modelo Veamos si se cumplen las hipótesis requeridas, es decir: normalidad, independencia y homocedasticidad. Normalidad: Analizar/egresión/ Lineal Gráficos/Gráficos residuos tipificados/histograma y gráfico de probabilidad normal Obtenemos las dos gráficas siguientes las cuales parecen indicar normalidad. Para el contraste de normalidad: Analizar / Estadísticos descriptivos / Explorar Gráficos: > Gráficos con pruebas de normalidad para: los residuo tipificados (que debemos tener guardados con la opción GUADA) Obtenemos la siguiente tabla: Standardized esidual Pruebas de normalidad Kolmogorov-Smirnov a a. Corrección de la significación de Lilliefors Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig.,107 66,061,959 66,027 M. Carmen Carollo, Beatriz Pateiro Página 5

Con K-S aceptamos normalidad, con S-W no. Nos quedamos con que son normales pues n> 30. Independencia: Para comprobar la independencia obtenemos el estadístico de Durbin-Watson: Analizar / egresión / Lineal Estadísticos: Durbin-Watson esumen del modelo(b) Model o cuadrado cuadrado corregida Error típ. de la estimación Durbin- Watson 1.960(a).922.921 2.6762 1.624 a Variables predictoras: (Constante), aclib D-W =1.624, está entre 1.5 y 2.5 y entonces concluimos que los residuos son incorrelados. Homocedasticidad Para comprobar la homocedasticidad dibujaremos un diagrama de dispersión de las estimaciones (valores predichos por el modelo) tipificadas (ZPED) frente a los residuos tipificados (ZESID) (Aquí entiende los ZESID aunque no los hayamos guardado con anterioridad) Analizar/egresión/ Lineal Gráficos: Eje Y: residuos tipificados (ZESID) Eje X: valores predichos por el modelo tipificados (ZPED) M. Carmen Carollo, Beatriz Pateiro Página 6

El gráfico no presenta ningún patrón. Aceptamos igualdad de varianzas. 3.6 Inferencias para los parámetros Analizar/egresión/ Lineal Estadísticos: Intervalos de confianza Modelo Coeficientes no estandarizados B Coeficient es tipificados Coeficientes a Intervalo de confianza de 95,0% B Error típ. Beta t Sig. Límite inferior Límite superior Constante 4,469 1,260 3,547,001 1,952 6,987 aclib,990,036,960 27,567,000,918 1,062 a. Variable dependiente: actot Los dos coeficientes son significatívamente distintos de cero pues para los dos casos el P_valor es < 0,05. Las dos últimas columnas nos dan los correspondientes intervalos de confianza. M. Carmen Carollo, Beatriz Pateiro Página 7

3.7 Inferencias para la predicción a) Cuál sería el valor medio de la Acidez Total predicho para una Acidez Libre igual a 30,03? Dar el intervalo de confianza para esa predicción y el error que se comete en la estimación. En este caso, Aclibre= 30,03 es uno de los datos de la muestra. Entonces tanto el valor medio predicho como el intervalo de confianza pueden ser obtenidos directamente en el proceso de ajuste con el SPSS (En GUADA activar: valores pronosticados no tipificados; residuos tipificados; intervalos de pronóstico para la media y para los individuos. Todos estos resultados aparecen en vista de datos). El valor medio predicho es 34,19 (ver valores pronosticados). El intervalo de confianza es (33,48 34,91) (ver intervalos de pronóstico para la media). El error que se comete en la estimación es (34,91-33,48)/2 = 0,715 b) Cuál sería el valor predicho para la acidez total si consideramos la acidez libre media? La recta pasa por siempre por el centro de gravedad de los datos. Estadísticos descriptivos N Media actot 66 37,998 aclib 66 33,8727 N válido (según lista) 66 Entonces: Yˆ = Y = 37,998 M. Carmen Carollo, Beatriz Pateiro Página 8

3.8 Ejercicio Con los datos de la miel el investigador tiene interés en establecer una relación lineal entre la variable azuhum y la humedad. a) Tiene sentido plantearse un modelo de regresión? Por qué? b) Obtener la recta de regresión tomando como variable dependiente azuhum y como independiente la humedad. c) Cuál sería el valor medio de azuhum predicho para un grado de humedad de 17,8? Dar el intervalo de confianza para esa predicción y el error que se comete en la estimación. d) Qué valor tomaría la variable azuhum si considerásemos el grado medio de humedad? e) Hacer un estudio de los residuos. M. Carmen Carollo, Beatriz Pateiro Página 9