Práctica 2: Regresión lineal

Documentos relacionados
Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

ESTADÍSTICA. Tema 4 Regresión lineal simple

1. Cómo introducir datos en SPSS/PC? - Recordatorio

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

Teoría de la decisión

Regresión y Correlación

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

Laboratorio 2: Análisis de datos bivariantes

ESTADÍSTICA CON EXCEL

Método de cuadrados mínimos

Matemáticas. Selectividad ESTADISTICA COU

El ejemplo: Una encuesta de opinión

Tercera práctica de REGRESIÓN.

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Variables estadísticas bidimensionales: problemas resueltos

Tema Contenido Contenidos Mínimos

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

FUNCIONES Y GRÁFICAS

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Tema 3. Relación entre dos variables cuantitativas

El Análisis de Correspondencias tiene dos objetivos básicos:

Relación entre la altura y la distancia del suelo al ombligo

ADMINISTRACION DE OPERACIONES

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7.

1. Caso no lineal: ajuste de una función potencial

5. Regresión Lineal Múltiple

Práctica 1: Introducción a SPSS 1

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Tema 2. Descripción Conjunta de Varias Variables

Diplomatura en Ciencias Empresariales X Y

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

4. Regresión Lineal Simple

Repaso Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

2.- Tablas de frecuencias

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

INDICE. Prólogo a la Segunda Edición

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

ESTADISTICA Y PROBABILIDAD. 1. Encuentra la media, moda, mediana, desviación estándar y varianza de la siguiente distribución de números

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Tema 1.- Correlación Lineal

Laboratorio de Física para Ingeniería

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

EJERCICIOS PAU MATEMÁTICAS II ANDALUCÍA Autor: Fernando J. Nora Costa-Ribeiro Más ejercicios y soluciones en fisicaymat.wordpress.

HOJA DE CÁLCULO EXCEL

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Doc. Juan Morales Romero

Métodos Estadísticos Multivariados

Tema 2: Estadística Descriptiva Bivariante.

Diagramas de Dispersión simples

Estadística aplicada a la comunicación

Práctica No 12. Determinación experimental de la Presión de vapor de un líquido puro

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

MÓDULO 1: GESTIÓN DE CARTERAS

ACTIVIDADES SELECTIVIDAD APLICACIONES DERIVADAS

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Tema 2. Regresión Lineal

Guía de Problemas de Equilibrio de Fases Métodos de estimación de coeficientes de actividad Termodinámica de Ingeniería Química

EJERCICIOS PAU MATEMÁTICAS II ARAGÓN Autor: Fernando J. Nora Costa-Ribeiro Más ejercicios y soluciones en fisicaymat.wordpress.com

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Tema 7: Estadística y probabilidad

MATEMÁTICAS 2º DE ESO

UNIDAD II. VARIACION DIRECTAMENTE PROPORCIONAL Y FUNCIONES LINEALES

CLASE 10: RESUMEN DEL CURSO

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

Solución: Las rectas paralelas a estas tienen la misma pendiente, es decir 2; por tanto la ecuación es:

I. E. S. ATENEA. SAN SEBASTIÁN DE LOS REYES EXAMEN GLOBAL. PRIMERA EVALUACIÓN. ANÁLISIS

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

4.1 Análisis bivariado de asociaciones

Representación y aplicaciones de las funciones tipo

PROGRAMACIÓN DE LOS CONTENIDOS DE MATEMÁTICAS EN LA PREPARACIÓN DE LA PARTE COMÚN DE LA PRUEBA DE ACCESO A LOS C.F.G.S. (Opción C)

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

En la notación C(3) se indica el valor de la cuenta para 3 kilowatts-hora: C(3) = 60 (3) = 1.253

Análisis matemático de la función de Nelson y Siegel

Práctica 9 REGRESION LINEAL Y CORRELACIÓN

UN PROBLEMA DE OPTIMIZACIÓN CON CABRI: LA REGRESIÓN LINEAL.

Y accedemos al cuadro de diálogo Descriptivos

CDEE. Cuestiones 3er Ejercicio. 0 si x 1. k(x + 1) + x2 1. k(x + 1) x si x > 1

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I)

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

Criterios de evaluación 3º de ESO. Matemáticas Orientadas a las Enseñanzas Aplicadas

Representaciones gráficas: Método del Paralelogramo

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Un segundo ohmímetro mide la misma resistencia y obtiene los siguientes resultados: R B1 = ( 98 ± 7 ) Ω R B2 = ( 100 ± 7 ) Ω R B3 = ( 103 ± 7 ) Ω

Laboratorio Nº 1 La Descripción Gráfica de la Ecuación Diferencial Ordinaria

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

La recta en el plano.

Ministerio de Educación Pública Dirección de Gestión y Evaluación de la Calidad Departamento de Evaluación Académica y Certificación.

CONTENIDOS MÍNIMOS SEPTIEMBRE. DEPARTAMENTO DE MATEMÁTICAS

Transcripción:

Prácticas de estadística con R Ingeniería Química Universidad de Cantabria Curso 2011 2012 Práctica 2: Regresión lineal R también permite trabajar conjuntamente con más de una variable. En particular esta sección se centra en el caso de 2 variables con el fin de estudiar el comportamiento de una de ellas a partir de otra. 1. Análisis descriptivo de variables bidimensionales En primer lugar construimos la tabla de doble entrada con dos variables que seleccionamos del fichero Pulso.rda como son Actividad y Fumar. Esta tabla se construye a partir del menú Estadísticos Tablas de Contingencia Tabla de doble entrada. Se abre una ventana de dialogo en la que podemos seleccionar dichas variables en filas o columnas. Entre otras opciones, esta ventana también nos permite elegir si queremos que en la tabla aparezcan las frecuencas absolutas (Sin porcentajes) o bien las frecuencias relativas en porcentajes (Porcentajes totales). Del resultado de la tabla podemos ver que la mayoría de las personas que realizan una actividad media o alta son no fumadores. Con el fin de analizar la relación entre variables también resulta interesante la realización de distintos tipos de gráficos como es el diagrama de dispersión analizado en clase. En este caso vamos a analizar la relación que existe entre las variables Peso y Altura. En el menú Gráficos encontramos la opción Diagrama de dispersión. Por defecto aparece marcada la opción línea suavizada, que ofrece una regresión a los puntos bajo el criterio de mínimos cuadrados. La orden que genera el gráfico de la figura 1 es la siguiente: > scatterplot(peso~altura, reg.line=lm, smooth=false, labels=false, boxplots= xy, span=0.5, data=pulsaciones) A la vista de la figura, se deduce que existe una relación lineal directa entre ambas variables. Además se observa que la figura muestra los diagramas de cajas correspondientes a las dos variables. Para confirmar la existencia de una alta correlación entre las variables vamos a calcular el coeficiente de correlación de Pearson seleccionando en el menú Estadísticos Resúmenes Test de correlación. En el cuadro de diálogo se deben elegir las variables correspondientes (Peso y Altura en este ejemplo). > cor.test(altura, Peso, alternative= two.sided, method= pearson ) Como ya esperábamos el coeficiente de correlación es relativamente alto y positivo (0.7848664) lo que 1

Peso 50 60 70 80 90 155 160 165 170 175 180 185 190 Altura Figura 1: Diagrama de dispersión de las variables Peso y Altura del fichero Pulso.rda. confirma la relación directa entre las variables. 1) Hacer un diagrama de dispersión de la Altura frente al Peso separando por sexos y responder a las siguientes preguntas: 1. Aumenta en la misma proporción el peso con la altura en los hombres y en las mujeres? 2. Cuál de los dos grupos presenta un valor de la correlación mayor? a Indicar el valor en cada caso. a En este caso se necesita filtrar los datos por Sexo antes de calcular el coeficiente de correlación. 2) Representar un diagrama de dispersión de Pulso1 frente al Pulso2. 1. Añadir un título apropiado. 2. Qué sugiere el gráfico sobre la relación entre estas dos variables? 3. Añadir Correr como variable de agrupamiento. 4. Difiere mucho la relación Pulso1-Pulso2 entre correr o no? 2

2. Regresión lineal En el menú Estadísticos Ajuste de modelos Regresión lineal, podemos obtener los parámetros de la recta de ajuste (Y = a + bx) del Peso en función de la Altura que se muestra en la figura 1. En la ventana de diálogo tendremos que seleccionar la variable explicada o dependiente y la variable explicativa o independiente que en este ejemplo corresponden al Peso y la Altura, respectivamente. > RegModel.1 <- lm(peso~altura, data=pulsaciones) > summary(regmodel.1) A partir de la tabla de los Coeficientes podemos obtener los parámetros de la ecuación de la recta de ajuste que resulta ser: (Y = 92,95231 + 0,9101X). Si únicamente se quieren obtener los coeficientes de la recta bastaría con escribir: > RegModel.1 <- lm(peso~altura, data=pulsaciones) > coef(regmodel.1) El dato del coeficiente de determinación R-squared, dado por R 2 = S2 (ŷ), indica la proporción de la S 2 (y) variación total de la variable dependiente Y que es explicada por el modelo de regresión o que se debe a la variación en la variable independiente X. Su valor está confinado en el intervalo [0,1] y da información de la bondad del ajuste. Cuanto más próximo esté el valor a 1 mejor se ajusta el modelo a los datos. Normalmente este valor se da en tanto por ciento. 3) Calcular la ecuaciones de la recta de ajuste del Peso y la Altura agrupados por Sexo y contestar a las siguientes preguntas: 1. Escribir la ecuación resultante para las mujeres. 2. Cuál es la pendiente de la recta obtenida en el caso de los hombres? 3. Para que Sexo el modelo se ajusta mejor? Por qué? 3

4) Un ciclista se desplaza en línea recta con un movimiento uniforme para el cual según las leyes de la mecánica su posición x en un instante t vendrá dada por la ecuación x = x 0 + vt donde x 0 es la posición inicial y v la velocidad. Se han tomado los siguientes valores de su posición x en metros y el tiempo t en segundos: A partir de estos datos estimar: 1. el coeficiente de correlación x (metros) 14 26.2 37.7 51 61.8 76 84.2 t (segundos) 2 4 6 8 10 12 14 2. los valores de la posición inicial y la velocidad del ciclista por medio de una regresión lineal. 3. el espacio que recorrido por el ciclista transcurridos 9 segundos. 4. el error estandar de la estimación y la fracción de varianza explicada por el modelo. 2.1. Transformaciones de modelos no lineales En algunos casos es posible, mediante la aplicación de determinadas transformaciones, expresar la relación entre dos variables mediante un modelo lineal. Un ejemplo, son los modelos exponencial (Y = ae bx ) y potencial (Y = ax b ) que se linealizan mediante la aplicación de logaritmos permitiendo así su resolución mediante el método de mínimos cuadrados que acabamos de ver. Como ejemplo, programaremos la resolución del siguiente ejercicio: En la siguiente tabla se recogen datos de un experimento en el que se ha analizado el tiempo de secado de un tipo de pintura dependiendo de la cantidad añadida de un compuesto que reduce el tiempo de secado. Tiempo de secado (horas) 12 10.5 10 9 8.5 8 7.5 7.2 7 Aditivo (gramos) 1 2 3 4 5 6 7 8 9 Sabiendo que la relación entre la variable tiempo (T) y la cantidad de aditivo (C) se expresa mediante un modelo del tipo T = βc α siendo β y α dos constantes, responder a las siguientes cuestiones: 1. dibuje un diagrama de dispersión para verificar que es razonable suponer que la relación es de tipo potencial. 2. los valores de β y α. 3. el tiempo de secado de la pintura cuando se mezclan 9.5 gramos de aditivo. En primer lugar introducimos los datos: 4

t<-c(12,10.5,10, 9, 8.5, 8, 7.5, 7.2, 7) c<-c(1,2,3,4,5,6,7,8,9) Identificamos la variable dependiente (x) y la independiente (y) y calculamos los logaritmos de cada una para transformar el modelo potencial a lineal (log(t ) = log(β) + b log(c)). x<-log(c) y<-log(t) Estimamos los parámetros del modelo de regresión lineal para las variables calculadas x e y. fit <- lm(y~x) a <- fit$coeff[1];a beta<-exp(a);beta b <- fit$coeff[2];b Construimos las funciones de ambos modelos para hacer la representacion fx <- function(x) exp(a) * x^b fxrecta <- function(x) a+b*x Representamos los valores de los datos originales y transformados y ajustamos el modelo correspondiente a cada caso a partir de los parámetros calculados. pdf("pintura.pdf", width=7, height=3) par(mfrow=c(1,2), mar=c(4,4,1,1)) plot(c,t, xlab="c", ylab="t", type="n") curve(fx, col="blue",lwd=4,add=true) points(c,t, pch=19, col="red") plot(x,y, xlab="log(c)", ylab="log(t)", type="n") curve(fxrecta, col="blue",lwd=4,add=true) points(x,y, pch=19, col="red") dev.off() 5) En un experimento se han recogido los siguientes datos de presión de un gas para varios valores de su volumen, mantiendo constante la temperatura. V (mm 3 ) 54.3 61.8 72.4 88.7 118.6 194.0 P (mm de Hg) 61.2 49.5 37.6 28.4 19.2 10.1 Los principios de la termodinámica relacionan los valores de volumen (V) y presión (P) de un proceso adiabático mediante la expresión P V γ = C siendo γ y C dos constantes. Calcular: 1. Los valores de γ y C expresando la presión en función del volumen. 2. Estimar el valor de la presión para un volumen de 90 mm 3 3. Representar los valores de los datos originales y transformados y las líneas de ajuste obtenidas en cada caso. 5