Definición de Correlación

Documentos relacionados
15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

ESTADÍSTICA. Tema 4 Regresión lineal simple

Tema 2. Descripción Conjunta de Varias Variables

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

UN PROBLEMA DE OPTIMIZACIÓN CON CABRI: LA REGRESIÓN LINEAL.

Scientia Et Technica ISSN: Universidad Tecnológica de Pereira Colombia

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Tema 1.- Correlación Lineal

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

5 Relaciones entre variables.

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

MATEMÁTICAS APLICADAS A LAS CC. SOCIALES I. Examen de la tercera evaluación. Nombre y apellidos Fecha: 10 de junio de 2010

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Medidas de dispersión

REGRESIÓN LINEAL CON SPSS

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Regresión con variables independientes cualitativas

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Tercera práctica de REGRESIÓN.

Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

ÍNDICE INTRODUCCIÓN... 21

Correlación entre variables

DEPARTAMENTO DE QUÍMICA ANALÍTICA Y TECNOLOGÍA DE ALIMENTOS ANALISIS INSTRUMENTAl I

UNIDAD 6. Estadística

y = b 0 + b 1 x b k x k

478 Índice alfabético

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

Descripción conjunta de varias variables

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

Tema 3.1: Modelo lineal general: hipótesis y estimación. Universidad Complutense de Madrid 2013

PROGRAMA ACADEMICO Ingeniería Industrial

Repaso de conceptos de álgebra lineal

El Modelo de Regresión Simple

Tema 8. Análisis de dos variables Ejercicios resueltos 1

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

4,2 + 0,67 Y c) R 2 = 0, En la estimación de un modelo de regresión lineal se ha obtenido:

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias.

Tema 2: Estadística Descriptiva Bivariante.

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

REGRESION simple. Correlación Lineal:

Máster en comunicaciones. Clase 2. Modelos predictores.

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

PROGRAMA ANALITICO Y DE EXAMENES FINALES

PATH ANALYSIS. Luis M. Carrascal Depto. Biodiversidad y Biología Evolutiva MUSEO NACIONAL DE CIENCIAS NATURALES

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso.

CAPÍTULO 4 TÉCNICA PERT

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Tema 3. Modelo de regresión simple. Estadística (CC. Ambientales). Profesora: Amparo Baíllo Tema 3: Regresión simple 1

Diplomatura en Ciencias Empresariales X Y

MÓDULO 1: GESTIÓN DE CARTERAS

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

Hipótesis en el modelo de regresión lineal por Mínimos Cuadrados Ordinarios

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

UNIVERSIDAD NACIONAL DE FORMOSA FACULTAD DE HUMANIDADES

INTRODUCCIÓN DIAGRAMA DE DISPERSIÓN. Figura1

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

UNIVERSIDAD CENTROAMERICANA JOSE SIMEON CAÑAS FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ADMINISTRACIÓN DE EMPRESAS

TEMA 3: DISTRIBUCIONES BIDIMENSIONALES. CORRELACIÓN Y REGRESIÓN.

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

MODELO DE REGRESIÓN LINEAL Y MÚLTIPLE ESTADÍSTICA APLICADA AL MEDIO AMBIENTE Grado en Ciencias Ambientales

Exactitud y Linearidad del Calibrador

CONTENIDOS MÍNIMOS SEPTIEMBRE. DEPARTAMENTO DE MATEMÁTICAS

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

PROBLEMAS DE CRECIMIENTO Y DECRECIMIENTO.

Modelos de Regresión y Correlación

Modelo Econométrico sobre el Turismo

Regresión Lineal Simple

USO HERRAMIENTAS EXCEL PARA LA PREDICCION

Coeficiente de correlación semiparcial

Distribución Chi (o Ji) cuadrada (χ( 2 )

Transformaciones de Box-Cox

Análisis de datos Categóricos

EJERCICIOS DE SELECTIVIDAD LOGSE en EXTREMADURA MATRICES, DETERMINANTES Y SISTEMAS DE ECUACIONES

PRÁCTICA 3: Ejercicios del capítulo 5

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Análisis de Regresión Lineal Simple para Predicción. (Simple Linear Regression Analysis for Prediction)

PROGRAMACIÓN DE LOS CONTENIDOS DE MATEMÁTICAS EN LA PREPARACIÓN DE LA PARTE COMÚN DE LA PRUEBA DE ACCESO A LOS C.F.G.S. (Opción C)

1º CURSO BIOESTADÍSTICA

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

Unidad Nº 3. Medidas de Dispersión

APÉNDICE I. Calibración de la señal cromatográfica como función de la concentración: Sistema Ternario

PROPUESTA DE PROYECTO DE ESTADÍSTICA: UN MODELO DE REGRESIÓN LINEAL SIMPLE PARA PRONOSTICAR LA CONCENTRACIÓN DE CO2 DEL VOLCÁN MAUNA LOA

Curso de Estadística Básica

ENUNCIADOS DE PROBLEMAS

Modelos de PERT/CPM: Probabilístico

Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA

1. Caso no lineal: ajuste de una función potencial

Distribuciones bidimensionales. Regresión.

Transcripción:

Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del hijo. Estudiar cómo influyen los gastos de promoción y publicidad en el volumen de facturación de una empresa. Estimar el precio de una vivienda en función de su superficie. Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y X: Variable independiente o explicativa o exógena Y: Variable dependiente o respuesta o endógena El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir de una muestra de n pares de valores (x 1, y 1 ),..., (x n, y n ). Universidad del Cauca 1

En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre -1 y +1 Universidad del Cauca 2

Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y se aproxima a 1 cuando la correlación tiende a ser lineal inversa. Es importante notar que: La existencia de correlación entre variables NO IMPLICA causalidad. Atención!: el que ocurra r = 0 sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo. El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables: Universidad del Cauca 3

REGRESION LINEAL SIMPLE Qué buscamos? La ecuación de la recta que mejor se ajuste a la nube de puntos (recta de mínimos cuadrados). Uno de los principales usos de dicha recta será el de predecir o estimar los valores de Y que obtendríamos para distintos valores de X. Estos conceptos quedarán representados en lo que llamamos diagrama de dispersión: Universidad del Cauca 4

REGRESION LINEAL SIMPLE La diferencia entre cada valor Y i estimación Ŷ i se llama residuo: de la variable respuesta y su El modelo pretende dar el valor mínimo posible para cada e i Universidad del Cauca 5

REGRESION LINEAL SIMPLE El procedimiento es el siguiente: Dados este conjunto de valores, en donde solo hay una variable independiente X Y 1 0,5 2 2,5 3 2,0 4 4,0 5 3,5 6 6,0 7 5,5 Para estimar los coeficientes (DE LA RECTA) por medio de mínimos cuadrados, se utilizan las siguientes fórmulas: Universidad del Cauca 6

REGRESION LINEAL SIMPLE Por lo tanto, el ajuste con mínimos cuadrados es (la ecuación de la recta): y = 0.07142857143 + 0.8392857143x Universidad del Cauca 7

REGRESION LINEAL SIMPLE Cuantificación del error en la regresión lineal Lo primero que debemos hacer es calcular la Desviación Estándar Total Sy = St n - 1 Donde St es la suma total de los cuadrados de las restas entre cada uno de los puntos y la media, esto es: St = (yi y) 2 Sy = 22.714285714 7-1 = 1.94569121 Universidad del Cauca 8

REGRESION LINEAL SIMPLE Y el error estándar de la aproximación es : Sy/x = Sr n - 2 Donde Sr = (yi bo (b1*xi)) 2 B0 B1 y = 0.0714285714 + 0.8392857143x Sy/x = 2.991071429 7-2 = 0.773443137 Como Sy/x < Sy la aproximación se considera aceptable Universidad del Cauca 9

Finalmente: St suma total de los cuadrados de las restas entre cada uno de los puntos y la media Sr suma de los cuadrados de las restas alrededor de la línea de regresión La diferencia entre esas 2 cantidades, o St Sr, cuantifica la mejora en la reducción del error debido al modelo de la línea recta. Esta diferencia se puede normalizar al error total y obtener: 2 St - Sr r = St En donde r es el coeficiente de correlación y r 2 es el coeficiente de determinación Para un ajuste perfecto, Sr = 0 y = 1, indicando que la línea recta explica el 100% de la variabilidad. Si r 2 = 0, entonces el ajuste no representa mejorías. Para el ejemplo que venimos tratando: 22.714285714-2.991071429 r 2 = = 0.86831761 r = 0.931835613 22.714285714 2 r = REGRESION LINEAL SIMPLE El resultado indica que el 86.83% de la incertidumbre original se ha explicado mediante el modelo lineal. Universidad del Cauca 10

A tener en cuenta. REGRESION LINEAL SIMPLE El modelo de regresión lineal simple se basa en las siguientes hipótesis: Linealidad: La relación entre X e Y es (o tiende a ser) lineal. Homogeneidad: El valor promedio del error es cero. Homocedasticidad: La varianza de los errores es constante. Independencia: Las observaciones son independientes. Normalidad: Los errores siguen una distribución normal. Universidad del Cauca 11

Universidad del Cauca 12

Universidad del Cauca 13

--------------FIN DEL DOCUMENTO Universidad del Cauca 14