Correlación entre variables



Documentos relacionados
REGRESION simple. Correlación Lineal:

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

Covarianza y coeficiente de correlación

Regresión múltiple. Modelos y Simulación. I. Introducción II. Marco teórico III. Aplicación IV. Conclusiones V. Bibliografía

Aula Banca Privada. La importancia de la diversificación

CORRELACIÓN Y PREDICIÓN

Departamento de Economía Aplicada I ESCUELA UNIVERSITARIA DE ESTUDIOS EMPRESARIALES DIPLOMATURA EN CIENCIAS EMPRESARIALES ESTADÍSTICA

TEMA 5 ESTUDIOS CORRELACIONALES.

Técnicas Cuantitativas para el Management y los Negocios

La relación entre la altura de caída y el tiempo que tarda en rebotar 6 veces una pelota

Semana de dieta (X) Peso en Kg (Y)

Gráfico de Dispersión de Notas en la Prueba 1 versus Notas en la Prueba Final Acumulativa de un curso de 25 alumnos de Estadística en la UTAL

Nº Persona Altura (m) Peso (Kg.) Nº Persona Altura (m) Peso (Kg.)

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

GRADO TURISMO TEMA 3: ANÁLISIS DE DATOS TURÍSTICOS BIDIMENSIONALES

Medidas de tendencia central o de posición: situación de los valores alrededor

Tema 1: Test de Distribuciones de Probabilidad

12 Distribuciones bidimensionales

Práctica 2. Estadística Descriptiva

UNIVERSIDAD DEL VALLE INGENIERIA ELECTRONICA

UNED. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

Inferencia estadística Módulo de regresión lineal simple

Capítulo 8. Tipos de interés reales Introducción

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

DOMINIO Y RANGO página 89. Cuando se grafica una función existen las siguientes posibilidades:

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

El modelo Ordinal y el modelo Multinomial

ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

Capítulo 7: Distribuciones muestrales

Empresarial y Financiero

Capítulo 9. Regresión lineal simple

Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas

Funciones lineales. Objetivos. Antes de empezar. 1.Función de proporcionalidad directa pág. 170 Definición Representación gráfica

Aplicaciones de Estadística Descriptiva

Fundamentos de Biología Aplicada I Estadística Curso Práctica 6: Regresión Logística I

Se ha visto anteriormente que la correlación entre dos variables puede ser alta a pesar de que la relación entre las dos sea fuertemente no lineal.

15 ESTADÍSTICA BIDIMENSIONAL

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

UNIVERSIDAD AUTÓNOMA DE MADRID DPTO DE ECONOMÍA CUANTITATIVA CURSO 2010/2011 ECONOMETRIA I HOJA 2. Problemas

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en

Capítulo VI DESIGUALDADES E INECUACIONES

2 Resolución de algunos ejemplos y ejercicios del tema 2.

Métodos, Diseño y Técnicas de Investigación en Psicología

Parámetros y estadísticos

Medidas de tendencia Central

Tema 4 Funciones elementales Matemáticas CCSSI 1º Bachillerato 1

Tema 2: Estadística Descriptiva Multivariante

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

Selectividad Septiembre 2006 SEPTIEMBRE 2006

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

CAPÍTULO III. Metodología. 3.1 Tipo de Investigación. La investigación se define como un estudio sistemático, controlado, empírico,

Cap. 24 La Ley de Gauss

Juan Antonio González Mota Profesor de Matemáticas del Colegio Juan XIII Zaidín de Granada

SOLUCIONES CIRCUNFERENCIA. 1. Ecuación de la circunferencia cuyo centro es el punto (1, 2) y que pasa por el punto (2,3).

Regresión lineal múltiple

FUNCIONES 1. DEFINICION DOMINIO Y RANGO

f(x)=a n x n +a n-1 x n-1 +a n-2 x n a 2 x 2 +a 1 x 1 +a 0

UNIDAD 4: PLANO CARTESIANO, RELACIONES Y FUNCIONES. OBJETIVO DE APRENDIZAJE: Representar gráficamente relaciones y funciones en el plano cartesiano.

CALCULO 11-M-1 Primera Parte

Una fórmula para la pendiente

REGRESIÓN LINEAL Variable dependiente Y Variable independiente X Ejemplo

Capítulo 10. Gráficos y diagramas

Estadística I. Finanzas y Contabilidad

4º ESO 1. ECUAC. 2º GRADO Y UNA INCÓGNITA

Funciones, x, y, gráficos

Matemáticas I: Hoja 3 Espacios vectoriales y subespacios vectoriales

Tema 7 COSTO ESTÁNDAR

Multiple Linear Regression

FONDO MUTUO SURA SELECCION ACCIONES CHILE SERIE A Folleto Informativo al cierre de septiembre 2015

ESTADÍSTICA SEMANA 4

UNIVERSIDAD AUTÓNOMA GABRIEL RENÉ MORENO FACULTAD DE HUMANIDADES UNIDAD DE POSGRADO

Circuito RC, Respuesta a la frecuencia.

Análisis de Regresión y Correlación con MINITAB

SERIES DE TIEMPO INTRODUCCIÓN

Servicios de salud en la Cruz Roja Mexicana, Delegación Xalapa, Ver.

Tema 2 Estadística Descriptiva

Una forma rápida de ordenar datos numéricos (Diagrama de Tallo y Hoja)

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

TEMA 9 DISTRIBUCIONES BIDIMENSIONALES

Funciones definidas a trozos

1. Dominio, simetría, puntos de corte y periodicidad

UN MODELO DE PRONÓSTICO PARA LAS PRIMAS DE SEGUROS DE VIDA Y PERSONAS

LECCION 1ª Introducción a la Estadística Descriptiva

RIESGO Y PROBABILIDAD

CURSO HERRAMIENTAS ESTADISTICAS PARA IMPLEMENTACION DE SIX SIGMA EN EMPRESAS DE PRODUCCION, LOGISTICA Y SERVICIOS

FONDO MUTUO SURA SELECCION ACCIONES USA SERIE A Folleto Informativo al cierre de septiembre 2015

DETERMINANTES MACROECONÓMICOS DE LOS SEGUROS DE VIDA Y PERSONAS

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

Transcripción:

Correlación entre variables Apuntes de clase del curso Seminario Investigativo VI Por: Gustavo Ramón S.* * Doctor en Nuevas Perspectivas en la Investigación en Ciencias de la Actividad Física y el Deporte (Universidad de Granada). Docente Investigador del Instituto Universitario de Educación Física, Universidad de Antioquia (Colombia). Correo: gusramon2000@yahoo.es Correlación entre variables La Correlación es una técnica estadística usada para determinar la relación entre dos o más variables. La relación entre la duración de una carrera de distancia y el test del escalón, o la relación entre las características de la personalidad y la participación en deportes de alto riesgo. La correlación puede ser de al menos dos variables o de una variable dependiente y dos o más variables independientes, denominada correlación múltiple. Coeficiente de correlación El Coeficiente de Correlación es un valor cuantitativo de la relación entre dos o más variables. La coeficiente de correlación puede variar desde -1.00 hasta 1.00. La correlación de proporcionalidad directa o positiva se establece con los valores +1.00 y de proporcionalidad inversa o negativa, con -1.00. No existe relación entre las variables cuando el coeficiente es de 0.00.

Nombre Masa corporal Fuerza Pedro 60 130 Pablo 70 150 Chucho 80 170 Jacinto 90 190 José 100 210 Nombre Masa corporal Fuerza Pedro 1 1 Pablo 2 2 Chucho 3 3 Jacinto 4 4 José 5 5

Coeficiente de correlación = r

N Masa Fuerza X X2 Y Y2 XY 1 60 3600 100 10000 6000 2 65 4225 105 11025 6825 3 70 4900 102 10404 7140 4 75 5625 135 18225 10125 5 80 6400 95 9025 7600 6 85 7225 125 15625 10625 7 90 8100 140 19600 12900 8 95 9025 130 16900 12350 9 100 10000 148 21904 14800 Σ 720 59100 1080 13270 88065

Ecuaciones de Regresión La fórmula general para una ecuación de regresión lineal es: Y = a+bx donde Y es el valor predicho a es el intercepto b es la pendiente de la línea y X es el predictor a puede ser calculada a partir de la siguiente fórmula: a = My - bmx, donde My es la media de Y, y Mx es la media de X b puede ser calculada a partir de la siguiente fórmula: 4 b = r (Sy/Sx), donde Sy es la desviación estándar de Y, y Sx la de X

Intercepto = a = O Pendiente = b = Y / X = (5-0) / (5 0) = 1 Si X = 2 Y = O + 1*2 = 2 b= r (Sy/Sx)= 0.771 (19.71/13.69)= 1.110 a= My bmx= 120-1.110*80= 31.2 Con esta ecuación de regresión podemos calcular los valores de los extremos para la masa corporal (60 y 100 kg): Y60 = 31.2 + 1.110*60 = 97.8 Y100 = 31.2 + 1.110*100 = 142.2

Valores reales para una masa corporal de 60kg era de 100 Kp y en el caso estimado fue de 97.8 (una diferencia de -2.2 kp) Para el 100 kg, era de 150 y su estimación fue de 142.2 (una diferencia de -7.8kp). Esto sucede porque la correlación no es de 1.00. error estándar de la estimación. En el anterior ejemplo, hicimos la recta de regresión de Y sobre los valores de X. Pero igualmente podríamos calcular y dibujar la línea de regresión de los valores de X sobre Y (X = 15.71 + O.536Y). El resultado final sería el gráfico siguiente.

Se puede observar que ambas rectas se cortan en el punto correspondiente a la media de X y la media de Y. Se podría decir que la relación entre las rectas de regresión gira en este punto común. De manera que, cuando r es igual a 1, las rectas se superponen y cuando r es cero, las rectas son perpendiculares. Se pueden realizar diagramas de dispersión en los que aparece una sola recta de regresión: la que sirve para predecir Y a partir de los valores de X. Aunque este estudio se refiera a una sola recta, todas las conclusiones serán también aplicables a la recta que sirve para predecir X a partir de Y. La recta de regresión representa el mejor fundamento para predecir valores de Y a partir de valores conocidos de X. No todos los puntos que representan las calificaciones caen sobre la recta de regresión. Las desviaciones de los valores reales menos los valores predichos representan los errores de la predicción. Las tres sumas de cuadrados son:

1. Variaciones de los valores con respecto a la media de la muestra. Esta variación está dada por (Y - Media)² y es básica para la determinación de la varianza y de la desviación estándar de la muestra. Es la variación total. 2. Variación de los valores reales con respecto a la recta de regresión (o valores predichos) Esta variación está dada por (Y - Y ) ² y se llama variación no explicada. Si la correlación fuese de ±1.00, todos los valores caen en la recta de regresión y en consecuencia, se explicarían toda la variación de los valores de Y en función de la variación en X. Cuando existe una correlación perfecta, no existe variaci6n no explicada. Cuando la correlación no es perfecta, muchos de los puntos no caen en la recta de regresión. Las desviaciones de estos valores con respecto a la recta de regresión representan las variaciones que no pueden ser explicadas mediante la correlación entre ambas variables, de ahí el uso del término.

Variación no explicada: Desviación de valores estimados menos los reales 3. Variación de los valores estimados respecto a la media de la distribución. Esta variación está dada por (Y - Media)² y se la conoce como variación explicada. Este nombre deriva, de manera análoga, a la dada para la variación anterior. Variación explicada: Desviación de valores Y con respecto a la prima.

Coeficiente de determinación r = raíz (r²) Puesto que r² representa la proporción de la variación explicada, (1- r²) representará la proporción de la variación que no es explicada, conocido como coeficiente de no determinación y se representa por k². La relación entre r² y k² es k²+r² = 1