CORRELACIÓN Y PREDICIÓN

Documentos relacionados
8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Covarianza y coeficiente de correlación

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

1.4.- D E S I G U A L D A D E S

REGRESION simple. Correlación Lineal:

TEMA 5 ESTUDIOS CORRELACIONALES.

Ejercicio de estadística para 3º de la ESO

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Aula Banca Privada. La importancia de la diversificación

Cajón de Ciencias. Ejercicios resueltos de Movimiento rectilíneo uniforme

15 ESTADÍSTICA BIDIMENSIONAL

ESTUDIO PRELIMINAR DE ALGUNOS FACTORES INFLUYENTES EN EL RENDIMIENTO ACADÉMICO DE ALUMNOS DEL GRUPO EXECUTIVE FISIOTERAPIA

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

FUNCIONES CUADRÁTICAS Y RACIONALES

Aplicaciones de Estadística Descriptiva

PARA QUÉ NÚMEROS REALES... 2 SUCESIONES... 3 NÚMEROS COMPLEJOS... 5 CÓNICAS... 6 FUNCIÓN INVERSA... 7 FUNCIONES CUADRÁTICAS... 8

SISTEMAS DE COORDENADAS SISTEMA COORDENADO UNIDIMENSIONAL

1. Dominio, simetría, puntos de corte y periodicidad

Selectividad Septiembre 2006 SEPTIEMBRE 2006

Juan Antonio González Mota Profesor de Matemáticas del Colegio Juan XIII Zaidín de Granada

Tema 2. Análisis gráfico Ejercicios resueltos 1

FUNCIONES 1. DEFINICION DOMINIO Y RANGO

Funciones, x, y, gráficos

Se llama dominio de una función f(x) a todos los valores de x para los que f(x) existe. El dominio se denota como Dom(f)

Características de funciones que son inversas de otras

Tema 9 Estadística Matemáticas B 4º E.S.O. 1 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS EN VARIABLES DISCRETAS

Semana de dieta (X) Peso en Kg (Y)

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

TEMA 9 DISTRIBUCIONES BIDIMENSIONALES

2 Resolución de algunos ejemplos y ejercicios del tema 2.

Análisis de Regresión y Correlación con MINITAB

1. Funciones y sus gráficas

Medidas de tendencia central o de posición: situación de los valores alrededor

Selectividad Septiembre 2008 SEPTIEMBRE 2008

DOMINIO Y RANGO página 89. Cuando se grafica una función existen las siguientes posibilidades:

LÍMITES Y CONTINUIDAD DE FUNCIONES

FUNCIONES DE VARIAS VARIABLES Julián de la Horra Departamento de Matemáticas U.A.M.

Funciones más usuales 1

EJERCICIOS DE REPASO SOBRE DERIVABILIDAD III. PROBLEMAS DE OPTIMIZACIÓN

4.2 CÓMO SE NOS PRESENTAN LAS FUNCIONES

Módulo 1 Parábola. a) Dibuja 3 trayectorias de la pelota, presentes en la cancha de futbol.

Otras medidas descriptivas usuales

6 ANÁLISIS DE INDEPENDENCIA O ASOCIACIÓN ENTRE DOS ATRIBUTOS

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación

Capítulo 7: Distribuciones muestrales

GRADO TURISMO TEMA 3: ANÁLISIS DE DATOS TURÍSTICOS BIDIMENSIONALES

Selectividad Septiembre 2009 SEPTIEMBRE Opción A

FUNCIONES DE PROPORCIONALIDAD

Antoni Miró. Experiencia previa y formación

LOS INGRESOS DE LA EMPRESA EN LIBRE COMPETENCIA

1 Ejemplo de análisis descriptivo de un conjunto de datos

Funciones polinomiales de grados 3 y 4

Cap. 24 La Ley de Gauss

Esther Sui-chu Ho Evelyn Yee-fun Man Facultad de Educación Instituto de Investigación Educativa de Hong Kong Universidad China de Hong Kong

Unidad 6 Estudio gráfico de funciones

Profesor Raúl Vega Muñoz LÍMITES

1. Ecuaciones no lineales

Colegio Las Tablas Tarea de verano Matemáticas 3º ESO

El alumno debe responder a una de las dos opciones propuestas, A o B. En cada pregunta se señala la puntuación máxima. OPCIÓN A y C

Transformación de gráfica de funciones

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

El concepto de asociación estadística. Tema 6 Estadística aplicada Por Tevni Grajales G.

Detergente Lavad.1 Lavad.2 Lavad.3 Media A B C D Media

PRESENTACIÓN GRÁFICA DE LOS DATOS

ÍNDICE. Ficha técnica Encuesta y cuestionario Finalidad y resultados de la encuesta Primera parte: conocimiento...

Profr. Efraín Soto Apolinar. Función Inversa

UNIDAD 1. LOS NÚMEROS ENTEROS.

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH

Control Estadístico de Procesos

Funciones lineales. Objetivos. Antes de empezar. 1.Función de proporcionalidad directa pág. 170 Definición Representación gráfica

1.1. Introducción y conceptos básicos

Análisis de Datos. Práctica de métodos predicción de en WEKA

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

4. Se considera la función f(x) =. Se pide:

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

UCLM - Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG)

10Soluciones a los ejercicios y problemas

6. VECTORES Y COORDENADAS

Estadística aplicada y modelización. 10 de septiembre de 2005

Funciones de varias variables

Clase 4: Probabilidades de un evento

Capítulo 3. Estimación de elasticidades

1. MEDIDAS DE TENDENCIA CENTRAL

Evolución de indicadores de Notoriedad Publicitaria de Campañas en Revistas y TV Análisis de Series de Datos

Parámetros y estadísticos

Qué es una fuerza? Cómo se relaciona con el movimiento?

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

ESTIMACIÓN. puntual y por intervalo

Población, muestra y variable estadística

Se ha visto anteriormente que la correlación entre dos variables puede ser alta a pesar de que la relación entre las dos sea fuertemente no lineal.

Esta es la forma vectorial de la recta. Si desarrollamos las dos posibles ecuaciones, tendremos las ecuaciones paramétricas de la recta:

Clase 8: Distribuciones Muestrales

CALCULO CAPITULO ASINTOTAS VERTICALES Y HORIZONTALES

Se enfría una sandía al ponerla abierta al sol?

CURSILLO DE ORIENTACIÓN

Transcripción:

CORRELACIÓN Y PREDICIÓN 1. Introducción 2. Curvas de regresión 3. Concepto de correlación 4. Regresión lineal 5. Regresión múltiple INTRODUCCIÓN: Muy a menudo se encuentra en la práctica que existe una relación entre dos (o más) variables. Por ejemplo: los pesos de los hombres adultos dependen en cierto modo de sus alturas; las longitudes de las circunferencias y las áreas de los círculos dependen del radio, y la presión de una masa de gas depende de su temperatura y de su volumen. Si todos los valores de las variables cumplen exactamente una relación exacta, entonces se dice que las variables están perfectamente correlacionadas o que hay una correlación perfecta entre ellas. Por el contrario, si se lanzan simultáneamente dos dados unas cuantas veces, no existirá una relación entre los puntos que se obtengan en cada dado (salvo que los dados estén cargados), es decir no existirá correlación entre las puntuaciones de cada dado. En otros casos, parece que existe cierta correlación, aunque ésta no sea perfecta. Por ejemplo, las variables altura y peso de los individuos parecen tener cierto grado de relación aunque no exista una fórmula que nos permita adivinar el peso de un individuo conocida su altura. Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional. Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas. La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión. Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla: MATEMÁTICAS 2 4 5 5 6 6 7 7 8 LENGUA 2 2 5 6 5 7 5 8 7 10 9 Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bidimensional.

Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión. Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya extendiéndose con respecto a la recta. En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube. Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir. Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados. Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).

A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del Instituto, con fin de estudiar se esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla: Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 1 1,2 2,1 2,5 3 3 Nota media 8,4 4 5,7 9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1 Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlación es prácticamente inexistente, es decir, no tiene nada que ver con el rendimiento académico la distancia del domicilio al instituto, ESTIMACIÓN MEDIANTE LA RECTA DE REGRESIÓN Es evidente que no todos dibujaríamos exactamente la misma recta para una nube de puntos, aunque la correlación fuera bastante fuerte. De todas las rectas posibles los matemáticos han elegido como la mejor aproximación la llamada de los mínimos cuadráticos, Su cálculo es también algo mecánico que podemos hacer con calculadora o un ordenador. En el siguiente apartado encontrarás un ejercicio para estudiar sus propiedades. La recta de regresión sirve para hacer estimaciones, teniendo en cuenta que: Los valores obtenidos son aproximaciones en términos de probabilidad: es probable que el valor correspondiente a x 0 sea y 0. La fiabilidad es mayor cuanto más fuerte sea la correlación. La fiabilidad aumenta al aumentar el número de datos. La estimación es más fiable para los valores de x próximos a la media. Con los datos del primer ejemplo, (las notas de 10 alumnos en Matemáticas y en Lengua), podemos contestar con aproximación a la siguiente cuestión: si un alumno no realizó el examen de lengua, pero sí el de matemáticas, obteniendo un 7, qué nota cabe esperar que obtuviera en lengua? MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9 LENGUA 2 2 5 6 5 7 5 8 7 10

Observa el punto amarillo, cuya abscisa corresponde a la nota de matemáticas y su ordenada a la nota que esperamos que tenga en lengua. Es resultado es aproximado y relativamente fiable, ya que la correlación es fuerte Y el valor de la nota no está muy próximo a la media, aunque el nº de datos que tenemos no es muy alto. Regresión lineal Si representamos en un gráfico los pares de valores de una distribución bidimensional: la variable "x" en el eje horizontal o eje de abcisa, y la variable "y" en el eje vertical, o eje de ordenada. Vemos que la nube de puntos sigue una tendencia lineal: El coeficiente de correlación lineal nos permite determinar si, efectivamente, existe relación entre las dos variables. Una vez que se concluye que sí existe relación, la regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos. Una recta viene definida por la siguiente fórmula: y = a + b x

Regresión Múltiple La regresión múltiple es la extensión de la regresión simple, para tomar en cuenta mas de una variable independiente X. Evidentemente, se trata de la técnica adecuada cuando se desea investigar el efecto simultaneo sobre Y de varias variables X. A pesar de ello, inclusive si esta interesado en el efecto de una sola variable, por lo general, se desea incluir otras variables en un análisis de regresión múltiple, por dos razones: a. En estudios de observación, es esencial eliminar el sesgo de algunas de las variables de confusión al incluirlas como regresores. b. Tanto en estudios de observación como en experimentos aleatorizados, la inclusión de variables adicionales como regresores puede reducir la varianza residual s 2 y, por tanto, mejorar los intervalos de confianza y los ensayos, como si se incluyesen pruebas ANOVA reforzadas con un segundo factor.