DISTRIBUCIONES BIDIMENSIONALES

Documentos relacionados
X Y

Tema 9: Estadística en dos variables (bidimensional)

Tema 3: Análisis de datos bivariantes

Cuaderno de actividades 1º

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

Regresión y Correlación

ESTADÍSTICA. DISTRIBUCIÓN BIDIMENSIONAL

Estadística de dos variables

Tema 2: Análisis de datos bivariantes

Tema 2: Estadística Descriptiva Bivariante.

Variable Estadística Bidimensional

Tema 2. Descripción Conjunta de Varias Variables

Tema 3. Relación entre dos variables cuantitativas

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

Tema 10: Introducción a los problemas de Asociación y Correlación

Variables estadísticas bidimensionales

Técnicas de Investigación Social

Distribuciones bidimensionales. Correlación.

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

Coeficiente de Correlación

Universidad de Salamanca - Escuela de Educación y Turismo

Relación entre la altura y la distancia del suelo al ombligo

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Tema 8. Análisis de dos variables Ejercicios resueltos 1

TEMA 1: ESTADISTICA DESCRIPTIVA

2 Resolución de algunos ejemplos y ejercicios del tema 2.

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Diplomatura en Ciencias Empresariales X Y

Módulo de Estadística

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Bioestadística. Tema 3: Estadística descriptiva bivariante y regresión lineal. Relaciones entre variables y regresión

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

Estadística descriptiva bivariante y regresión lineal.

Tema 8: Regresión y Correlación

4,2 + 0,67 Y c) R 2 = 0, En la estimación de un modelo de regresión lineal se ha obtenido:

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Estadística Descriptiva II: Relación entre variables

CAPÍTULO 11 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

Unidad IV Introducción a la Regresión y Correlación

Estadística aplicada a la comunicación

Estadística Descriptiva II

Doc. Juan Morales Romero

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Repaso Estadística Descriptiva

El ejemplo: Una encuesta de opinión

CORRELACION Y REGRESIÓN LINEAL

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

4 Descripción conjunta de varias variables. Ejemplos y ejercicios.

REGRESIÓN LINEAL SIMPLE

Elaboró: Luis Casas Vilchis

Libro de ejercicios de refuerzo de matemáticas. María de la Rosa Sánchez

Hoja de Cálculo. Práctica Coeficiente de correlación y recta de

Variables estadísticas bidimensionales: problemas resueltos

UNIDAD Nº4. Ejemplo.- Dados los Gastos de publicidad en los meses enero a julio, los cuales generan los sgts. Ingresos:

Correlación entre variables

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

3. CORRELACIÓN Y REGRE-

TEMA 3: DISTRIBUCIONES BIDIMENSIONALES. CORRELACIÓN Y REGRESIÓN.

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I Y II CONTENIDOS BACHILLERATO

CONTENIDOS MÍNIMOS PARA LA PRUEBA EXTRAORDINARIA DE SEPTIEMBRE DE 2016 MATEMÁTICAS 1º BACHILLERATO HHCCSS IES DOMINGO PÉREZ MINIK

ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS CON LA HOJA DE CÁLCULO EXCEL

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Método de cuadrados mínimos

TEMA 3 REGRESIÓN Y CORRELACIÓN

Teoría de la decisión

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

EJEMPLOS DE PRONÓSTICOS

5 Relaciones entre variables.

ESTADÍSTICA. 1.- En una población de 25 familias se ha observado el número de vehículos que tienen obteniéndose los siguientes datos:

MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN. Tema 9

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Un modelo para representar una relación aproximadamente

MATEMÁTICAS 1º BI-NM Serie Estadística Unidimensional y Bidimensional

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

Estadística Descriptiva Bidimensional

CLASES DE ESTADÍSTICA II ESPERANZA ABSOLUTA

Matemáticas. Bioestadística. Correlación y Regresión Lineales

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

1. Algunos comandos de Estadística

Distribuciones bidimensionales. Regresión.

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Tema Contenido Contenidos Mínimos

Curso de nivelación Estadística y Matemática

Capítulo 6. Análisis bivariante de variables

15 ESTADÍSTICA BIDIMENSIONAL

El Análisis de Correspondencias tiene dos objetivos básicos:

4.1 Análisis bivariado de asociaciones

Transcripción:

RESUMEN DISTRIBUCIONES BIDIMENSIONALES J. Vega RELACIONES LABORALES ESTADÍSTICA 15 de noviembre de 2008

RESUMEN 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA

RESUMEN 4 REGRESIÓN REGRESIÓN LINEAL 5 CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL. r

DISTRIBUCIONES BIDIMENSIONALES INTRODUCCIÓN Siguiente Paso Buscar relaciones entre la variables.(no se asegurará causalidad) Realizar un estudio conjunto de dos variables. Aunque se pueden estudiar conjuntamente: Cualitativa-Cualitativa (Sexo-Situación Laboral) Cualitativa-Cuantitativa (Estado Civil-Edad) Cuantitativa-Cuantitativa (Edad-Número Semanal de Horas de Trabajo) Nos centraremos en el estudio conjunto de dos variables Cuantitativas

DISTRIBUCIONES BIDIMENSIONALES INTRODUCCIÓN Siguiente Paso Buscar relaciones entre la variables.(no se asegurará causalidad) Realizar un estudio conjunto de dos variables. Aunque se pueden estudiar conjuntamente: Cualitativa-Cualitativa (Sexo-Situación Laboral) Cualitativa-Cuantitativa (Estado Civil-Edad) Cuantitativa-Cuantitativa (Edad-Número Semanal de Horas de Trabajo) Nos centraremos en el estudio conjunto de dos variables Cuantitativas

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Variables X e Y Población: Empleados de una empresa. (n=10) X =Años de antigüedad en el trabajo. Y =Número de Accidentes Laborales en el último año. Datos (X, Y) Se denomina: Variable Bidimensional. (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1)

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Variables X e Y Población: Empleados de una empresa. (n=10) X =Años de antigüedad en el trabajo. Y =Número de Accidentes Laborales en el último año. Datos (X, Y) Se denomina: Variable Bidimensional. (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1)

DISTRIBUCIONES BIDIMENSIONALES Distribución Conjunta DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Las tablas de frecuencias de la distribución conjunta se presenta en una tabla de doble entrada. Tabla de Frecuencias Absolutas Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS k= es el número de modalidades de X p= número de modalidades de Y n ij = número de veces que aparece el par (x i, y j ) se tiene: Ordenadas las variables: x 1 < x 2 < < x k, y 1 < y 2 < < y p Tabla de Frecuencias Absolutas X Y y 1 y 2 y j y p x 1 n 11 n 12 n 1j n 1p n 1 x 2 n 21 n 22 n 2j n 2p n 2............ x i n i1 n i2 n ij n ip n i............ x k n k1 n k2 n kj n kp n k n 1 n 2 n j n p n = n

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Tabla de Frecuencias Relativas Se obtiene sustituyendo las n ij por f ij = n ij n Ejemplo Y X 1 2 3 2 0 0.1 0.2 0.3 3 0 0.2 0 0.2 4 0.1 0.1 0 0.2 5 0.3 0 0 0.3 0.4 0.4 0.2 1

DISTRIBUCIONES BIDIMENSIONALES Distribuciones Marginales DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Las variables unidimensionales X e Y se denominan marginales. X =Años de antigüedad en el trabajo. Y =Número de Accidentes Laborales en el último año. Sus frecuencias absolutas aparecen en los márgenes derecho e inferior de la tabla de doble entrada. Marginal X x i n i 2 3 3 2 4 2 5 3 10 Marginal Y y i n i 1 4 2 4 3 2 10

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Ejercicio Calcular el número medio de años de antigüedad en el trabajo y su desviación típica. (Media y desviación típica de la marginal X) Marginal X x i n i x i n i xi 2n i 2 3 6 12 3 2 6 18 4 2 8 32 5 3 15 75 10 35 137 X = 35 10 = 3,5 S 137 X = 10 3,52 = 1,2042 SX 2 = 1,45

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Ejercicio Calcular el número medio de accidentes en el último año y su desviación típica. (Media y Desviación Típica de la marginal Y.) Marginal Y y i n i y i n i yi 2n i 1 4 4 4 2 4 8 16 3 2 6 18 10 18 38 Y = 18 10 = 1,8 S 38 Y = 10 1,82 = 0,7483 SY 2 = 0,56

Marginal X DISTRIBUCIONES BIDIMENSIONALES x i n i x 1 n 1 x 2 n 2. x k. n k n DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Marginal Y y j n j y 1 n 1 y 2 n 2. y p. n p n X = k i=1 x in i n Y = p i=1 y jn j n S X = k i=1 x i 2n i X 2 n S Y = p j=1 y i 2n j Y 2 n

DISTRIBUCIONES BIDIMENSIONALES Distribuciones Condicionadas DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Problema Obtener el número medio de accidentes de los empleados que tiene dos años de antigüedad en la empresa. Calcular también su desviación típica. Distribución y i n i y i n i yi 2n i 1 0 0 0 2 1 2 4 3 2 6 18 3 8 22

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Estas distribuciones se denominan Distribuciones Condicionadas, en este caso, distribución de Y condicionada a X=2 y se representa como: Y X=2 Media y D. Típica Condicionada Y X =2 = 8 3 = 2,6667 S Y X =2 = 22 3 2,66672 = 0,4714 En este sentido tendremos las siguientes distribuciones condicionadas: Y X =2, Y X =3, Y X =4, Y X =5

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Problema Obtener la antigüedad media de los empleados que presentaron dos accidentes el último año. Calcule también la desviación típica. Distribución x i n i x i n i xi 2n i 2 1 2 4 3 2 6 18 4 1 4 16 5 0 0 0 4 12 38

DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS Esta distribución condicionada se denomina, X condicionada a Y=2 y se representa como: X Y=2 Media y D. Típica Condicionada X Y =2 = 12 4 = 3 38 S X Y =2 = 4 32 = 0,7071 En este sentido tendremos las siguientes distribuciones condicionadas: X Y =1, X Y =2, X Y =3

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Ejemplo Y 1 2 3 X 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de barras tridimensional n ij 3-2 - 1 - X 5 4 3 2 1 1 2 3 Y

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión o Nube de Puntos El punto (X, Y ) se denomina centro de gravedad de la nube de puntos. 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1

DISTRIBUCIONES BIDIMENSIONALES Variables Continuas DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Y 0-5 5-10 10-15 X 0-10 5 10 0 15 10-20 0 20 0 20 20-30 0 10 5 15 5 40 5 50

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Estereograma

DISTRIBUCIONES BIDIMENSIONALES DIAGRAMA DE BARRAS DIAGRAMA DE DISPERSIÓN Diagrama de Dispersión 15 10 5 0 10 20 30

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONADAS 2 GRÁFICAS DIAGRAMA DE BARRAS TRIDIMENSIONAL DIAGRAMA DE DISPERSIÓN o NUBE DE PUNTOS 3 DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA

Introducción DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Cuando hablamos del estudio conjunto de dos variables nos podemos preguntar: Existe algún tipo de relación entre las variables? Se puede explicar el comportamiento de una de ellas conociendo la otra. Los valores de una de las variables influyen en la distribución de la otra. La variación de una de ellas explica la variación de la otra. Analizando el problema nos encontramos la dependencia estadística y dos casos extremos: Dependencia funcional = Dependencia Estadística= Independencia

DISTRIBUCIONES BIDIMENSIONALES Dependencia Funcional DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Los valores de una variable van a determinar exactamente los valores de la otra. Se dice que Y depende funcionalmente de X si a cada valor de X le corresponde un único valor de Y Ejemplo Y X 10 11 12 3 4 0 0 4 0 0 2 5 0 3 0 Cada fila tiene un único valor significativo.

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Se dice que X depende funcionalmente de Y si a cada valor de Y le corresponde un único valor de X Ejemplo Y 6 9 11 X 3 4 0 5 5 0 3 0 Cada columna tiene un único valor significativo. La dependencia funcional no es recíproca, en este último caso Y no depende funcionalmente de X.

Independencia DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Supongamos que en una facultad hay dos tipos de apuntes de una misma asignatura: Alumnos Aprobados Suspensos Apuntes A 400 300 100 Apuntes B 100 La independencia está asociada a mantener las relaciones.

Independencia DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Supongamos que en una facultad hay dos tipos de apuntes de una misma asignatura: Alumnos Aprobados Suspensos Apuntes A 400 300 100 Apuntes B 100 La independencia está asociada a mantener las relaciones.

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Independencia Se dice que X e Y son independientes si las distribuciones de frecuencias relativas de Y condicionada a los valores de X coinciden (o viceversa). Los valores de una de las variables no dan ninguna información sobre los posibles valores de la otra. No existe ninguna relación entre las variables. La independencia es recíproca. Son Independientes las variables? Y X 1 2 3 5 1 2 1 10 2 4 2

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Comparemos las distribuciones de frecuencias relativas de las variables: Y X =5 y Y X =10 xi ni fi 1 1 0.25 2 2 0.50 3 1 0.25 4 1 yi ni fi 1 2 0.25 2 4 0.50 3 2 0.25 8 1 Las terceras columnas coinciden, son por lo tanto Independientes.

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Otra caracterización es comprobar que las filas (columnas) de frecuencias en la tabla de doble entrada son proporcionales. Y 1 2 3 X 5 1 2 1 10 2 4 2

DISTRIBUCIONES BIDIMENSIONALES Dependencia Estadística DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Una vez estudiado los casos extremos, lo que normalmente ocurre, es que los valores de una de las variables dan cierta información sobre la distribución o los valores de la otra. Este tipo de dependencia se denomina Dependencia Estadística Abordaremos el estudio de dicha dependencia desde diferentes puntos de vista. Empezaremos dando una medida para determinar si se trata de una dependencia positiva o directa, o por el contrario, se trata de una dependencia negativa o inversa.

DISTRIBUCIONES BIDIMENSIONALES Dependencia Directa e Inversa DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Directa Dos variables presentan una relación o dependencia positiva o directa si a valores crecientes de X le corresponden valores crecientes de Y. Ejemplos Se espera una dependencia positiva: Inversión de las empresas y ganancias Antigüedad y sueldo...

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Inversa Dos variables presentan una relación o dependencia negativa o inversa si a valores crecientes de X le corresponden valores decrecientes de Y Ejemplos Se espera una dependencia negativa: Inversión en prevención de riesgos laborales y número de accidentes. Horas de trabajo y número de suspensos....

Covarianza DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY 9 8 (x i x)(y i y) < 0 7 6 5 (x i x)(y i y) > 0 (x, y) 4 3 (x i x)(y i y) > 0 2 (x i x)(y i y) < 0 1 0 1 0 1 2 3 4 5 6 7 8 9 1

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Una medida de la dependencia directa e inversa será: n (x i x)(y i y) i=1 n Covarianza. S XY En la tabla de doble entrada se define: S XY = k p (x i x)(y i y)n ij i=1 j=1 n

DISTRIBUCIONES BIDIMENSIONALES Fórmula Práctica de la Covarianza DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Covarianza. S XY S XY = k p x i y j n ij i=1 j=1 n X Y Interpretación de S XY S XY > 0 = Dependencia Directa S XY = 0 = Incorrelación S XY < 0 = Dependencia Inversa

Ejemplos DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Dando los pares de datos (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1) S XY = 2 2 + 2 3 + 2 3 + + 5 1 10 3,5 1,8 = 0,8

DISTRIBUCIONES BIDIMENSIONALES DEPENDENCIA FUNCIONAL INDEPENDENCIA DEPENDENCIA ESTADÍSTICA COVARIANZA S XY Dando la tabla de doble entrada Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10 S XY = 2 2 1 + 2 3 2 + 3 2 2 + 4 1 1 + 4 2 1 + 5 1 3 10 3,5 1,8 = 0,8

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL 4 REGRESIÓN REGRESIÓN LINEAL 5 CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL. r

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Concepto de Regresión Objetivo Buscar la función que exprese lo mejor posible la relación existente entre las variables, con vistas a poder predecir los valores de una de ellas a partir de los valores de la otra. Ver Ejemplos Excel

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Lineal

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Parabólica

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Exponencial

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Lineal Objetivo Buscar la recta que mejor de adapte a la nube de puntos. Criterio El criterio que se utilizará para cuantificar el grado de ajuste es el de mínimos cuadrados.

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Regresión Lineal Objetivo Buscar la recta que mejor de adapte a la nube de puntos. Criterio El criterio que se utilizará para cuantificar el grado de ajuste es el de mínimos cuadrados.

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Recta de Regresión. Criterio de Mínimos Cuadrados 9 8 y = a + bx 7 6 (x 3, y 3 ) d 3 d 4 (x 4, y 4 ) 5 4 (x 1, y 1 ) 3 2 1 d 1 d 2 (x 2, y 2 ) 0 1 0 1 2 3 4 5 6 7 8 9 1

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Objetivo Encontrar la recta y = a + bx que resuelva el problema: mín a,b d 2 1 + d 2 2 + + d 2 n = Solución Existen dos rectas de regresión: n i=1 d 2 i = n (y i (a + bx i )) 2 i=1

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Recta de Regresión de Y X Recta que predice el valor de Y conocido el valor de X. b = S XY S y = a + bx X 2 a = Y bx Alternativa y Y = S XY S 2 X (x X )

REGRESIÓN CORRELACIÓN REGRESIÓN LINEAL Recta de Regresión de X Y Recta que predice el valor de X conocido el valor de Y. b = S XY x = a + b S y Y 2 a = X b Y Alternativa x X = S XY S 2 Y (y Y ) Ambas rectas pasan por el centro de gravedad: (X, Y )

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 4 REGRESIÓN REGRESIÓN LINEAL 5 CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL. r

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Objetivo Medir el grado de ajuste existente entre la nube de puntos y la función ajustada. Es una medida de asociación entre las variables.

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Coeficiente de Correlación Lineal Medir el grado de ajuste existente entre la nube de puntos y la recta ajustada. Se representa con la letra r y su valor es: r = S XY S X S Y

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

Coeficiente de correlación Lineal. r 1 r 1 r = 1 r 1 r = 0 r 1 r = 1 (x, y) CLPI FCLI DCLI INCORRE. DCLD FCLD CLPD CLPI. Correlación Lineal Perfecta e Inversa. El Modelo Lineal es exacto. FCLI. Fuerte Correlación Lineal Inversa. Modelo Lineal adecuado. Predicciones Fiables DCLI. Débil Correlación Lineal Inversa. Modelo Lineal Inadecuado. Incorrelación. Ausencia Total de Correlación Lineal. DCLD. Débil Correlación Lineal Directa. Modelo Lineal Inadecuado. FCLD. Fuerte correlación Lineal Directa. Modelo Lineal adecuado. Predicciones Fiables CLPD. Correlación Lineal Perfecta y Directa. El Modelo Lineal es exacto. Ver Interpr. Excel

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Propiedades Sig(b) = sig(b ) = sig(r) = sig(s XY ) Las dos rectas de regresión son; o las dos crecientes o las dos decrecientes, salvo en el caso de incorrelación, que son perpendiculares y paralelas a los ejes. Las dos rectas de regresión se cortan en el centro de gravedad de la nube de puntos (X, Y ), por lo tanto son la solución del sistema: { y = a + bx x = a + b y r = ± b b Será el valor positivo si b y b son positivos y será negativo si b y b son negativos.

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Datos (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1) Tabla de doble entrada Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Datos (2,2),(2,3),(2,3),(3,2),(3,2),(4,1),(4,2),(5,1),(5,1),(5,1) Tabla de doble entrada Y X 1 2 3 2 0 1 2 3 3 0 2 0 2 4 1 1 0 2 5 3 0 0 3 4 4 2 10

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 35 137 = 3,5 Sx = 10 10 3,52 = 1,2042 Sx 2 = 1,45 Sxy = 55 Y = 18 38 = 1,8 Sy = 10 10 1,82 = 0,7483 Sy 2 = 0,56 3,5 1,8 = 0,8 10 Recta de regresión de Y X y = a + bx b = S xy S 2 x = 0,5517 a = Y ( 0,5517)X = 3,73 y = 3,73 0,5517x

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 35 137 = 3,5 Sx = 10 10 3,52 = 1,2042 Sx 2 = 1,45 Sxy = 55 Y = 18 38 = 1,8 Sy = 10 10 1,82 = 0,7483 Sy 2 = 0,56 3,5 1,8 = 0,8 10 Recta de regresión de X Y x = a + b y b = S xy S 2 y = 1,4286 a = X ( 1,4286)Y = 6,07 x = 6,07 1,4286y

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Recta de regresión de Y X y = 3,73 0,5517x Recta de regresión de X Y x = 6,07 1,4286y Predicciones x = 6 y = 4

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Recta de regresión de Y X y = 3,73 0,5517x Recta de regresión de X Y x = 6,07 1,4286y Predicciones x = 6 ŷ = 3,73 0,5517 6 = 0,42 y = 4

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Recta de regresión de Y X y = 3,73 0,5517x Recta de regresión de X Y x = 6,07 1,4286y Predicciones x = 6 ŷ = 3,73 0,5517 6 = 0,42 y = 4 x = 6,07 1,4286 4 = 0,36

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Coeficiente de Correlación Lineal r r = S xy S x S y = 0,8878 FCLI

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Representar las rectas sobre la nube de puntos x 3.5 0 6.76 y 1.8 3.73 0 y = 3,73 0,5517x x 3.5 6.07 0 y 1.8 0 4.27 x = 6,07 1,4286y

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 5 4 3 2 1 0 1 0 1 2 3 4 5 6 7 8 9 1

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 5 4 3 2 1 y = 0,5517x + 3,73 0 1 0 1 2 3 4 5 6 7 8 9 1

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 x = 6,07 1,4286y 5 4 3 2 1 y = 0,5517x + 3,73 0 1 0 1 2 3 4 5 6 7 8 9 1

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 9 8 7 6 x = 6,07 1,4286y 5 4 3 2 1 y = 0,5517x + 3,73 0 1 0 1 2 3 4 5 6 7 8 9 1

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Tabla de doble entrada Y X 0-5 5-10 10-15 0-10 5 10 0 15 10-20 0 20 0 20 20-30 0 10 5 15 5 40 5 50

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Tabla de doble entrada (Marcas de clase) Y 2.5 7.5 X 0-5 5-10 12.5 10-15 5/ 0-10 5 10 0 15 15/10-20 0 20 0 20 25/20-30 0 10 5 15 5 40 5 50

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 750 50 Y = 375 50 14250 = 15 Sx = 50 15 2 = 7,7460 Sx 2 = 60 3062,5 = 7,5 Sy = 50 7,5 2 = 2,2361 Sy 2 = 5 S xy = 6125 50 15 7,5 = 10 Recta de regresión de Y X y = a + bx b = S xy S 2 x = 0,1667 a = Y (0,1667)X = 5 y = 5 + 0,1667x

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL X = 750 50 Y = 375 50 14250 = 15 Sx = 50 15 2 = 7,7460 Sx 2 = 60 3062,5 = 7,5 Sy = 50 7,5 2 = 2,2361 Sy 2 = 5 S xy = 6125 50 15 7,5 = 10 Recta de regresión de X Y x = a + b y b = S xy S 2 y = 2 a = X 2Y = 0 x = 2y

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL 15 10 x = 2y y = 0,1667x + 5 5 0 10 20 30

REGRESIÓN CORRELACIÓN COEFICIENTE DE CORRELACIÓN LINEAL Coeficiente de Correlación Lineal r r = S xy S x S y = 0,5774 DCLD