Distribuciones Bidimensionales.

Documentos relacionados
VARIABLES ESTADÍSTICAS BIDIMENSIONALES

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Variables estadísticas bidimensionales: problemas resueltos

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

Tema 2. Descripción Conjunta de Varias Variables

Variables estadísticas bidimensionales

Relación entre la altura y la distancia del suelo al ombligo

Estadística aplicada a la comunicación

Tema 1.- Correlación Lineal

Tema Contenido Contenidos Mínimos

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

Tema 3. Relación entre dos variables cuantitativas

Técnicas de Investigación Social

Teoría de la decisión

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Z i

Matemáticas. Selectividad ESTADISTICA COU

Tema 2: Estadística Descriptiva Bivariante.

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

El ejemplo: Una encuesta de opinión

Tema 6. Variables aleatorias continuas

Dos matrices son iguales cuando tienen la misma dimensión y los elementos que ocupan el mismo lugar en ambas son iguales

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7.

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

En la notación C(3) se indica el valor de la cuenta para 3 kilowatts-hora: C(3) = 60 (3) = 1.253

Representación y aplicaciones de las funciones tipo

Diplomatura en Ciencias Empresariales X Y

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Regresión y Correlación

Variable Estadística Bidimensional

Determinantes. Concepto de determinante A cada matriz cuadrada A se le asigna un número denominado determinante de A, denotado por A o por det (A).

Método de cuadrados mínimos

Una ecuación puede tener ninguna, una o varias soluciones. Por ejemplo: 5x 9 = 1 es una ecuación con una incógnita con una solución, x = 2

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Tema 7: Estadística y probabilidad

2 Resolución de algunos ejemplos y ejercicios del tema 2.

DETERMINANTES Profesor: Fernando Ureña Portero

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Tema 7: Geometría Analítica. Rectas.

Fase 2. Estudio de mercado: ESTADÍSTICA

Teoría Tema 6 Ecuaciones de la recta

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

INTERVALOS Y SEMIRRECTAS.

JUNIO Bloque A

Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

FACULTAD: Facultad de Ciencias de la Educación

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

TEMA 3: DISTRIBUCIONES BIDIMENSIONALES. CORRELACIÓN Y REGRESIÓN.

Tema 2. Regresión Lineal

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

7.FUNCIÓN REAL DE VARIABLE REAL

Ecuaciones Lineales en Dos Variables

ESTADÍSTICA CON EXCEL

Números reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos.

Colegio Universitario Boston

Determinantes. Determinante de orden uno. a 11 = a 11 5 = 5

2.- Tablas de frecuencias

Definición de probabilidad

Medidas de tendencia central

Departamento de Matemáticas. 1º BACHILLERATO Ciencias y Tecnología CONVOCATORIA EXTRAORDINARIA DE SEPTIEMBRE 2014

CONSTRUCCIÓN DE UNA FUNCIÓN POLINOMIAL

FUNCIONES y = f(x) ESO3

1.3.- V A L O R A B S O L U T O

Sistemas de Ecuaciones Lineales con Dos Incognitas

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Se desea estudiar el comportamiento de una función a medida independiente x se aproxima a un valor específico.

3. Correlación. Introducción. Diagrama de dispersión

Estadística Inferencial. Estadística Descriptiva

Doc. Juan Morales Romero

4 Descripción conjunta de varias variables. Ejemplos y ejercicios.

Unidad IV: Distribuciones muestrales

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

CONTENIDOS MÍNIMOS SEPTIEMBRE. DEPARTAMENTO DE MATEMÁTICAS

Criterios de evaluación 3º de ESO. Matemáticas Orientadas a las Enseñanzas Aplicadas

MATEMÁTICAS APLICADAS A LAS CC. SOCIALES I. Examen de la tercera evaluación. Nombre y apellidos Fecha: 10 de junio de 2010

Tema 4: Probabilidad y Teoría de Muestras

DEFINICIONES TIPOS DE MATRICES DETERMINANTES Y PROPIEDADES OPERACIONES MATRICIALES INVERSA DE UNA MATRIZ SISTEMAS DE ECUACIONES

Algebra lineal y conjuntos convexos

Capítulo 6. Análisis bivariante de variables

El Análisis de Correspondencias tiene dos objetivos básicos:

NOTACIÓN Y REPRESENTACIÓN

MÓDULO 1: GESTIÓN DE CARTERAS

ECUACIÓN DE LA RECTA

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

4. Regresión Lineal Simple

Repaso Estadística Descriptiva

Contenidos mínimos Criterios de evaluación Ejemplos de preguntas

CM0244. Suficientable

Esta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias.

CÁLCULO DE PROBABILIDADES

Tema 8. Análisis de dos variables Ejercicios resueltos 1

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Transcripción:

Distribuciones Bidimensionales. 1.- Variables Estadísticas Bidimensionales. Las variables estadísticas bidimensionales se representan por el par (X, Y) donde, X es una variable unidimensional, e Y es otra variable unidimensional. Y por lo tanto la variable estadística bidimensional (X, Y) toma los valores (X1,Y1), (X2, Y2),. (Xn, Yn). Si representamos estos pares de valores en un sistema de ejes cartesianos, se obtiene un conjunto de puntos sobre un plano al que se llama diagrama de dispersión o nube de puntos. Ejemplo. Tablas bidimensionales de frecuencias. Existen dos tipos de tablas: Tablas simples conjunta en la que cada una de las variables y su correspondiente frecuencia, se disponen en columnas del siguiente modo: Pg. nº 1/7

X (matemáticas) Y (física) 3 2 4 4 5 6 5 5 12 6 6 4 6 7 5 7 6 4 7 7 2 8 9 1 10 10 2 fi (nº de alumnos) Tablas de doble entrada en las que se dispone la variable X en fila, en la parte superior, y la variable Y en columna a la izquierda. Posterior mente se añaden las frecuencias en el cuerpo de la tabla. Todo ello de la siguiente forma: Y X 3 4 5 6 7 8 10 2 4 5 6 12 6 4 4 7 5 2 9 1 10 2 Como se puede observar, las tablas simples se pueden transformar en tablas de doble entrada, y viceversa. Esto es importante saberlo hacer, porque en los cálculos posteriores necesitaremos ambas formas de tablas. Antes de continuar aprenderemos a sacar lo que se denomina distribuciones marginales de X e Y. Su cálculo es muy sencillo, partiendo de la tabla de doble entrada se añade una fila y una columna y se va sumando el cuerpo principal de la tabla por filas y columnas. La nueva columna es la distribución marginal de Y, y la nueva fila es la distribución marginal de X. Y X 3 4 5 6 7 8 10 f y 2 4 4 5 6 12 18 6 4 4 8 7 5 2 7 9 1 1 10 2 2 f x 4 6 12 9 6 1 2 40 Pg. nº 2/7

Distribución marginal de X X fi 3 4 4 6 5 12 6 9 7 6 8 1 10 2 40 Distribución marginal de Y Y fi 2 4 5 18 6 8 7 7 9 1 10 2 40 Cálculo de parámetros Tanto con la variable X, como con la variable Y, se pueden realizar todos los cálculos, las representaciones gráficas y sacar las conclusiones que hemos visto en los dos temas anteriores. Hay que tener en cuenta, que muchas veces es importante estudiar cada una de las variables de forma independiente, para conocer su comportamiento individual y luego poder interpretar mejor el comportamiento conjunto. El primer parámetro conjunto que vamos a ver es la covarianza, que viene a ser la varianza conjunta de las variables X e Y. La vamos a definir como la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza viene representada por σxy ó Sxy, y su cálculo lo realizaremos mediante la formula: x y f i i i xy x y N Más adelante veremos el significado de la varianza, así como su interpretación según su signo. Para su cálculo matemático es preciso partir de la tabla simple conjunta, confeccionando todas las columnas necesarias, como a continuación se muestra: Pg. nº 3/7

Sí en el estudio estadístico no se nos exige el cálculo de modas, medianas, percentíles, etc., todos los datos y los parámetros que necesitamos (medias, varianzas y desviaciones típicas) lo podemos obtener de la tabla anterior. Pero si no es el caso, debemos calcular las distribuciones marginales y operar con ellas. Concepto de correlación Se llama correlación a la teoría que trata de estudiar la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. La correlación es lineal o curvilínea según el diagrama de dispersión se concentre en torno a una línea recta o curva. La correlación es positiva o directa cuando a medida que crece una variable la otra también crece, o viceversa. La correlación es negativa o inversa cuando a medida que crece una variable la otra decrece, o viceversa. La correlación es nula cuando no existe ninguna relación entre ambas variables, y se dice que están incorrelacionadas. La correlación es de tipo funcional si existe una función que satisface todos los valores de la distribución. A continuación representamos todas las posibilidades: Pg. nº 4/7

Pg. nº 5/7

Coeficiente de correlación lineal Una vez observado, mediante un diagrama de dispersión, que existe una correlación entre las variables hay que demostrarlo de forma más precisa y objetiva. Nosotros sólo vamos a estudiar la correlación de tipo lineal. Y el procedimiento más frecuente es el coeficiente de correlación de Pearson, que se define mediante la siguiente expresión: r xy x y El signo de r viene dado por el signo de la covarianza, ya que las desviaciones típicas son siempre positivas. Así pues, el signo de la covarianza nos indica el comportamiento de la correlación: Si la covarianza es positiva Si la covarianza es negativa Si la covarianza es nula la correlación es directa. la correlación es inversa. existe incorrelación. Está demostrado que el coeficiente de correlación lineal de Pearson es un número real comprendido entre -1 y + 1. Veamos a continuación el tipo de dependencia entre las variables X e Y según el valor de r: Si r = +1 o r = - 1, todos los valores están sobre la recta y en consecuencia se dice que existe una dependencia funcional directa o inversa, respectivamente. Si -1 < r < 0, la correlación es negativa y será tanto más fuerte cuanto más se aproxime a -1. Se dice entonces que existe una relación de dependencia aleatoria. Nosotros vamos a considerar que las variables están altamente relacionadas a partir del -0,80. r = 0 las variables están incorrelacionadas y por lo son aleatoriamente Si independientes. Si 0 < r < +1, la correlación es positiva y será tanto más fuerte cuanto más se aproxime a +1. Se dice entonces que existe una relación de dependencia aleatoria. Nosotros vamos a considerar que las variables están altamente relacionadas a partir del +0,80. Pg. nº 6/7

Estudio analítico de la regresión lineal Si entre dos variables existe una fuerte correlación, el diagrama de dispersión se concentrará en torno a una recta. Entonces el problema consiste en encontrar la ecuación de la recta que mejor se ajuste a la nube de puntos. Existen varios métodos, siendo el más utilizado el denominado mínimos cuadrados. Consiste en hacer mínima la suma de los cuadrados de la diferencia entre los valores observados experimentalmente y los teóricos que se obtengan de la recta. De la aplicación de este método se deduce que: La recta de regresión de y sobre x es La recta de regresión de x sobre y es y y xy ( x x ) 2 x x xy ( y y ) 2 y x Una vez obtenidas las rectas de regresión, o solo una de ellas según haga falta para el estudio, seguiremos operando hasta lograr una expresión del tipo: y ax b O x ay b Estas rectas nos permiten predecir el comportamiento de las variables y con ello podemos sacar conclusiones respecto al futuro. Es conveniente representarlas sobre el diagrama de dispersión para comprobar la bondad del ajuste y que no hemos cometido algún error. No hay que olvidar dos cosas: Sólo realizaremos el estudio de regresión si existe una alta relación entre las variables, que nosotros hemos establecido en a partir del + 0 80. No se puede extrapolar a lo loco y fuera de los límites estudiados, pues nada nos garantiza que la serie estadística se siga comportando igual más allá del campo estudiado. Pg. nº 7/7