Modelos de regresión
|
|
|
- Adrián Arroyo Olivares
- hace 8 años
- Vistas:
Transcripción
1 Modelos de regresión Aprendizaje automático Alejandra Martínez F.C.E. y N. Universidad de Buenos Aires y CONICET
2 Introducción Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y. X : variable explicativa, independiente o covariable. Y : variable dependiente o respuesta. El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir de una muestra de n pares: (x 1, y 1 ),..., (x n, y n ).
3 Tipos de relación Determinística: Conocido el valor de X, el valor de Y queda perfectamente establecido. Es decir, Y = f (X ) Ejemplo: La relación existente entre la temperatura en grados centígrados (X ) y grados Fahrenheit (Y ) es: Y = X
4 No determinística: Conocido el valor de X, el valor de Y no queda perfectamente establecido. Son del tipo: Y = f (X ) + ε donde ε es un error desconocido (variable aleatoria). Ejemplo: En una planta a vapor, en 25 meses, se observó el promedio mensual de temperatura atmosférica (en Farenheit) (X ) y la cantidad de vapor consumido (en libras) (Y ).
5 Regresión lineal simple Consiste en describir la relación entre las dos variables mediante una recta. Determinística: Con dos puntos me queda determinada la recta... Este caso no es de nuestro interés.
6 No determinística: Volviendo el ejemplo de la planta a vapor: la función que proponemos para modelar la relación es f (x) = a + bx pero, en este caso, a y b son constantes desconocidas (también llamados parámetros). Problema: Ajustar la recta que represente al conjunto de datos de la mejor manera
7 Para a (ordenada al origen o intercept) y b (pendiente o slope) fijos, se llama: ŷ i = a + bx i : valores ajustados o predichos, e i = y i ŷ i : residuos. Objetivo: Hallar los mejores coeficientes a y b que representan la relación lineal entre las variables. A esos valores los denotaremos con â y b, respectivamente.
8 Un vez hallada la recta, es decir, hallados â y ˆb, tenemos que los valores ajustados en cada punto son: ŷ i = â + bx i
9 Un vez hallada la recta, es decir, hallados â y ˆb, tenemos que los valores ajustados en cada punto son: ŷ i = â + bx i
10 Método de mínimos cuadrados Problema: (â, b) = arg min (a,b) = arg min (a,b) = arg min (a,b) n i=1 e 2 i n (y i ŷ i ) 2 i=1 n (y i (a + bx i )) 2 i=1
11 Gráficamente, lo que se resuelve es la minimización de las distancias entre los valores observados y los valores predichos
12 Cómo resolvemos el problema de minimización? arg min (a,b) n i=1 (y i (a + bx i )) 2 = arg min F (a, b) (a,b) Hallando los puntos críticos: usando derivadas parciales. Buscamos (a, b) tales que n 2 (y i (a + bx i )) ( 1) = 0 Luego i=1 n 2 (y i (a + bx i )) ( x i ) = 0 i=1 b = n i=1 (x i x)(y i ȳ) n i=1 (x i x) 2 donde x = (1/n) n i=1 x i y ȳ = (1/n) n i=1 y i. â = ȳ b x Como la función es estrictamente convexa, los puntos hallados son mínimos absolutos.
13 Volviendo al ejemplo de la planta a vapor: ŷ = f (x) = x es decir, â = y b = Si x = 52 entonces la predicción obtenida para y es f (52) = = 9.47.
14 Volviendo al ejemplo de la planta a vapor: ŷ = f (x) = x es decir, â = y b = Si x = 52 entonces la predicción obtenida para y es f (52) = = 9.47.
15 En R, las estimaciones de los parámetros (entre otra información) se puede obtener con la función lm.
16 Dado un ajuste, Cómo podemos ver si el ajuste es bueno? Medida de asociación lineal: coeficiente de correlación lineal r de Pearson n r 2 i=1 = (y i ȳ) 2 n i=1 (y i ŷ i ) 2 n i=1 (y i ȳ) 2 Se cumple que Significado: 0 r 2 1 r 2 = 1: significa que los puntos están exactamente sobre una recta. r 2 cerca de 1: los puntos están cerca de una recta. r 2 cerca de 0: significa que la recta de mínimos cuadrados es prácticamente horizontal.
17 En el ejemplo de la planta a vapor teníamos que el r 2 = , que no está tan mal. Observación: ȳ = Inferencia estadística Para poder hacer tests e intervalos de confianza es necesario hacer (y validar) ciertos supuestos sobre los errores ε como independencia, homoscedasticidad y normalidad. Significación de los coeficientes: En el ejemplo nos había quedado â = y b = 0.08, es decir, la recta ajustada x Una posible duda podría ser: Son los coeficientes â y b significativos? Convengamos que el 0.08 parece chiquito... En Estadística, lo grande o chico depende de la variabilidad que tengan los datos. Se pueden hacer tests para testear la significación de los coeficientes.
18 El R arroja los p-valores de los tests de la forma H 0 : a = 0 vs H 1 : a 0 De manera similar lo hace con todos los coeficientes involucrados en el problema de estimación. (En nuestro caso serían sólo a y b) Luego, como los p-valores son muy chicos, podemos suponer a 0 y b 0. Como además el modelo lineal estaba bastante bien (por el r 2 ), entonces la recta dada por f (x) = x es buena para modelar la relación entre X e Y. Si por el contrario, hubiésemos tenido un p-valor alto para la ordenada al origen (por ejemplo, de más de 0.20), entonces esto hubiese sugerido probar con el modelo lineal f (x) = bx.
19 Transformación de variables Ejemplo: Datos de las Naciones Unidas de El producto bruto interno o GDP (X ) y la tasa de mortalidad infantil cada 1000 nacimientos (Y ), sobre 193 países. Y = a + bx + ε?
20 Transformación de variables Primero probamos transformando la covariable. Usamos el ln. Y = a + b log(x ) + ε?
21 Transformación de variables Ahora transformamos la variable respuesta usando el ln. Como ahora el ajuste lineal parece razonable, ajustamos una recta. log(y ) = a + b log(x ) + ε?
22 Transformación de variables Como ahora el ajuste lineal parece razonable, ajustamos una recta usando mínimos cuadrados. Luego, log(y ) = â + b log(x )
23 Transformación de variables Y por lo tanto el modelo estimado queda Ŷ = f (X ) = eâ+ b log(x )
24 Regresión lineal múltiple Y = a + b 1 X 1 + b b p X p + ε Ejemplo: En un estudio se tomaron 14 muestras de cementos. Las variables explicativas son los pesos (medidos en porcentajes) de 5 componentes del cemento y la variable que se quiere modelar es el calor generado en el fraguado (Y ).
25 Si hacemos un ajuste lineal con todas las variables Si bien el coeficiente de correlación r 2 es muy grande y por lo tanto la información dada por las covariables para el ajuste es mejor que no hacer uso de dicha información, ninguna variable es estadísticamente significativa.
26 Mediante técnicas de selección de variables, se puede ver que el mejor modelo es Y = a + b 2 X 2 + b 3 X 3 + ε
27 Obviamente, los modelos lineales no siempre resuelven todos los problemas de relación entre dos variables y, aún en el caso en los que sí pueden modelar la relación, no siempre los estimadores obtenidos mediante mínimos cuadrados son buenos. Ejemplo: Recta estimada mediante el método de mínimos cuadrados:
28 Regresión lineal robusta Ejemplo: En el clúster de estrellas CYG OB1 hay 47 estrellas. Se quiere modelar el logaritmo de la intensidad de la luz (Y ) en función del logaritmo de la temperatura en la superficie (X ).
29 Regresión lineal robusta Si realizamos un ajuste por mínimos cuadrados
30 El estimador de mínimos cuadrados consiste en resolver el problema (â, b) n = arg min ei 2 donde e i = y i (a + bx i ) (a,b) i=1 Una alternativa más resistente consiste en darle menos peso a residuos grandes. Least Median of Squares (LMS) (â, b) = arg min (a,b) Med { e 2 i } M estimadores de regresión (â, b) = arg min (a,b) n ( ei ) ρ σ i=1 ρ se llama ρ función. σ es un estimador del desvío de los datos. Si ρ(x) = x 2 recuperamos el estimador de mínimos cuadrados.
31 En general, para que sea poco sensible a datos atípicos, se le pide a ρ que tenga derivada acotada. Por ejemplo, La ρ función de Huber: { x 2 si x c ρ c (x) = 2c x c 2 si x > c Se suele tomar c = La ρ función de Tukey o función bicuadrada: ρ c(x) = { Se suele tomar c = ( cte x 1 ( ) ) x 2 2 c si x c 0 si x > c ρ(x) = x = Estimador L 1 o estimador de mínimas desviaciones absolutas (estimador LAD).
32 ρ funciones ρ(x) = x 2 ρ función de Huber ρ(x) = x ρ función de Tukey
33 Computacionalmente Least Median of Squares (LMS) = Queda como tarea. M estimadores de regresión Supongamos que ρ = Ψ. Como queremos resolver arg min (a,b) n ( ) yi (a + bx i ) ρ σ i=1 = arg min G(a, b) (a,b) Utilizaremos nuevamente las derivadas parciales. ( ) n i=1 Ψ yi (a+bx i ) ( ) 1 σ σ = 0 ( ) n i=1 Ψ yi (a+bx i ) ( ) x i σ σ = 0 O bien ( ) n i=1 Ψ yi (a+bx i ) σ = 0 ( ) n i=1 Ψ yi (a+bx i ) σ x i = 0
34 ( ) ( ) 1 ( ) n i=1 Ψ yi (a+bx i ) yi (a+bx i ) yi (a+bx i ) σ σ σ = 0 ( ) ( ) 1 ( ) n i=1 Ψ yi (a+bx i ) yi (a+bx i ) yi (a+bx i ) σ σ σ x i = 0 Entonces, si definimos W (t) = Ψ(t)/t si t 0 y Ψ (0) si t = 0 y w i = W (e i / σ) entonces { n i=1 w i(y i (a + bx i )) = n i=1 w ie i = 0 n i=1 w i(y i (a + bx i )x i = n i=1 w ie i x i = 0 Por último, si llamamos x i = (1, x i ) t y β = (a, b) t entonces el problema anterior se reduce a buscar β tal que n w i x i (y i x t i β) = 0 i=1 Observemos que se resuelve iterativamente dado que w i = w i,β. Este procedimiento se llama Mínimos cuadrados pesados iterados (Iteratively reweighted least squares o IRWLS).
35 Utilicemos ahora el estimador LMS para ajustar una recta al ejemplo.
36 Usemos ahora la información obtenida por el estimador robusto para detectar los datos atípicos.
37 Las observaciones detectadas por el boxplot como datos atípicos son:
38 Las observaciones detectadas por el boxplot como datos atípicos son:
39 Si ahora sacamos las 5 observaciones atípicas detectadas y volvemos a usar mínimos cuadrados
40 Si hubiésemos querido usar el boxplot de los residuos obtenidos por mínimos cuadrados: No hubiésemos detectado ningún dato atípico. Raro, no?
41 Regresión logística En algunas ocasiones, la variable respuesta no es una variable continua sino que se sabe que tiene una distribución discreta como puede ser una Poisson o una Binomial. Supongamos que dado X = x, Y tiene una distribución Bernoulli de parámetro p = p(x) entonces Y = a + bx + ε ya no pareciera tener mucho sentido... Lo que se modela de manera lineal es la esperanza de la Bernoulli que es p. La función de enlace o función link es ( ) p g(p) = ln : (0, 1) R 1 p entonces el modelo es g(p) = a + bx
42 Ejemplo: Un grupo de 20 alumnos estuvieron entre 0 y 6 horas estudiando para un examen. Nos preguntamos cómo el número de horas estudiando para un examen afecta la probabilidad del alumno de pasar el examen?
43 Estimando mediante algún procedimiento los parámetros a y b resulta que
44 Como ( ) p(x) g(p(x)) = ln = â + 1 p(x) bx con â = y b = entonces eâ+ bx p(x) = eâ+ bx + 1
45 Como ( ) p(x) g(p(x)) = ln = â + 1 p(x) bx con â = y b = entonces eâ+ bx p(x) = eâ+ bx + 1
46 De esta manera, según este modelo, si un alumno estudia x = 2.3 horas, entonces, como â = y b = entonces p = eâ+ b 2.3 eâ+ b = Por lo tanto, si tuviésemos que predecir el resultado del examen (es decir, el resultado de Y ) diríamos que desaprueba (o sea Y = 0).
47 Estimación de los parámetros La idea es hallar los estimadores de máxima verosimilitud de a y b. Es decir, hallar (â, b) = arg max l(a, b) donde l es el logaritmo de la verosimilitud (densidad o función de probabilidad conjunta). En nuestro caso, l(a, b) = n [ yi ln ( g 1 (a + bx i ) ) + (1 y i ) ln ( 1 g 1 (a + bx i ) )] i=1 ( ) p donde g(p) = ln. 1 p
48 Nuevamente, si todas las funciones son suficientemente buenas (en general lo son), (â, b) se hallan como los puntos críticos del problema: l a = 0 Que es un problema no lineal. Métodos l b = 0 1. Newton Raphson = Para n grande seguro converge pero para muestras pequeñas no necesariamente. 2. Algoritmo de Fisher Scoring = Pide segundas derivadas. En cada paso iterativo se realiza un procedimiento de mínimos cuadrados pesados usando pseudo-observaciones.
49 Bibliografía Apunte de regresión lineal. Mgs. María Eugenia Szretter Noste. Robust Statistics: Theory and Methods. R. Maronna, R. Martin y V. Yohai. (2006). Wiley Series in Probability and Statistics. Generalized Linear Models. Mc. Cullagh y Nelder. (1998). Londres: Chapman and Hall.
Tema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
ESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Tema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
Teoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Multiple Linear Regression
Multiple Linear Regression Aniel Nieves-González Aniel Nieves-González () LSP 1 / 16 Considere el ejemplo en cual queremos modelar las ventas en una cadena de tiendas por departamento. La v.a. dependiente
Análisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Métodos Estadísticos Multivariados
Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Método de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES
TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no
Preliminares Métodos de Ajuste de Curvas AJUSTE DE CURVAS AJUSTE DE CURVAS
Contenido 1 Preliminares Definiciones 2 Definiciones Contenido 1 Preliminares Definiciones 2 Definiciones Definiciones En ciencias e ingeniería es frecuente que un experimento produzca un conjunto de datos
Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.
NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido
Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS
ESCUELA: UPIICSA CARRERA: INGENIERÍA EN TRANSPORTE ESPECIALIDAD: COORDINACIÓN: ACADEMIAS DE MATEMÁTICAS DEPARTAMENTO: CIENCIAS BÁSICAS PROGRAMA DE ESTUDIO ASIGNATURA: ESTADÍSTICA APLICADA CLAVE: TMPE SEMESTRE:
T2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas
INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de
INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Estadística II Tema 4. Regresión lineal simple. Curso 2010/11
Estadística II Tema 4. Regresión lineal simple Curso 010/11 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL PROGRAMA DE LA ASIGNATURA DE: IDENTIFICACIÓN DE LA ASIGNATURA
1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis
TODO ECONOMETRIA Bondad del ajuste Contraste de hipótesis Índice Bondad del ajuste: Coeficiente de determinación, R R ajustado Contraste de hipótesis Contrastes de hipótesis de significación individual:
478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.
Unidad IV Introducción a la Regresión y Correlación
Unidad IV Introducción a la Regresión y Correlación Última revisión: 25-0ctubre-2009 Elaboró: Ing. Víctor H. Alcalá-Octaviano Página 48 IV.1 Conceptos fundamentales Antología de Probabilidad y Estadística
Regresión y Correlación
Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios
Análisis de regresión lineal simple
Análisis de regresión lineal simple El propósito de un análisis de regresión es la predicción Su objetivo es desarrollar un modelo estadístico que se pueda usar para predecir los valores de una variable
Repaso Estadística Descriptiva
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable
ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
Econometría de series de tiempo aplicada a macroeconomía y finanzas
Econometría de series de tiempo aplicada a macroeconomía y finanzas Series de Tiempo no Estacionarias Carlos Capistrán Carmona ITAM Tendencias Una tendencia es un movimiento persistente de largo plazo
Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.
APUNTES DE QUIMIOMETRIA REGRESIO LINEAL
REGRESIO LINEAL APUNTES DE QUIMIOMETRIA Datos anómalos y levas en las rectas de calibrado. Regresión robusta Mínima mediana de cuadrados Recta de calibrado mediante mínimos cuadrados. Hipótesis básicas
Variables aleatorias bidimensionales discretas
Universidad de San Carlos de Guatemala Facultad de Ingeniería Área de Estadística VARIABLES ALEATORIAS BIDIMENSIONALES Concepto: Sean X e Y variables aleatorias. Una variable aleatoria bidimensional (X,
INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple Facultad de Ciencias Sociales - UdelaR Índice 7.1 Introducción 7.2 Análisis de regresión 7.3 El Modelo de Regresión
Distribuciones de probabilidad bidimensionales o conjuntas
Distribuciones de probabilidad bidimensionales o conjuntas Si disponemos de dos variables aleatorias podemos definir distribuciones bidimensionales de forma semejante al caso unidimensional. Para el caso
Introducción a la Estadística Aplicada en la Química
Detalle de los Cursos de Postgrado y Especialización en Estadística propuestos para 2015 1/5 Introducción a la Estadística Aplicada en la Química FECHAS: 20/04 al 24/04 de 2015 HORARIO: Diario de 10:00
REGRESION simple. Correlación Lineal:
REGRESION simple Correlación Lineal: Dadas dos variable numéricas continuas X e Y, decimos que están correlacionadas si entre ambas variables hay cierta relación, de modo que puede predecirse (aproximadamente)
MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.
UNIVERSIDAD NACIONAL ABIERTA ESTADÍSTICA GENERAL 745) VICERRECTORADO ACADÉMICO INTEGRAL ÁREA DE MATEMÁTICA Fecha: 17/ 01 /009 MODELO DE RESPUESTAS Objetivos, 3, 4, 5, 6, 7, Y 8. OBJ. 1 PTA 1 Una compañía
1. Ejercicios. 2 a parte
1. Ejercicios. 2 a parte Ejercicio 1 Calcule 1. P (χ 2 9 3 33) 2. P (χ 2 15 7 26). 3. P (15 51 χ 2 8 22). 4. P (χ 2 70 82). Ejercicio 2 Si X χ 2 26, obtenga un intervalo [a, b] que contenga un 95 % de
Estadistica II Tema 0. Repaso de conceptos básicos. Curso 2009/10
Estadistica II Tema 0. Repaso de conceptos básicos Curso 2009/10 Tema 0. Repaso de conceptos básicos Contenidos Variables aleatorias y distribuciones de probabilidad La distribución normal Muestras aleatorias,
Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
CAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA
Página de CAPÍTULO (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA Relaciones entre dos variables cuantitativas A menudo nos va a interesar describir la relación o asociación entre dos variables. Como
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Ejercicio 1 (20 puntos)
ESTADISTICA Y SUS APLICACIONES EN CIENCIAS SOCIALES. Examen Montevideo, 15 de diciembre de 2015. Nombre: C.I.: EXAMEN Libre Reglamentado El examen consta de dos partes. La primera parte debe ser realizada
Coeficiente de Correlación
Coeficiente de Correlación Al efectuar un análisis de regresión simple (de dos variables) necesitamos hacer las siguientes suposiciones. Que las dos variables son mensurables Que la relación entre las
CARGA HORARIA Horas totales: 80 Horas totales de resolución de problemas de aplicación: 32
PROBABILIDAD Y ESTADISTICA OBJETIVOS: 1. Extraer y sintetizar información de un conjunto de datos. 2. Aprehender los conceptos de aleatoriedad y probabilidad. 3. Estudiar los modelos más importantes de
Técnicas de regresión: Regresión Lineal Simple
Investigación: 1/7 Técnicas de regresión: Regresión Lineal Simple Pértega Díaz S., Pita Fernández S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña. Cad
Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Prof. Eliana Guzmán U. Semestre A-2015
Unidad III. Variables aleatorias Prof. Eliana Guzmán U. Semestre A-2015 Variable Aleatoria Concepto: es una función que asigna un número real, a cada elemento del espacio muestral. Solo los experimentos
PROGRAMA ACADEMICO Ingeniería Industrial
1. IDENTIFICACIÓN DIVISION ACADEMICA Ingenierías DEPARTAMENTO Ingeniería Industrial PROGRAMA ACADEMICO Ingeniería Industrial NOMBRE DEL CURSO Análisis de datos en Ingeniería COMPONENTE CURRICULAR Profesional
matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4
PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área
Transformaciones de Potencia
Transformaciones de Potencia Resumen El procedimiento Transformaciones de Potencia está diseñado para definir una transformación normalizadora para una columna de observaciones numéricas que no provienen
ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que
Econometría II Grado en finanzas y contabilidad
Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:[email protected] Este documento es
INDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Modelos lineales generalizados
GoBack Modelos lineales Guillermo Ayala Gallego Universidad de Valencia 20 de enero de 2009 1 / 57 Verosimilitud de Ajuste de un GLM mediante Fisher Scoring Method s de un modelo lineal generalizado Identifica
Tema 3. VARIABLES ALEATORIAS.
3..- Introducción. Tema 3. VARIABLES ALEATORIAS. Objetivo: Encontrar modelos matemáticos para el trabajo con probabilidad de sucesos. En particular, se quiere trabajar con funciones reales de variable
Gráfico 1: Evolución del exceso de rentabilidad de la empresa y de la cartera de mercado
Caso 1: Solución Apartado a) - 2 0 2 4 6 0 2 0 4 0 6 0 8 0 1 0 0 p e r i o d E x c e s s r e t u r n, c o m p a n y a e x c e s s r e t u r n m a r k e t p o r t f o l i o Gráfico 1: Evolución del exceso
ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 13 - Septiembre - 2.004 Primera Parte Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Tema 7 Intervalos de confianza Hugo S. Salinas
Intervalos de confianza Hugo S. Salinas 1 Introducción Hemos definido la inferencia estadística como un proceso que usa información proveniente de la muestra para generalizar y tomar decisiones acerca
INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Análisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
LICENCIATURA EN ECONOMÍA Y LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS
DEPARTAMENT D ECONOMIA APLICADA UNIVERSITAT DE VALENCIA LICENCIATURA EN ECONOMÍA Y LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS PROGRAMA DE ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA TEMA 1: INTRODUCCIÓN
Tema 13: Distribuciones de probabilidad. Estadística
Tema 13: Distribuciones de probabilidad. Estadística 1. Variable aleatoria Una variable aleatoria es una función que asocia a cada elemento del espacio muestral, de un experimento aleatorio, un número
Tercera práctica de REGRESIÓN.
Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión
Econometría III Examen. 29 de Marzo de 2012
Econometría III Examen. 29 de Marzo de 2012 El examen consta de 20 preguntas de respuesta múltiple. El tiempo máximo es 1:10 minutos. nota: no se pueden hacer preguntas durante el examen a no ser que sean
15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Modelos de Regresión y Correlación
Artículo de Educación Modelos de Regresión y Correlación REGRESSION AND CORRELATION MODELS Claudio Silva Z 1, Mauricio Salinas 2 1. PhD en Estadística Escuela de Salud Pública Universidad de Chile. 2.
El momento k-ésimo para una variable aleatoria discreta respecto del origen, es. n = esperanza matemática de X
Momentos El momento k-ésimo para una variable aleatoria discreta respecto del origen, es E(x) n = i = 1 k i ( ) x.p x El primer momento centrado en el origen (k=1) es la esperanza matemática de X También
CUERPO TÉCNICO, OPCION ESTADISTICA
CUERPO TÉCNICO, OPCION ESTADISTICA ESTADÍSTICA TEÓRICA BÁSICA TEMA 1. Fenómenos aleatorios. Conceptos de probabilidad. Axiomas. Teoremas de probabilidad. Sucesos independientes. Teorema de Bayes. TEMA
UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADISTICA
UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADISTICA NIVEL : LICENCIATURA CRÉDITOS : 7 CLAVE : ICAE13001731 HORAS TEORÍA : 3 SEMESTRE : QUINTO HORAS PRÁCTICA : 1 REQUISITOS
INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
T4. Modelos con variables cualitativas
T4. Modelos con variables cualitativas Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Ana J. López y Rigoberto Pérez (Dpto EconomíaT4. Aplicada. Modelos Universidad
Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
LA FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE LA LLUVIA ANUAL CUANDO OCURRE UN CAMBIO CLIMÁTICO
LA FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE LA LLUVIA ANUAL CUANDO OCURRE UN CAMBIO CLIMÁTICO Omar Abel Lucero 1 Resumen La lluvia anual es una variable aleatoria frecuentemente utilizada para caracterizar
3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
CORRELACION Y REGRESIÓN LINEAL
LECCION Nº 5 CORRELACION Y REGRESIÓN LINEAL OBJETIVOS ESPECIFICOS Diferenciar los conceptos de correlación lineal, y regresión lineal. Determinar el índice o coeficiente de correlación en una distribución
Facultad de Ciencias Sociales - Universidad de la República
Facultad de Ciencias Sociales - Universidad de la República Estadística y sus aplicaciones en Ciencias Sociales Edición 2016 Ciclo Avanzado 3er. Semestre (Licenciatura en Ciencia Política/ Licenciatura
INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Prueba de Hipótesis. Para dos muestras
Prueba de Hipótesis Para dos muestras Muestras grandes (n mayor a 30) Utilizar tabla Z Ho: μ1 = μ2 H1: μ1 μ2 Localizar en valor de Zt en la tabla Z Error estándar de la diferencia de medias Prueba de
Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión
Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo
Cálculo de Probabilidades II Preguntas Tema 1
Cálculo de Probabilidades II Preguntas Tema 1 1. Suponga que un experimento consiste en lanzar un par de dados, Sea X El número máximo de los puntos obtenidos y Y Suma de los puntos obtenidos. Obtenga
CORRELACION Y REGRESION
CORRELACION Y REGRESION En el siguiente apartado se presenta como calcular diferentes índices de correlación, así como la forma de modelar relaciones lineales mediante los procedimientos de regresión simple
MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo
José María Cara Carmona Adrián López Ibáñez MODELO ECONOMÉTRICO Explicación del desempleo Desarrollaremos un modelo econométrico para intentar predecir el desempleo. Trataremos los diversos problemas que
TEMA 2: Propiedades de los estimadores MCO
TEMA 2: Propiedades de los estimadores MCO Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 2: Pdades de los estimadores MCO Curso
Probabilidad y Estadística
Programa de la Asignatura: Código: 23 Probabilidad y Estadística Carrera: Ingeniería en Computación Plan: 2013 Carácter: Obligatoria Unidad Académica: Secretaría Académica Curso: Tercer año Primer cuatrimestre
ANÁLISIS DE FRECUENCIAS
ANÁLISIS DE FRECUENCIAS EXPRESIONES PARA EL CÁLCULO DE LOS EVENTOS PARA EL PERÍODO DE RETORNO T Y DE LOS RESPECTIVOS ERRORES ESTÁNDAR DE ESTIMACIÓN REQUERIDOS PARA LA DETERMINACIÓN DE LOS INTERVALOS DE
Modelos elección discreta y variable dependiente limitada
Modelos elección discreta y variable dependiente limitada Profesor: Graciela Sanroman Facultad de Ciencias Económicas y Administración Año 2010 Modelos multinomiales Los modelos multinomiales son aquellos
Preparación de los datos de entrada
Preparación de los datos de entrada Clase nro. 6 CURSO 2010 Objetivo Modelado de las características estocásticas de los sistemas. Variables aleatorias con su distribución de probabilidad. Por ejemplo:
CRITERIOS DE EVALUACIÓN 1º BACH. C. N. S. MATEMÁTICAS I
CRITERIOS DE EVALUACIÓN 1º BACH. C. N. S. MATEMÁTICAS I UNIDAD 1 NÚMEROS REALES 1.1. Dados varios números, los clasifica en los distintos campos numéricos y los representa en la recta real. 1.2. Domina
FINAL DE PROBABILIDAD Y ESTADÍSTICA 27 de MAY Nombre y apellido: Nota
FINAL DE PROBABILIDAD Y ESTADÍSTICA 27 de MAY0 2015 Nombre y apellido: Legajo: 1 2 3 4 5 Nota / / / / / 1.- El gobierno de la ciudad ha construido senderos especiales para bicicletas en un barrio de la
PROBABILIDAD Y ESTADÍSTICA
PROBABILIDAD Y ESTADÍSTICA 4 horas a la semana 8 créditos Semestre variable según la carrera Objetivo del curso: Analizar y resolver problemas de naturaleza aleatoria en la ingeniería, aplicando conceptos
CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña
CORRELACIÓN Y REGRESIÓN Juan José Hernández Ocaña CORRELACIÓN Muchas veces en Estadística necesitamos saber si existe una relación entre datos apareados y tratamos de buscar una posible relación entre
Diplomatura en Ciencias Empresariales X Y 10 10000 100 1000 1000 100 10000 10
DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA Diplomatura en Ciencias Empresariales ESTADÍSTICA II Relación Tema 10: Regresión y correlación simple. 1. Ajustar una función potencial a los siguientes
