UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICA
|
|
- Vicente Flores Ortiz
- hace 5 años
- Vistas:
Transcripción
1 UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICA MODELOS LINEALES GENERALIZADOS Tesis presentada por: Bachiller Bisset Marilyn Gonzales Loayza. Para optar el Título Profesional de: Licenciada en Matemáticas. AREQUIPA PERÚ 2017
2 Índice general Agradecimientos 1 Resumen 2 Introducción 3 1. ESTADÍSTICO SUFICIENTE MINIMAL Y FAMILIAS EXPO- NENCIALES Introducción Propiedades de un Buen Estimador Puntual Estimador Insesgado Estimador Consistente Estimador Eficiente Estimador Suficiente Estadístico Minimal Suficiente Familias Exponenciales de Distribuciones MODELOS LINEALES GENERALIZADOS Introducción Regresión Lineal Múltiple Estimación de los Parámetros del Modelo Lineal Múltiple Modelo Lineal Generalizado Componente Aleatorio
3 Componente Sistemática Función de Link Modelos Lineales Generalizados para Datos Binarios Estimación de Parámetros en un modelo de Regresión Logística APLICACIÓN DEL MODELO LOGÍSTICO Introducción Dos Aplicaciones de Modelos Lineales Generalizados Producción de Cobb-Douglas El Problema de los Ronquidos Bibliografía 58 2
4
5 AGRADECIMIENTOS A Dios, por bendecirme en todo momento de mi vida. Quiero agradecer de manera muy especial a toda mi familia, por todo el apoyo y la con anza que depositan en mí, pues son el pilar de mi vida, gracias por estar conmigo en los momentos felices y difíciles, gracias por sus enseñanzas que son invaluables para mí, gracias por el ejemplo que han contribuido positivamente a mi vida profesional y por los ánimos para salir adelante, mis agradecimientos a mis padres Rocío, Jesús y mi hermano Anthony por estar siempre conmigo, gracias por todo. A mi Asesor que me orientó, dándome consejos e instrucciones necesarias para poder desarrollar mi tesis. 1
6 RESUMEN En modelos lineales se estudia que el error del modelo tenga media 0 y sea homocedástica, además que cumpla con la normalidad a fin de que el modelo sea utilizable, pero en muchos casos esta hipótesis no es satisfecha, porque el modelo puede ser heterocedástica. Para resolver este inconveniente, se puede aplicar lo que se llama la transformación de la variable respuesta o utilizar la técnica de mínimos cuadrados ponderados. Sin embargo, existe en la teoría estadística denominado Modelos Lineales Generalizados que uni ca modelos de regresión lineal y no lineal, que también permite incorporar distribuciones de respuesta no normales, con la condición que la variable respuesta sea miembro de la familia exponencial. 2
7 INTRODUCCIÓN Los Modelos de Regresión Lineal Simple o Múltiple, estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Estos modelos son muy utilizados para analizar datos multifactoriales y su estudio conforma un área de investigación clásica dentro de la disciplina de la Estadística desde hace muchos años. Su atractivo y utilidad general son el resultado del proceso conceptualmente lógico de usar una ecuación de interés (la respuesta) y un conjunto de variables predictivas relacionadas. El análisis de regresión tiene también interés teórico, por los conceptos matemáticos que se usa y por una teoría estadística bien desarrollada. Para usar bien el modelo de regresión lineal se requiere apreciar tanto la teoría como los problemas prácticos que se suelen presentar cuando se emplea esta técnica con datos del mundo real. Los modelos lineales (regresión ANOVA, ANCOVA), se basan en los siguientes supuestos: 1. Los errores se distribuyen normalmente 2. La varianza es constante 3. La variable respuesta se relaciona linealmente con la(s) variable(s) independiente(s). Sin embargo, en muchas ocasiones nos encontramos con que uno o varios de estos supuestos no se cumplen. Por ejemplo, es muy común en ecología que a medida que aumenta la media de la muestra, aumenta también su varianza, o en todo caso, hay problemas que pueden ser tratados mediante modelo binomiales y su varianza depende de la probabilidad de ocurrencia, o sea, la población ya no es homocedástica, en esos casos, una alternativa a la transformación de la variable respuesta y a la 3
8 falta de normalidad es el uso de los modelos lineales generalizados (GLM) de las siglas en inglés Generalized Linear Models que son una extensión de los modelos lineales que permiten utilizar distribuciones no normales de los errores (binomiales, Poisson, gamma, etc.) y varianza no constante. Por lo que, el objetivo principal del presente trabajo de tesis, es estudiar el modelo lineal generalizado con sus componentes de aleatoriedad, sistematicidad y función de enlace, estimación respectiva de parámetros y su aplicación. Teniendo como hipótesis: que la falta de normalidad, homocedasticidad y la no linealidad de los datos, para esos casos es el uso de los modelos lineales generalizados. Para tal fin, el trabajo se ha estructurado de la siguiente manera: En el Capítulo I se desarrolla las propiedades de un buen estimador puntual, estimador minimal suficiente y familias exponenciales de distribuciones. En el capítulo II se estudia regresión lineal múltiple, estimación de los parámetros del modelo lineal múltiple, modelo lineal generalizado: componente aleatorio, componente sistemático y función de enlace o link, continuado con modelos lineales generalizados para datos binarios, finalmente se estudia estimación de parámetros en un modelo de regresión logística. En el Capítulo III se incluye dos aplicaciones del modelo logístico sobre: Producción de Cobb-Douglas y el problema de ronquidos. Dichas aplicaciones son asistidas con soporte informático del lenguaje R en su versión
9 Capítulo 1 ESTADÍSTICO SUFICIENTE MINIMAL Y FAMILIAS EXPONENCIALES 1.1. Introducción En la Estadística Inferencial se estudia que un buen estimador puntual goza de las propiedades tales como: insesgado, consistente, eficiente y suficiente. Un estimador es un estadístico, que se define como una función de las observaciones que conforman la muestra. Por lo que, la idea principal de buscar un estimador a partir de la muestra de tamaño, es para representar al parámetro poblacional Propiedades de un Buen Estimador Puntual La estimación de un parámetro puede adoptar la forma de un sólo punto, es decir, la estimación del único valor del parámetro de la población, o en la forma de un intervalo, esto es, la estimación que incluye un intervalo de valores posibles en la que se considera que está comprendido el valor verdadero del parámetro de la población. El primero se denomina estimación puntual y el segundo estimación por intervalos. 5
10 Para definir un estimador puntual, tomamos una variable aleatoria con función de distribución (θ), donde θ denota al parámetro desconocido de la población. Sea 1 2 una muestra aleatoria de tamaño extraída de esta población, la función definida por se llama estimador puntual. θ = t( 1 2 ) Supongamos que tenemos dos estimadores θ 1 y θ 2 del mismo parámetro poblacional θ, por lo que nos preguntamos cuál de los estimadores será mejor. En realidad, el verdadero valor de θ, nunca se conoce, lo único que podemos hacer es; tratar de encontrar algún criterio para decidir cuál de ellos es mejor estimador de tal manera que cumpla con: insesgabilidad, consistencia, eficiencia y suficiencia Estimador Insesgado Sea 1 2 una muestra aleatoria extraída de una población con función de densidad (θ). Decimos que θ = t( 1 2 ) es un estimador insesgado si Ejemplo 1.1 Sea 1 2 h θ i =θ 8 θ población normal (μ σ 2 ). El estadístico X es un estimador insesgado. En efecto: Sabemos que una muestra aleatoria extraída de una 6
11 Estimador Consistente En general, un estimador puntual no es idéntico al parámetro que se estima; esto es debido a la presencia del error de muestreo que es dado por =θ θ Sin embargo, esperemos que un buen estimador tenga su valor muy cercano al valor verdadero del parámetro o por lo menos tenga una alta probabilidad de acercarse. O sea, si dado una sucesión de estimadores de un parámetro θ es consistente si: Ejemplo 1.2 Sea 1 2 población (μ σ 2 ). El estadístico una muestra aleatoria extraída de una 7
12 es un estimador consistente de σ 2. En efecto: i) Sabemos que luego por lo que de modo que ii) Tomamos varianza en ambos lado 8
13 2 = 0 sabemos que luego por lo tanto Estimador Eficiente Para definir lo que es estimador eficiente, tomemos una muestra aleatoria de tamaño con 1 2 de una población con función de densidad (θ). Sean θ 1 y θ 2 dos estimadores insesgados del mismo parámetro θ. Diremos que θ 1 es más eficiente que θ 2 si [^θ 1 ] [^θ 2] 9
14 Ejemplo 1.3 Sea 1 2 una muestra aleatoria de tamaño de una población (μ σ 2 ), donde θ 1 = X ^θ 2 = demostraremos que En efecto: Sabemos que ^θ 1 es más eficiente que θ 2. porque la población es normal. Por otro lado, se sabe que de modo que se concluye que X es el estimador más eficiente que Estimador Suficiente Sea 1 2 una muestra aleatoria de una población con función de densidad ( θ) y sea un estadístico definido por : R! R = ( 1 2 ) Esta estadística condensa la muestra aleatoria 1 2 en una variable aleatoria simple. Se recurre a tal condensación desde que podemos trabajar 10 10
15 mejor con cantidades unidimensionales que con cantidades dimensionales. Para tal efecto; supongamos que: Φ= f( 1 2 ) es una variable aleatoria 8 = 1 2 g un espacio muestral de observaciones, esto es, Φ es el conjunto de vectores dimensionales cuyas componentes son variables aleatorias. Entonces : Φ R! R definida por = ( 1 2 ) = 0 2 R Esta de nición induce una partición del espacio Φ por la propia definición del estadístico, como veremos en el siguiente ejemplo: Ejemplo 1.4 Sea una muestra aleatoria extraída de una población Bernoulli (1 ). Hallamos la partición inducida por la estadística En efecto: Como ~ (1 ), entonces tenemos 11 11
16 Luego el espacio muestral de observaciones correspondiente a la muestra aleatoria esta dado por Φ = f(0 0 0) (0 0 1) (0 1 0) (1 0 0) (0 1 1) (1 0 1) (1 1 0) (1 1 1)g La estadística definida en Φ toma los valores respectivamente. Entonces la partición inducida por la aplicación está formada por los siguientes sub-conjuntos y tenemos también sus respectivos valores de la aplicación: Gráficamente
17 Así, si usamos la estadística = ( ) = tenemos solamente 4 valores diferentes de los que debemos preocuparnos en lugar de 8 puntos diferentes de Φ. Definición 1.1 Sea 1 2 una muestra aleatoria extraída de una población con función de densidad ( θ), el = ( 1 2 ) es una estadística suficiente para Φ si la distribución condicional de [( 1 2 ) = ( 1 2 ) = ( 1 2 )] es independiente de θ, 8 θ 2 Θ, donde Θ es el espacio de parámetros
18 Ejemplo 1.5 Sea 1 2 una muestra aleatoria extraída de una población de Poisson ( ). Definimos es una estadística suficiente para. En efecto: Tenemos la distribución condicional [( 1 2 ) = ] = [( 1 2 ) = ] = [ 1 = 1 2 = 2 = = ] [ = ] [ 1 = 1 2 = 2 = ] [ = ] siempre que = [ 1 = 1 ] [ 2 = 2 ] [ = ] [ = ] por cálculo de probabilidades sabemos que entonces luego 14 14
19 por tanto es una estadística suficiente para. El siguiente teorema es conocido como teorema de factorización, propuesto por Fischer y Nyman. Teorema 1.1 Sea 1 2 una muestra aleatoria extraída de una población con función de densidad de probabilidad ( θ). La estadística = ( 1 2 ) 2 R es suficiente para θ si y sólo si, existen funciones y tal que la función de cuantía conjunta de 1 2 se puede factorizar como sigue: ( 1 2 ;θ) = (( 1 2 )θ)( 1 2 ) donde ( θ) es una función que depende solamente de θ y de la muestra a través del estadístico ( 1 2 ) y ( 1 2 ) es no negativa y no depende de θ. Demostración. )) Supongamos que el estadístico = ( 1 2 ) = es suficiente para θ. Entonces [( 1 2 ) = ( 1 2 ) = ( 1 2 )] = ( 1 2 ; ) es independiente de θ. Luego por la ley de la multiplicidad de probabilidades tenemos ( 1 2 ;θ) = [( 1 2 ) = ( 1 2 ) = ( 1 2 )] [ = ] = ( 1 2 ; ) [ = ;θ] = (( 1 2 )θ)( 1 2 ) () Ahora, supongamos que existen funciones y tal que ( 1 2 ;θ) = (( 1 2 )θ)( 1 2 ) 15 15
20 por la ley de la distribución total 2 ) = ; ] = por hipótesis luego simplificando el factor común es independiente de θ. Por tanto = ( 1 2 ) es una estadística suficiente para θ. Ejemplo 1.6 Sea una muestra aleatoria 1 2 extraída de la población Bernoulli (1 ). Utilizando el teorema de factorización que el estadístico es suficiente para el parámetro
21 En efecto: La función de cuantía conjunta de la muestra y por muestreo independiente será donde para es un estadístico suficiente para. Por tanto, el número de éxitos es un estadístico suficiente para el parámetro (probabilidad de éxito en una prueba de Bernoulli). Ejemplo 1.7 Sea 1 2 una muestra aleatoria de una población (μ 1). Hallamos una estadística suficiente para μ. En efecto: La función de densidad de probabilidad de la distribución (μ 1) es luego la densidad conjunto de la muestra aleatoria 1 2 es 17 17
22 donde con que es una estadística suficiente para μ Estadístico Minimal Suficiente Una vez obtenido el estimador ^θ = = ( 1 2 ) de un parámetro poblacional θ podemos estar interesados en el parámetro de posición del estimador ^θ. Una medida natural sería considerar el error muestral dado por pero esta medida es insatisfactoria, por las siguientes razones: i) La medida depende de los valores desconocidos de θ
23 ii) La medida es aleatoria y por tanto, no puede ser tratado como una función de θ. Sin embargo, podemos aprovechar la definición de para definir el error cuadrático medio (ECM). En general, si = ( 1 2 ) es un estimador de la función (θ), entonces ECM de es dado por por otro lado pues ( ) - θ es constante y [ ( )] = 0. Por tanto ( ) = ( ) + (( )) 2 (1) Ejemplo 1.8 Sea 1 2 una muestra aleatoria de una población (μσ 2 ). Consideremos los estimadores de máximo verosimilitud de μ y σ 2 a) Hallamos ( 1 ) ( 1 ) b) Hallamos ( 2 ) y ( 2 ) En efecto: a) Sabemos que 19 19
24 luego b) Sabemos que luego para hallar ECM calculamos 20 20
25 Definición 1.2 Un estimador = ( 1 2 ) de θ es mejor que un esti- mador = ( 1 2 ) de θ si: Definición 1.3 Sea 1 2 una muestra aleatoria de tamaño. Un estimador * =t* ( 1 2 ) de θ es un estimador no sesgado (insesgado) uniformemente de mínima varianza (ENSUMV) o estimador óptimo si: En la asignatura de Inferencia Estadística se estudia que, la propiedad de insesgamiento no es invariante bajo transformaciones funcionales, es decir, θ puede ser una estimador insesgado de θ, pero (^θ ) puede ser un estimador sesgado de (θ). La esperanza condicional definida por se observa, conforme varía sobre todos los posibles valores de, se obtiene una función de por eso, [ ] es una variable aleatoria. El siguiente teorema se necesita para demostrar el teorema de Rao-Blackwell. Teorema 1.2 i) Sean y variables aleatorias tal que [j j] 1. Entonces [[ ]] [ ]. La igualdad se cumple cuando = [ ] con probabilidad 1. ii) Sean y variables aleatorias tal que [ ] 1. Entonces [[ ]] [ ]. Teorema 1.3 (Rao-Blackwell) Sea 1 2 una muestra aleatoria extraída de una población con función de distribución (θ)
26 Supongamos que = ( 1 2 ) es una estadística su ciente para θ y = ( 1 2 ) un estimador cualquiera de θ tal que [jj] 1. Sea además * = [ ]. Entonces [( * θ) 2 ; θ] [( θ) 2 ; θ] 8 θ 2 Θ. Demostración. Por (1) de la página 19 sabemos que: [] = [( θ) 2 ; θ] = [] + [()] 2 pero () = [] θ = [[ ]] θ = [ *] θ = [ *] por el teorema 1.2 parte i), se tiene [( θ) 2 ;θ] = [; θ] + [( *)] 2 [ *; θ] + [( *)] 2 por tanto [( * θ) 2 θ] = [ *] + [( *)] 2 [( θ) 2 ; θ] 8 θ 2 Θ. Y la igualdad se cumple cuando * =. El teorema de Rao-Blackwell nos dice que un estimador * de mínima varianza es aquel que es función de la estadística su ciente = ( 1 2 ); esto es = [ ] = ( ). Definición 1.4 Sea 1 2 una muestra aleatoria extraída de una población con función de distribución (;θ), donde θ 2 Θ ; y sea = ( 1 2 ) una estadística. La estadística es completa si [( ); θ] = 0 8 θ 2 Θ, implica que ( ) = 0, 8 θ 2 Θ y para toda función definida en el rango de. Ejemplo 1.9 Sea 1 2 una muestra aleatoria extraída de una población Poisson (;θ), θ 0. Probamos que la estadística = P es suficiente y completa
27 En efecto: La función de densidad de la distribución de Poisson es luego donde por tanto es una estadística suficiente para θ, según el teorema de factorización de la página 15. Ahora supongamos que existe una función que depende solamente de 23 23
28 tal que [(); θ] = 0 8 θ 0 como entonces 1 Así, tenemos una serie de potencias en θ es idénticamente cero, si solo si todos sus coeficientes son cero. Entonces () = 0, para = 1 2. Ejemplo 1.10 Sea 1 2 población uniforme (0 θ). una muestra aleatoria extraída de una Probamos que la estadística = = ( 1 2 ) es completa. En efecto: La función de distribución de probabilidad del estadístico = es 24 24
29 luego supongamos que existe una función tal que de donde derivando ambos lados con respecto a θ, tenemos Así logramos tener que = es un estadística completa. Definición 1.5 Sean dos muestras aleatorias 1 2 y 1 2 extraídas de una población con función de distribución (;θ) y (;θ). = ( 1 2 ) es un estadístico suficiente minimal si dado otro estadístico = ( 1 2 ), tal que el cociente de su verosimilitud 25 25
30 Ejemplo 1.11 Consideremos dos muestra aleatorias 1 2 de la población de Bernoulli ( 1). Que el estadístico de nido por P es un estadístico minimal suficiente. En efecto: Sea =1 ~ ( 1) ) () = (1 ) 1 - = 0 1 Supongamos que tenemos dos muestras aleatorias 1 2 y 1 2 de modo que el cociente de sus funciones de verosimilitud es siempre que en lo cual se observa que el resultado es 1, y no depende del parámetroθ =. Luego P =1 es un estadístico minimal suficiente Familias Exponenciales de Distribuciones Existe una clase o familia de distribuciones en la que todos los parámetros de las distribuciones que la integran tienen estadísticas suficientes. Este grupo de distribuciones recibe el nombre de familia exponencial de distribuciones y como veremos 26 26
31 será bastante fácil de obtener estadísticos su cientes del parámetro con familia ex- ponencial. Definición 1.6 Sea (;θ) una función de distribución dependiendo de un único parámetro. pertenece a la familia exponencial si su función de densidad (o función de cuantía) puede expresarse así: (;θ) = f( θ)() + ( θ) +()g donde: ( θ) ( θ) son funciones reales de θ y () () son funciones reales de. Ejemplo 1.12 En la población de Poisson encontramos las funciones ( θ) ( θ) () (). En efecto: Sea ~ (;θ) θ 0, entonces esto es equivalente a de modo que ( θ) = ln θ ( θ) = θ () = () = ln! Esto nos permite afirmar que las distribuciones de Poisson son una familia exponencial de distribuciones. Ahora, si consideremos una muestra aleatoria 1 2 extraída de una población con función de distribución dada (), un conjunto de funciones de cuantía o funciones de densidades según sea el caso, discreto o continuo, es una 27 27
32 familia exponencial uniparamétrica si la función de cuantía o densidad conjunta es de la forma ( 1 2 ; θ) = f( θ)( 1 2 ) + ( θ) + ( 1 2 )g Ejemplo 1.13 En la población Exponencial encontramos las funciones ( θ) ( θ) () (). En efecto: Sea ~ ( θ) θ 0, entonces esto es equivalente a de modo que (θ) = θ ( θ) = ln θ () = () = 0 Esto nos permite afirmar que las distribuciones Exponenciales son una familia exponencial de distribuciones. Ejemplo 1.14 En la población Binomial encontramos las funciones (θ) ( θ) () () En efecto: Sabemos que la distribución Binomial tiene dos parámetros. Para lo cual, ~ ( θ), donde θ= es probabilidad de éxito en un ensayo de Bernoulli 28 28
33 y representa el número de ensayos. Entonces esto es equivalente a de modo que Esto nos permite afirmar que las distribuciones Binomiales son una familia exponencial de distribuciones. Ejemplo 1.15 En la población Normal con σ 2 = 1 encontramos las funciones (θ) (θ) () (). En efecto: Para σ 2 = 1, o sea ~ (μ 1) y de modo que 29 29
34 Esto nos permite afirmar que la distribución (μ, 1) es una familia exponencial de distribuciones. Para visualizar mejor la familia exponencial de distribuciones uniparamétricas, presentaremos en una tabla las funciones (θ) ( θ) () (). Tabla 11 : Parámetros de la Familia Exponencial En el caso de distribuciones de parámetros θ, la definición 1.6 se generaliza de la manera siguiente: Ejemplo 1.16 En la población Normal con parámetros μ y σ 2, encontramos las funciones (θ 1 θ 2 ) (θ 1 θ 2 )( 1 2 ),( 1 2 ). En efecto: Sabemos que la distribución Normal tiene dos parámetros μ y σ 2, para lo cual, ~ (μ σ 2 ), donde μ es la media poblacional y σ 2 es la varianza poblacional. Entonces 30 30
35 esto es equivalente a de donde se observa que como podemos notar la distribución normal (μσ 2 ) es una familia exponencial. Ahora, supongamos que tenemos una muestra aleatoria 1 2 extraída de la población (μ σ 2 ). Entonces luego 31 31
36 por lo tanto es una estadística suficiente para θ= (θ 1 θ 2 ) = (μσ 2 )
37 Capítulo 2 MODELOS LINEALES GENERALIZADOS 2.1. Introducción Los modelos lineales (regresión, ANOVA o ANCOVA), se basan en los siguientes supuestos: los errores se distribuyen normalmente, la varianza es constante y la variable respuesta se relaciona linealmente con las variables independientes. Pero, existen muchas ocasiones en la cual encontramos con que uno o varios de estos supuestos no se cumplen, en estos casos, el problema se puede llegar a resolver me- diante la transformación de la variable respuesta, por ejemplo tomando logaritmos. Sin embargo, estas transformaciones no siempre consiguen corregir la falta de nor- malidad, la heterocedasticidad o la no linealidad de los datos, en esos casos, una alternativa a la transformación de la variable respuesta y a la falta de normalidad es el uso de los modelos lineales generalizados (MLG) que son una extensión de los modelos lineales que permiten utilizar distribuciones no normales de los errores (binomiales, Poisson, gamma, etc.)
38 2.2. Regresión Lineal Múltiple Los Modelos de Regresión estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Sea la variable de interés, variable repuesta o dependiente y sean 1 2 las variables explicativas o regresoras. La formulación matemática de este modelo es la siguiente: = [ 1 2 ] + donde es el error de observación debido a las variables no controladas. En el modelo de regresión lineal general se supone que la función de regresión [ 1 2 ] es lineal. Por tanto, la expresión matemática del modelo de regresión lineal general es mismo = El primer objetivo en el estudio de este modelo es el estimar los parámetros del 0 1 ya que, los parámetros miden la intensidad media de los efectos de las variables explicativas sobre la variable a explicar y se obtienen al tomar las derivadas parciales de la variable explicada respecto a cada una de las variables explicativas: y el objetivo es encontrar la función de distribución del error muestra de observaciones, que tendrá la forma a partir de una ; 1 2 =
39 de modo que: = = 1 2 donde es error aleatorio o perturbación de la observación i-ésima. El tratamiento más adecuado del modelo de regresión lineal múltiple es mediante el análisis matricial, para lo cual primero se tiene esto es equivalente a: si donde = + = [ ] + En el modelo lineal múltiple se supone las siguientes hipótesis: 1. La función de regresión es lineal, [ 1 2 ] = ; =
40 o, equivalentemente, [ ] = 0 = La varianza es constante (homocedasticidad), ya que [ 1 2 ] = σ 2 = 1 2 [ 1 2 ] = [ ] + [ ] σ2 = 0 + [ ] σ2 = [ ] o, equivalentemente, 3. La distribución es normal, [ ] = σ 2 = ~ ( σ 2 ) = 1 2 o, equivalentemente, ~ (0 σ 2 ) = Las observaciones son independientes (bajo normalidad, esto equivale a que la ( ) = 0 esta hipótesis implica que los errores bajo normalidad, equivale a son independientes dos a dos lo que, ( ) =
41 5. Debemos tener + 1. En caso contrario no se dispondría de información 37 37
42 suficiente para estimar los parámetros del modelo. 6. Las variables regresoras 1 2 son linealmente independientes. Estos resultados de hipótesis de modelos lineales múltiples se pueden resumir en una tabla. Tabla 21: Resumen de Condiciones de Linealidad En base a la variable de error " [ ] = 0 [ ] = σ 2 Homocedasticidad con i = 1 2 n Independencia: ( ) = 0 Los ~ (0 σ 2 ) Normalidad son independientes En base a la variable respuesta Y con i = 1 2 n [ 1 2 ] es igual a [ 1 2 ] = σ 2 Homocedasticidad Independencia de las observaciones. Los son independientes 1 2 con distribución ( σ 2 ) Normalidad Las variables regresoras son linealmente Las variables regresoras son linealmente independientes independientes 2.3. Estimación de los Parámetros del Modelo Lineal Múltiple Sea ^ un estimador del vector de parámetros. El vector de predicciones es el vector de residuos se obtiene como ^ = ^ = ^ 38 38
43 el estimador por mínimos cuadrados ^ se obtiene minimizando la suma de los residuos al cuadrado. Esto es, se minimiza la siguiente función de + 1 variables: derivando respecto a ^ e igualando a cero, se obtienen las ecuaciones de regresión (^ ) = 0 () ^ = 0 () = ^ de donde se deduce el siguiente estimador por mínimos cuadrados debe tenerse en cuenta que para calcular este estimador es necesario que la matriz sea invertible. Esto está garantizado por la hipótesis 6 del modelo. La matriz es una matriz ( + 1) ( + 1) cuya expresión es la siguiente: y es una matriz ( + 1) 1 que viene dado por: 39 39
44 Ejemplo 2.1 Consideremos el modelo lineal múltiple [ ] = donde = ( 1 2 ) es un vector de variables aleatorias, con ( ) = σ 2 = 1 2 ; ( ) = 0 es una matriz de contantes fijos y es un vector de parámetros desconocidos. Asumiendo que es una variable normal. Que ^ y ( ^ ) ( ^ ) son pares de estadísticos minimales suficientes. En efecto: Tenemos que tiene la distribución normal. Entonces su función de verosimilitud es ahora 40 40
45 pero ( ) (1 ) + (1 ) ( ) = 0 si y sólo si ( ) ( ) (1 ) + (1 ) ( ) = 0 [ ( )] (1 ) + (1 ) ( ) = 0 ya que, utilizando ( ) 1 se tiene: donde es la matriz identidad y el estimador ^ es obtenido mediante el método de mínimos cuadrados. Teniendo presente que ^ = y retomando el ( ) se tiene: si son dos realizaciones del vector variables aleatorias, entonces esta proporción no depende de, ya que los dos últimos sumando en el exponente es igual cero y si ^ () = ^ () así ^ es un estadístico suficiente minimal para y de la misma forma también es un estadístico minimal para σ 2. Por lo tanto, el par de estadísticos 40 40
46 es suficiente minimal para (σ 2 )
47 2.4. Modelo Lineal Generalizado En primer lugar vamos a presentar que existen poblaciones heterocedásticas, o sea, poblaciones de varianzas no constantes. Por ejemplo, en una población Binomial, donde la variable respuesta se define por: asumamos que la [ = 1] = 2 [0 1] = 1 2 entonces [ = 0] = 1 para esta población, la esperanza matemática y la varianza se define como sigue [ ] = 1 + 0(1 ) = y Tanto la media y la varianza depende de, esto sugiere que la varianza no es constante en la población binomial (o sea, no es homocedástica), lo que significa que el modelo lineal múltiple no es aplicable para este caso, así aparecen otros modelos, específicamente los modelos lineales generalizados (MLG). Definición 2.1 Los modelos lineales generalizados son una extensión de los modelos lineales, que permiten modelar en poblaciones heterocedásticas mediante tres componentes básicos: Componente aleatorio, componente sistemático y función de link (función de enlace)
48 Componente Aleatorio Identifica la variable respuesta y su distribución de probabilidad, para lo cual consiste en tomar observaciones 1 2. En muchos casos, estas observaciones son binarias y se identi can como éxito o fracaso. De modo más general podemos decir, que cada indicaría el número de éxitos entre todos los ensayos y se modelaría como una distribución binomial. En otros casos cada observación es un recuento, lo que se puede asignar a este tipo de observaciones la distribución de Poisson o una distribución binomial negativa. Si las observaciones son continuas se puede asumir para una distribución normal. Todos estos modelos se pueden incluir dentro de la llamada familia exponencial de distribuciones de modo que (θ) recibe el nombre de parámetro natural. Ejemplo 2.2 Sea el número de observaciones del grupo y denota el número de éxitos, entonces ~ ( ) = 1 2 luego y se demuestra que: [ ] = [ ] = (1 ) por lo que se observa que la población de donde se extrajo es heterocedástica
49 La función de cuantía si pertenece a la familia exponencial de distribuciones, porque Componente Sistemática Especifica las variables explicativas (independientes o predictoras) utilizadas en la función predictora lineal. En la componente sistemática de un MLG especifica las variables explicativas, que entran en forma de efectos fijos en un modelo lineal, es decir, las variables se relacionan como esta combinación lineal de variables explicativas se denomina predictor lineal. Al- ternativamente, se puede expresar como un vector ( 1 2 ) tal que donde es el valor del ésimo predictor en el ésimo individuo, e = 1 2. El término independiente se obtendría con esta notación haciendo que todos los sean iguales a 1 8 los. Ejemplo 2.3 El modelo más sencillo podría expresar a combinación lineal de las variables independientes como una siendo parámetros a estimar
50 Función de Link Es una función del valor esperado de, [ ] como una combinación lineal de las variables predictoras. Se denota el valor esperado de como μ = [ ], entonces, la función link especifica una función () que relaciona μ con el predictor lineal como (μ) = así, la función link () relaciona las componentes aleatorias y sistemática. De este modo, para = 1 2 Ejemplo 2.4 La función más simple es (μ) = μ, esto es, la identidad (μ) = μ = [ ] = que da lugar al modelo de regresión lineal clásico = μ+ donde, es el vector de dimensión 1 de la variable respuesta el componente sistemático. μ =[ ] = es una matriz de dimensión ( + 1) del modelo = ( ) = ( 1 2 ) que también representa al componente aleatorio con 45 45
51 2.5. Modelos Lineales Generalizados para Datos Binarios En muchos casos las respuestas tienen solo dos categorías del tipo si/no de modo que se de ne una variable aleatoria que tome dos posibles variables 1 (éxito) y 0 (fracaso), es decir, de modo que, para = 0 1 tendremos ~ (1 ) luego, según la familia exponencial, el parámetro natural es y se define como donde = ( = 1) 1 = ( = 0) y la razón se llama razón de probabilidades. Utilizando función link se tiene: 46 46
52 el modelo lineal generalizado. Explícitamente desarrollado se tiene. de donde se deduce que esto se define por [ ] = = exp( ) 1 + exp( ) ( ) = exp( ) 1 + exp( ) y se denomina la función logística de la que se derivan los modelos de regresión logística Estimación de Parámetros en un modelo de Regresión Logística Sabemos que la forma general del modelo de regresión logística es = [ ] + ; = 1 2 donde las observaciones son variables aleatorias independientes de Bernoulli, cuyos valores esperados son 47 47
53 Usaremos el método de máxima verosimilitud para estimar los parámetros del predictor lineal β. Sea 1 2 una muestra aleatoria de tamaño y para cada valor de la variable la función de cuantía es naturalmente, cada observación son independientes, la función de verosimilitud es toma el valor 0 ó 1. Como las observaciones por la razones ya explicadas en el Capítulo 1, es más cómodo trabajar con el logaritmo de la función de verosimilitud Ahora bien, para por tanto derivando se tiene por tanto derivando se tiene 48 48
54 para aplicar este algoritmo es necesario partir de unas estimaciones iniciales β 0. Se podría usar métodos numéricos, para calcular los estimadores de los β 0β 1 β k 49 49
55 Capítulo 3 APLICACIÓN DEL MODELO LOGÍSTICO 3.1. Introducción Sabemos que la función logística es entonces a partir de esta expresión se estima la matriz. En el presente trabajo de tesis, como soporte informático para el análisis de datos utilizaremos el lenguaje R en su versión Como sabemos que el software R es 50 50
56 un conjunto de programas integrados para el manejo de datos, para simulación de datos, cálculos y realización de grá cos. Es además un lenguaje de programación orientado a objetos y de libre implementación en cualquier PC. La forma más fácil de usar R es en forma interactiva mediante la línea de comandos. Una vez instalado hay hacer doble clik en el ícono de R, para que aparezca la ventana del programa Gui (grafhical user interface) con un mensaje de apertura. Debajo de este mensaje de apertura en la consola de R se encuentra el prompt que es el símbolo ( mayor ) Dos Aplicaciones de Modelos Lineales Generalizados Producción de Cobb-Douglas Una empresa de investigación de mercados está interesada en realizar un estudio para el gobierno sobre la industria aeronáutica de los Estados Unidos. Para ello, va a estimar la función de producción Cobb-Douglas estocástica aumentada por la variable el avance tecnológico, ya que aplicando logaritmos tendremos (^) = log( ) + 3 log( ) + 4 log( ) donde es la producción (en millones de dólares), es el nivel de empleo ( que representaremos a través del agregado de las nóminas en millones de dólares), es el nivel de capital utilizado (en millones de dólares) y es el avance tecnológico, representado por la proporción del PIB de las empresas tecnológicas en el PIB total en la economía americana (en tanto por ciento).suponemos que esta relación de factores satisfacen las hipótesis de RLM con normalidad en el término de error. Consideramos datos anuales correspondientes a , que se muestran en la siguiente tabla. 50
57 Tabla 3.1: Inversión real en la economía de EE. UU. Observación Año Log(Y) Log(L) Log(K) Log(A)
58 Fuente: Proyecto e-math: Según la tabla anterior estimar el modelo de regresión lineal múltiple. Solución: Para estimar el modelo de regresión lineal múltiple, primero se debe estima los parámetros ; = Para tal propósito, se utiliza el lenguaje R. Para tal efecto vamos a considerar las siguientes denominaciones: Log(Y) = PROD (producción valorizados en millones de dólares). Log(L) = EMP (empleo de la nóminas en millones de dólares) Log(K) = CAP (nivel de capital utilizado en millones de dólares) Log(A) = TECN (es el avance tenológico según PIB en %) Los datos son ingresados al lenguaje R
59 53 53
60 Finalmente, el modelo de regresión lineal múltiple estimada estará dada por: PROD = EMP CAP TECN donde 2 = 09931, lo cual significa que el 9931 % de producción están explicadas por las variables EMP, CAP y TECN y un 069 % se explicarían por las variables no incluidas El Problema de los Ronquidos En muchos casos las respuestas tienen solo dos categorías del tipo si/no de modo que se puede definir una variable que tome dos posibles valores 1 (éxito) y 0 (fracaso), es decir en este caso ~ (1 ) con = 0 1. El parámetro natural es en este caso sabemos que [ ] = ( = 1) = () dependiente de variables explicativas = ( 1 2 ) y 54 54
61 [ ] = ()(1 ()) en respuestas binarias, un modelo análogo al de regresión lineal es () = que se denomina modelo de linealidad probabilidad lineal, ya que la probabilidad de éxito cambia linealmente con respecto a. El parámetro 1 representa el cambio de probabilidad por unidad de. Este modelo es un Modelo Lineal Generalizado con un componente aleatorio binomial y con función de enlace igual a la identidad. Tal como se aprecia en la aplicación siguiente. Se tiene la siguiente tabla donde se eligen varios niveles de ronquidos y se ponen en relación con una enfermedad cardíaca. Se toma como puntuaciones relativas de ronquidos los valores: Nunca! 0 Ocasional! 1 Casi cada noche! 2 Cada noche! 3 Tabla 3.2: Enfermedad cardiaca versus ronquidos Ronquido Enfermedad cardiaca SI NO PROPORCION SI Nunca Ocasional Casi cada noche Cada noche Fuente: Categor/Tema3Cate.pdf Encontramos la probabilidad para la gente que no ronca
62 Para estimar el modelo lineal generalizado binomial correspondiente, utilizaremos el lenguaje R. #Fijemos los valores de manera ordinal roncas ( ) prop.si (24( ) 35( ) 21( ) 30( )) modelo glm(prop.si ~ roncas) summary(modelo). Luego los parámetros estimados son: 0 = de donde se tiene que 1 = () = () para gente que no ronca ( = roncas = 0) la probabilidad estimada de enfermedad cardíaca sería ^ = En resumen, la gente que no ronca que es el 2 %, tienen enfermedad cardíaca y la probabilidad de ataque cardíaco aumenta cuando los niveles de ronquidos se incrementan
63 Conclusiones 1. El Modelo Lineal Generalizado es un método que se utiliza cuando la variable de repuesta Y no cumple con el supuesto de normalidad y homocedasticidad, para lo cual sólo se exige que la variable Y sea miembro de la familia exponencial. 2. En el presente trabajo de tesis se estudia como una aplicación del modelo lineal generalizado el modelo binario y el modelo logístico
64 Bibliografía [1] A.J.Dobson. (1996). An Introduction to Generalized Linear Models: Chapman & Hall. [2] J.A.Nelder&R.W.M.Wedderburn. (1992). Generalized Linear Models. J,R. Statist. Soc.A,135, [3] Francesc Carmona. (2003). Modelos Lineales. Universidad de Barcelona. [4] Sergio Martinez Valenzuela. (2000). Proyecciones Estadísticas. Lima-Perú. [5] A.G.Nogales. (1998). Estadística Matemática: Servicio de Publicaciones Uex. [6] Franklin A. Graybill. (1976). Teoría y Aplicación de Modelo Lineal. Colorado State University. [7] Maximo Mitacc Meza. (1999). Tópicos de Inferencia Estadística. Lima-Perú. [8] Anónimo. Google. [9] Clarice Garcia Borges Demetrio. (2002). Modelos Lineares Generalizados em Experimentação Agronômica. Piracicaba, SP. [10] Proyecto e-math: Google
INFERENCIA ESTADÍSTICA Notas de clase. Profesores: A. Leonardo Bañuelos S. Nayelli Manzanarez Gómez
INFERENCIA ESTADÍSTICA Notas de clase Profesores: A. Leonardo Bañuelos S. Naelli Manzanarez Gómez TEMA II ESTIMACIÓN PUNTUAL DE PARÁMETROS POBLACIONALES La estimación puntual de un parámetro relativo a
Más detallesRegresión Lineal Múltiple
Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta
Más detallesÍndice Introducción Economía y Estadística Análisis de Regresión. Clase 1. Introducción a la Econometría. Profesor: Felipe Avilés Lucero
Clase 1 Introducción a la Econometría Profesor: Felipe Avilés Lucero 26 de mayo de 2010 1 Introducción 2 Economía y Estadística 3 Análisis de Regresión Función de Regresión Poblacional Función de Regresión
Más detallesUNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE CIENCIAS MATEMATICAS E. A. P. INVESTIGACION OPERATIVA
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE CIENCIAS MATEMATICAS E. A. P. INVESTIGACION OPERATIVA Año de la Diversificación Productiva y del Fortalecimiento
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detallesRegresión múltiple. Demostraciones. Elisa Mª Molanes López
Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +
Más detallesCurso Inferencia. Miguel Ángel Chong R. 1 de octubre del 2012
Curso Estadística Miguel Ángel Chong R. miguel@sigma.iimas.unam.mx 1 de octubre del 2012 Definición Estadístico suficiente Un estadístico es suficiente respecto al parámetro si la distribución de probabilidad
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.
Más detallesFolleto de Estadísticas. Teoría del 2do Parcial
Folleto de Estadísticas Teoría del 2do Parcial 2012 Variables aleatorias conjuntas continuas: Sean X y Y dos variables aleatorias continuas con ellas se asocia una función denominada función de densidad
Más detallesMODELOS LINEALES GENERALIZADOS
MODELOS LINEALES GENERALIZADOS Conceptos básicos Ignacio Méndez Gómez-Humarán imendez@cimat.mx Los Modelos Lineales Generalizados (GLM por sus siglas en inglés) son una familia de modelos estadísticos
Más detallesTema 6. Estimación puntual
1 Tema 6. Estimación puntual En este tema: Planteamiento del problema. Criterios de comparación de estimadores: Insesgadez. Estimadores de mínima varianza. Error cuadrático medio. Consistencia. Métodos
Más detallesNota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesEconometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios
Más detallesInformación sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.
Universidad Nacional Autónoma de Nicaragua UNAN-Managua Curso de Análisis y Diseño de Modelos Econométricos Profesor: MSc. Julio Rito Vargas Avilés. Participantes: Docentes /FAREM-Carazo Encuentro No.4
Más detallesEL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
Más detallesTema 2: Introducción a la Inferencia Estadística
Tema 2: Introducción a la Inferencia Estadística 1.- En m.a.s. el estadístico varianza muestral es: a) Un estimador insesgado de la varianza poblacional. b) Un estimador insesgado de la media poblacional.
Más detallesRepresentaciones gráficas de las distribuciones bidimensionales de frecuencias... 74
Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................
Más detallesEstadística I Tema 5: Introducción a la inferencia estadística
Estadística I Tema 5: Introducción a la inferencia estadística Tema 5. Introducción a la inferencia estadística Contenidos Objetivos. Estimación puntual. Bondad de ajuste a una distribución. Distribución
Más detallesEstadística /Química 2004
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLAN LICENCIATURA EN: QUÍMICA. NOMBRE DE LA ASIGNATURA: ESTADÍSTICA. ÓRGANO INTERNO QUE COORDINA EL PROGRAMA DE LA ASIGNATURA:
Más detallesPROGRAMA DE CURSO. Horas de Trabajo Personal Horas de Cátedra. Básica. Resultados de Aprendizaje
Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT es Docentes PROGRAMA DE CURSO Horas de Cátedra Horas Docencia Auxiliar Horas de Trabajo Personal 6 10 3
Más detallesTema 3 - Introducción. Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2.
Tema 3 - Introducción 1 Tema 2. Distribuciones en el muestreo Estadísticos y distribución muestral. Ejemplos: X y S 2. Tema 3. Estimación puntual Criterios de comparación de estimadores: Insesgadez. Estimadores
Más detallesElementos de probabilidad e inferencia estadística en el seguro
Elementos de probabilidad e inferencia estadística en el seguro Instructor: Act. Erick Mier Moreno. Director general y profesor de AMAT- Applied Mathematics and Actuary Training. Profesor de asignatura
Más detallesECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
Más detallesEconometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 II. El modelo de regresión lineal Esperanza condicional I Ejemplo: La distribución de los salarios
Más detallesFundamentos para la inferencia. Estadística Prof. Tamara Burdisso
Fundamentos para la inferencia Estadística 018 - Prof. Tamara Burdisso 1 Distribución muestral de la varianza muestral Hasta aquí nos ocupamos de hacer inferencia sobre la media y/o la proporción de una
Más detallesESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía
ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía Novedades en el Plan de Trabajo Desviación típica sesgada
Más detallesPart VII. Estadística I. Mario Francisco. Introducción a la inferencia. Estimación puntual. Propiedades deseables de los estimadores
Part VII La inferencia puede definirse como el conjunto de métodos mediante cuales podemos extraer información sobre distintas características de interés de cierta distribución de probabilidad de la cual
Más detallesFacultad de Ciencias Sociales - Universidad de la República
Facultad de Ciencias Sociales - Universidad de la República Estadística y sus aplicaciones en Ciencias Sociales Edición 2016 Ciclo Avanzado 3er. Semestre (Licenciatura en Ciencia Política/ Licenciatura
Más detallesINDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres
INDICE Capitulo uno Introducción y estadísticas descriptiva 1.1. Introducción 1.2. descripción grafica de los datos 3 1.3. medidas numéricas descriptivas 11 Ejercicios 22 Apéndice: sumatorias y otras notaciones
Más detallesPROGRAMA DE CURSO. Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT
PROGRAMA DE CURSO Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT Unidades Horas de Horas Docencia Horas de Trabajo Docentes Cátedra Auxiliar Personal
Más detallesINTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA
UNIVERSIDAD AUTÓNOMA CHAPINGO DIVISIÓN DE CIENCIAS FORESTALES CARRERA DE: Licenciado en Estadística PROGRAMA DE LA ASIGNATURA DE INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DATOS GENERALES Departamento (División):
Más detallesTécnicas Cuantitativas para el Management y los Negocios I
Técnicas Cuantitativas para el Management y los Negocios I Licenciado en Administración Módulo II: ESTADÍSTICA INFERENCIAL Contenidos Módulo II Unidad 4. Probabilidad Conceptos básicos de probabilidad:
Más detallesSelección de distribuciones de probabilidad
Selección de distribuciones de probabilidad Patricia Kisbye FaMAF 6 de mayo, 2010 Análisis estadístico de datos simulados Los sistemas reales tienen fuentes de aleatoriedad: Tipo de sistema Fabricación
Más detallesTema 6. Estimación puntual
Tema 6. Estimación puntual Contenidos Planteamiento del problema Criterios de comparación de estimadores: Insesgadez Estimadores de mínima varianza Error cuadrático medio Consistencia Métodos para obtener
Más detallesTema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
Más detallesCurso Inferencia. Miguel Ángel Chong R. 10 de septiembre del 2013
Curso Estadística Miguel Ángel Chong R. miguel@sigma.iimas.unam.mx 10 de septiembre del 013 Distribución de la diferencia de medias muestrales cuando se conoce la varianza poblacional. En muchas situaciones
Más detallesUnidad V: Estadística aplicada
Unidad V: Estadística aplicada 5.1 Inferencia estadística: Concepto, Estimación, Prueba de hipótesis La Inferencia Estadística es la parte de la estadística matemática que se encarga del estudio de los
Más detallesTema 2. Heterocedasticidad. 1 El modelo de regresión lineal con errores heterocedásticos
ema 2. Heterocedasticidad. El modelo de regresión lineal con errores heterocedásticos En este tema vamos a analizar el modelo de regresión lineal Y t = X tβ + u t, donde X t = (X t, X 2t,.., X kt y β =
Más detallesRelación 3 de problemas
ESTADÍSTICA II Curso 2016/2017 Grado en Matemáticas Relación 3 de problemas 1. La Comunidad de Madrid evalúa anualmente a los alumnos de sexto de primaria de todos los colegios sobre varias materias. Con
Más detallesEXÁMEN INFERENCIA ESTADÍSTICA I Diplomado en Estadística Convocatoria de Febrero 2006
EXÁMEN INFERENCIA ESTADÍSTICA I Diplomado en Estadística Convocatoria de Febrero 6 Problema ( ptos) Considera un experimento aleatorio con espacio muestral Ω. a) Definir una σ-álgebra A sobre Ω. b) Dar
Más detallesRegresión Lineal Simple y Múltiple Regresión Logística
Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión
Más detallesEstadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Más detallesEstadística Económica y Estadística Empresarial
Universidad de Valladolid Facultad de Ciencias Económicas y Empresariales Departamento de Estadística y Econometría Licenciatura en Ciencias Económicas Sin docencia. Plan a extinguir Proyecto docente de:
Más detallesEstimación. Introducción. Sea X la variable aleatoria poblacional con distribución de probabilidad f θ donde. es el parámetro poblacional desconocido
Tema : Introducción a la Teoría de la Estimación Introducción Sea X la variable aleatoria poblacional con distribución de probabilidad f θ (x), donde θ Θ es el parámetro poblacional desconocido Objetivo:
Más detallesDEPARTAMENTO: Matemáticas NOMBRE DEL CURSO: Probabilidad y Estadística CLAVE: 1016M ACADEMIA A LA QUE PERTENECE: Probabilidad y Estadística
PROGRAMA DE CURSO Modelo 2009 DEPARTAMENTO: Matemáticas NOMBRE DEL CURSO: Probabilidad y Estadística CLAVE: 1016M ACADEMIA A LA QUE PERTENECE: Probabilidad y Estadística PROFESIONAL ASOCIADO Y LICENCIATURA
Más detallesClasificación Supervisada
Clasificación Supervisada Ricardo Fraiman 26 de abril de 2010 Resumen Reglas de Clasificación Resumen Reglas de Clasificación Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesInferencia Estadística
Inferencia Estadística 2do C. 2018 Mg. Stella Figueroa Clase Nº10 Población y Muestra- Parámetro y Estimación puntual Población: Es el conjunto de todos los elementos o unidades elementales con características
Más detallesEstimación de Parámetros. Un problema inherente al uso de modelos es el de la selección del modelo.
Estimación de Parámetros Un problema inherente al uso de modelos es el de la selección del modelo. Este problema, cuando se recurre al empleo de familias paramétricas de modelos, se puede plantear en dos
Más detallesIntroducción a la Inferencia Estadística
MÁSTER EN ESTADÍSTICA PÚBLICA Experto Universitario: Estadística Aplicada y Técnicas de Encuestación 1 Introducción a la Inferencia Estadística Estimación puntual paramétrica M a Teresa Gómez Departamento
Más detallesTaller I Econometría I
Taller I Econometría I 1. Considere el modelo Y i β 1 + ɛ i, i 1,..., n donde ɛ i i.i.d. N (0, σ 2 ). a) Halle el estimador de β 1 por el método de mínimos cuadrados ordinarios. Para realizar el procedimiento
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Más detallesTeórica básica. Incluimos. - Temas
Teórica básica Incluimos - Temas 1 - Tema 1: Fenómenos aleatorios. Conceptos de probabilidad. Propiedades. Independencia de sucesos. Teorema de Bayes. - Tema 2: Variables aleatorias. Variables discretas.
Más detallesModelos elección discreta y variable dependiente limitada
Modelos elección discreta y variable dependiente limitada Profesor: Graciela Sanroman Facultad de Ciencias Económicas y Administración Año 2010 Modelos multinomiales Los modelos multinomiales son aquellos
Más detallesESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA
GUÍA DOCENTE 2012-2013 ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA 1. Denominación de la asignatura: ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA Titulación GRADO EN FINANZAS Y CONTABILIDAD Código 5592
Más detallesPlanificaciones Probabilidad y Estadística A. Docente responsable: MANCILLA AGUILAR JOSE LUIS. 1 de 5
Planificaciones 6106 - Probabilidad y Estadística A Docente responsable: MANCILLA AGUILAR JOSE LUIS 1 de 5 OBJETIVOS 1) Introducir al alumno en la comprensión de la necesidad y oportunidad de la aplicación
Más detallesMATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I
CONOCIMIENTOS MÍNIMOS MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I CONTENIDOS DESTREZAS Aritmética y Álgebra Números reales, Operaciones con potencias y radicales, notación científica Aritmética mercantil:
Más detallesCurso Inferencia. Miguel Ángel Chong R. 24 de septiembre del 2013
Curso Estadística Miguel Ángel Chong R. miguel@sigma.iimas.unam.mx 24 de septiembre del 2013 Suficiencia Cuando hacemos inferencia sobre un parámetro, usando una muestra aleatoria (X 1,...,X n )yunestadísticoˆ
Más detallesT2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
Más detallesDiplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López
Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López Brindar al alumno los conocimientos de los métodos econométricos fundamentales y de los conceptos estadísticos que éstos requieren,
Más detallesPlanificaciones Probabilidad y Estadística A. Docente responsable: MANCILLA AGUILAR JOSE LUIS. 1 de 6
Planificaciones 8103 - Probabilidad y Estadística A Docente responsable: MANCILLA AGUILAR JOSE LUIS 1 de 6 OBJETIVOS 1) Introducir al alumno en la comprensión de la necesidad y oportunidad de la aplicación
Más detallesPlanificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6
Planificaciones 6109 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la
Más detallesPlanificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6
Planificaciones 8104 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la
Más detallesGuía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA
1. Introducción Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA Los análisis económicos y empresariales se efectúan sobre la base de la toma de decisiones, las cuales se toman a partir de la información
Más detallesEstadística para la Economía y la Gestión IN 3401
Estadística para la Economía y la Gestión IN 3401 3 de junio de 2010 1 Modelo de Regresión con 2 Variables Método de Mínimos Cuadrados Ordinarios Supuestos detrás del método MCO Errores estándar de los
Más detallesModelos de suavizado, aditivos y mixtos
Carmen Armero 1 de junio de 2011 Introducción Introducción Modelos lineales, LM Modelos aditivos, AM Modelos lineales generalizados, GLM GAM I Un modelo lineal generalizado (GAM) es un modelo lineal generalizado
Más detalles1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos
TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación
Más detallesPROGRAMA DE ESTADÍSTICA DESCRIPTIVA
PROGRAMA DE ESTADÍSTICA DESCRIPTIVA CONCEPTOS BÁSICOS DE ESTADÍSTICA Definición de Estadística Origen del concepto. Evolución histórica de la Estadística Estadística Descriptiva y Estadística Inferencial
Más detallesOBJETIVOS DOCENTES Y ORGANIZACIÓN ACADÉMICA DE LA ASIGNATURA DE ESTADÍSTICA
OBJETIVOS DOCENTES Y ORGANIZACIÓN ACADÉMICA DE LA ASIGNATURA DE ESTADÍSTICA Curso 2012-13 1. OBJETIVOS GENERALES El programa docente de esta asignatura está planteado con el objetivo general de inculcar
Más detallesESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio
ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio Muestra aleatoria Conceptos probabiĺısticos básicos El problema de inferencia Estadísticos. Media y varianza
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesPROGRAMA DE ASIGNATURA. CARÁCTER: Obligatoria CARRERA: Licenciatura en Ciencias de la Computación Profesorado en Física Profesorado en Matemática
PROGRAMA DE ASIGNATURA ASIGNATURA: Probabilidad y Estadística Introducción a la Probabilidad y Estadísitica AÑO: 2012 CARÁCTER: Obligatoria CARRERA: Licenciatura en Ciencias de la Computación Profesorado
Más detallesGeneralmente, el objetivo de cualquier estudio de econometría es la. búsqueda de relaciones matemáticas que permitan explicar el comportamiento
5. METODOLOGÍA ECONOMÉTRICA. Generalmente, el objetivo de cualquier estudio de econometría es la búsqueda de relaciones matemáticas que permitan explicar el comportamiento de una variable económica a partir
Más detallesESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que
Más detallesTema 6: Introducción a la inferencia estadística
Tema 6: Introducción a la inferencia estadística Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 6: Introducción a la inferencia estadística
Más detallesMATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I Y II CONTENIDOS BACHILLERATO
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I Y II CONTENIDOS BACHILLERATO BLOQUE 1. PROCESOS, MÉTODOS Y ACTITUDES EN MATEMÁTICAS Los contenidos de este bloque se desarrollan de forma simultánea al resto
Más detallesMínimos Cuadrados Generalizados
Mínimos Cuadrados Generalizados Román Salmerón Gómez Los dos últimos temas de la asignatura han estado enfocados en estudiar por separado la relajación de las hipótesis de que las perturbaciones estén
Más detallesEstadística para las Ciencias Agropecuarias
Estadística para las Ciencias Agropecuarias Séptima Edición Di Rienzo, Julio Alejandro Casanoves, Fernando Gonzalez, Laura Alicia Tablada, Elena Margot Díaz, María del Pilar Robledo, Carlos Walter Balzarini,
Más detallesINTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
Más detallesProbabilidades y Estadística
Probabilidades y Estadística Profesor: Fernando Lema Auxiliares: Víctor Carmi - Abelino Jiménez Universidad de Chile Indice General 1 Indice General 1 Advertencias y Recomendaciones Tener presente siempre
Más detallesCálculo de Probabilidades II Preguntas Tema 2
Cálculo de Probabilidades II Preguntas Tema 2 1. Demuestre que la suma de n v.a. Bernuolli(p) independientes tiene una distribución Binomial con parametros (n, p). 2. Se dice que una v.a tiene una distribución
Más detallesPrograma Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Econometría
Ficha Técnica Titulación: Grado en Administración y Dirección de Empresas Plan BOE: BOE número 67 de 19 de marzo de 2014 Asignatura: Módulo: Análisis Económico Curso: Créditos ECTS: 6 Tipo de asignatura:
Más detallesUnidad Temática 2: Unidad 5 Estadística Inferencial Temas 10 y 11
Unidad Temática 2: Unidad 5 Estadística Inferencial Temas 10 y 11 Distribución de Probabilidad Recordamos conceptos: Variable aleatoria: es aquella que se asocia un número o un dato probabilístico, como
Más detallesPage 1 of 5 Departamento: Dpto Matematica Nombre del curso: PROBABILIDAD Y ESTADÍSTICA Clave: 003872 Academia a la que pertenece: Probabilidad y Estadística Requisitos: Requisito de Probabilidad y Estad
Más detallesUNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA)
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS 1. INFORMACIÓN GENERAL
Más detallesIntroducción a la Econometría
1Econometría Introducción a la Econometría -Que es la econometría - Por que una disciplina aparte? -Metodología de la econometría Planeamiento de la teoría o hipótesis Especificación del modelo matemático
Más detallesModelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media:
Modelo Lineal Generalizado GAMMA Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: La distribución gamma es de tipo exponencial: 1 Supongamos que se dispone de r subpoblaciones
Más detallesSumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...
ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro
Más detallesASIGNATURA: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA
ASIGNATURA: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA PLAN NUEVO (1. er cuatrimestre) (Código: 523064) 1. EQUIPO DOCENTE Dr. D. Vicente Novo Sanjurjo. Profesor Titular Dr. D. Bienvenido Jiménez Martín. Profesor
Más detallesAuxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13
Auxiliar 9 MNL y MLE Daniel Olcay IN4402 21 de octubre de 2014 Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de 2014 1 / 13 Índice Modelos no lineales Probabilidad lineal Probit Logit Máxima verosimilitud
Más detallesComportamiento asintótico de estimadores
Comportamiento asintótico de estimadores Seguimos con variable X con función de densidad/masa f (x; θ). Queremos estimar θ. Dada una muestra aleatoria, definimos un estimador T = h(x 1,..., X n ) Esperamos/deseamos
Más detallesBLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población
BLOQUE III: INFERENCIA ESTADISTICA TEMA 8. MUESTREO Y DISTRIBUCIONES DE MUESTREO 1. Introducción a la Inferencia Estadística X, variable aleatoria de interés sobre una determinada población Observar el
Más detallesModelos Lineales Generalizados
Modelos Lineales Generalizados 1 DefinicióndeunMLG Y1,Y2,...,Yn,conmediasµ1,µ2,...,µn,Yi, i=1,...,n,tienefdpmiembrodela familia exponencial a un parámetro, con las siguientes propiedades: 1.LadistribucióndecadaunodelosYi,paratodoi,estáenlaformacanónica,i.e.:
Más detallesESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía
ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Introducción a la estimación de parámetros
Más detallesEconometría Aplicada
Econometría Aplicada Inferencia estadística, bondad de ajuste y predicción Víctor Medina Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza La pregunta que
Más detalles