Modelo Lineal Generalizado. 1er. Cuatrimestre de 2010

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Modelo Lineal Generalizado. 1er. Cuatrimestre de 2010"

Transcripción

1 Modelo Lineal Generalizado 1er. Cuatrimestre de

2 M.L.G. Ana M. Bianco FCEyN Nuestro ojetivo será estudiar la relación entre dos o más variables, que podrán ser tanto continuas como categóricas. En algunos casos diferenciaremos entre variable de respuesta y variables explicativas, mientras que en otros, simplemente, nos interesará estudiar la asociación entre las variables presentes sin hacer esta distinción. AdiferenciadeloquesetratahabitualmenteenModeloLineal,lavariablede respuesta podrá ser categórica. Abordaremos tres grandes temas:

3 M.L.G. Ana M. Bianco FCEyN Tablas de Contingencia Modelo Lineal Generalizado Modelos Log-lineales Veremos algunos ejemplos que introduzcan estos temas.

4 M.L.G. Ana M. Bianco FCEyN Consideremos el caso en el una muestra de 980 norteamericanos fue clasificada de acuerdo con el sexo y su identificación poĺıtico-partidaria. En esta situación nos interesa estudiar si hay asociación o no entre las variables categóricas G: Género y C:Identificación partidaria. C: Identificación partidaria G: Género Demócrata Independiente Republicano Total Femenino Masculino Total Cuadro 1: General Social Survey, 1991 Esta es una tablas de contingencia bastante sencilla.

5 M.L.G. Ana M. Bianco FCEyN Para responder a esto, en primera instancia, veremos los test de independencia odehomogeneidadbasadosenladistribuciónχ 2 quefueronintroducidospor Pearson. Sin embargo, estos tests, como muchos otros, tienen algunas limitaciones. Unadeellasesquesibiennosindicancuantaevidenciadeasociaciónentre lasvariablesdeinterésexiste,nonosdicennadasobrelanaturalezadeesta relación. Para comprender más profundamente la asociación entre variables nos ayudarán los modelos log-lineales y los modelos lineales generalizados, siendo estos últimos una generalización del modelo lineal habitual.

6 M.L.G. Ana M. Bianco FCEyN Ejemplo: Datos del Titanic Estos datos se pueden encontrar en corresponden a un curso dictado por la Prof. Claudia Czado de la Technishe Universität München y tienen como fuente Las variables consideradas son Name: Nombre del Pasajero PClass: Clase del Pasajero Age: Edad del Pasajero Sex: Género del Pasajero Survived: Survived=1 el Pasajero sobrevivió Survived=0 el Pasajero no sobrevivió

7 M.L.G. Ana M. Bianco FCEyN titanic - read.table( c: users ana glm titanic.txt, header = T) attach(titanic) names(titanic) Name PClass Age Sex Survived length(age) [1] 1313 table(pclass) PClass 1st 2nd 3rd table(sex) Sex female male table(survived) Survived

8 M.L.G. Ana M. Bianco FCEyN table(survived,pclass) PClass Survived 1st 2nd 3rd table(survived,sex) Sex Survived female male El objetivo es describir la asociació entre las variables presentes. Por ejemplo, deestasdosúltimastablaspodríamosdecirquelospasajeroshombresylosde tercera clase sobrevivieron menos. En este ejemplo consideramos a Survival como variable de respuesta y a las demás como predictoras. En este caso, las variables predictoras pueden ser variables categóricas, ordinales o no, o biencuantitativas, ya sea continuas o discretas.

9 M.L.G. Ana M. Bianco FCEyN Sex Survival Female Male Cuadro2:Tablade2 2 En forma genérica X Y π(0) 1 π(1) 1 π(0) π(1) Cuadro3:Tablade2 2 En esta situación podríamos intentar modelar la variable de respuesta en función de las explicativas.

10 M.L.G. Ana M. Bianco FCEyN Recordemos que en el modelo lineal simple habitual, si Y es nuestra variable de respuesta y x una variable explicativa podemos formular el modelo como: E(Y)=β 0 +β 1 x (1) Si, como en el ejemplo, nuestra variable de respuesta es binomial, entonces E(Y)=π,porlotantolageneralizacióninmediatade(1)sería: E(Y)=π=π(x)=β 0 +β 1 x (2) Sinembargo,(2)nopareceserunmodeloadecuado,puesβ 0 +β 1 xpodría tomar valores fuera del intervalo(0, 1). Unproblemaevidentedeestemodeloesquelaprobabilidadπesacotada, mientrasquelasx β(enelcasodeunvectordecovariables)puedentomar cualquier valor real. Si bien esto podría controlarse imponiendo complicadas restricciones a los coeficientes, esta solución no resulta muy natural.

11 M.L.G. Ana M. Bianco FCEyN Una solución sencilla es transformar la probabilidad mediante una función que mapee el intervalo(0, 1) sobre la recta real y luego modelar esta transformación como una función lineal de las variables independientes. Una elección muy frecuente es: π logit(π) = log =β o +β 1 x 1 π que da origen al modelo de regresión logística. Otra forma de escribirlo es π(x)= eβ o+β 1 x 1+e β o+β 1 x Esta es sólo una elección posible y veremos más adelante porque es una elección razonable. Un punto a destacar es que en este modelo es natural la heteroscedasticidad, puesv(y)=π(1 π),queseráfuncióndex. Elmodelodefinidoseconocecomomodelologístico,esuncasodelmodelo

12 M.L.G. Ana M. Bianco FCEyN Logistica Probit Log-log

13 M.L.G. Ana M. Bianco FCEyN lineal generalizado con respuesta binomial y función de enlace logit. Sibienloscoeficientesβtienenunainterpretaciónsimilaralaquetienenen elmodelolineal,debemostenerencuentaqueelmiembrodeladerechaesun logitynounamedia,porloquedeberemosprecisarcuálessusignificadoen este caso. Estos temas los desarrollaremos en el contexto más general del modelo lineal generalizado. Este modelo es una extensión que comprende al modelo lineal que aplicamos cuando el supuesto de normalidad es razonable y que abarca también el caso de una respuesta Poisson, Binomial Negativa, Gamma, Exponencial, etc. Una vez establecido el modelo que queremos ajustar deberemos estimar los parámetros, hallar intervalos de confianza para los mismos, evaluar la bondad delajusteyesprobablequenosintereserealizaralgúntestqueinvolucrealos parámetros. También tendremos que evaluar la influencia de las observaciones en la determinación de los valores estimados.

14 M.L.G. Ana M. Bianco FCEyN Ennuestroúltimoejemploconsideramosdenuevoelcasodeunatablade contingencia. Supongamos F es la variable que identificamos en las filas y C ladelascolumnasyquenosinteresaestudiarlaasociacióndelasvariables categóricas. C F j.. J i.. π ij I Cuadro 4: Tabla Genérica SabemosquesiFyCsonindependientes,lasπ ij sepuedenescribirentérminos

15 M.L.G. Ana M. Bianco FCEyN de las marginales como π ij =π F i π C j. Qué ocurre en el caso general cuando no suponemos independencia? Sipensamosenlosvaloresesperados,m ij =nπ ij tambiénpodremosexpresar am ij usandounmodelomultiplicativo: m ij =ττ F i τ C jτ FC ij, (3) donde, como en ANOVA, los τ deberán satisfacer ciertas restricciones. Si tomamos logaritmo en(3) queda: logm ij =logτ+logτ F i +logτ C j +logτ FC ij logm ij =µ+µ F i +µ C j +µ FC ij que resulta un modelo aditivo, al que estamos más acostumbrados.

16 M.L.G. Ana M. Bianco FCEyN Este tipo de modelos recibe el nombre de log-lineal. Una diferencia con el modelo lineal habitual es que aquí las dos variables tienen un rol simétrico. El investigador deducirá una asociación entre las variables interpretando los parámetros. Esta tareapuedesermásomenoscomplejasilacantidaddeparámetrosesmuy elevada, como ocurre cuando aumenta el número de variables en el problema.

17 M.L.G. Ana M. Bianco FCEyN Bibliografía: Agresti, A.(1990). Categorical Data Analysis. Wiley, New York. Christensen, R.(1997). Log-linear Models and Logistic Regression. 2da. Edición. New York: Springer Verlag. Bishop, I., Fienberg, S. y Holland, P.(1976). Discrete Multivariater Analysis: Theory and Practice. Dobson, A.(2001). An Introduction to Generalized Linear Models. 2da. Edición. Londres: Chapman and Hall. Lindsey, J.(1997). Applying Generalized Linear Models. New York: Springer Verlag. Mc. Cullagh y Nelder, J. A.(1989). Generalized Linear Models. 2da. Edición. Londres: Chapman and Hall. Santner, T. y Duffy, D.(1989). The Statistical Analysis of Discrete Data. New York: Springer Verlag. Rao, C. R.(1965). Linear Statistical Inference and Its Applications. New York: Wiley.

18 M.L.G. Ana M. Bianco FCEyN Tablas de Contingencia Enlaprimerapartedelcursoestudiaremoslarelaciónentre2ó3variables categóricas. Introduciremos parámetros que describan la asociación entre variables categóricas y luego haremos inferencia sobre estos parámetro SeanXeY dosvariablescategóricasderespuesta,demaneraquextienei niveles e Y tiene J niveles posibles. Cuando clasificamos sujetos de acuerdo a las dos variables tenemos IJ combinaciones posibles. Las casillas de la tabla representan los IJ resultados posibles. La probabilidad de que(x,y)tomeelvalor(i,j)seráπ ij.cuandolasceldascontienenlafrecuenciadecadaresultadoijtenemosunatabladecontingencia,términoque introdujo Pearson en También suele llamársela tabla de clasificación cruzada.unatabladecontingenciaconifilasyjcolumnassediceunatabla dei J.

19 M.L.G. Ana M. Bianco FCEyN Y X j.. J i.. π ij I Cuadro 5: Distribución Conjunta Ladistribucióndeprobabilidadπ ij esladistribuciónconjuntadexey,mientras que las marginales de ambas variables las obtendremos sumando filas y columnas respectivamente:π i+ yπ +j,donde π i+ = J j=1 π ij π +j = I i=1 π ij

20 M.L.G. Ana M. Bianco FCEyN Enmuchoscasosunadelasvariables,digamosY esunavariablederespuesta ylaotra,x,esunavariableexplicativa.engeneral,esdeinterésestudiarcómo cambialadistribucióndey cuandopasamosdeunniveldexaotro.dado queunsujetoestáclasificadoenlafilaidex,π j i eslaprobabilidaddeque clasifiqueenlacolumnajdey,esdecir{π 1 i,...,π J i }esla probabilidad condicionaldeydadoquex=i.entérminosdelasprobabilidadesdefinidas, tenemos que π j i = π ij π i+ i,j. DiremosqueXeY son independientessi y cuando vale la independencia π ij =π i+ π +j i,j, π j i = π ij π i+ = π i+π +j π i+ =π +j i,j.

21 M.L.G. Ana M. Bianco FCEyN Enunatablade2 2tendríamos: Columnas Filas 1 2 Total 1 π 11 π 12 π 1+ (π 1 1 ) (π 2 1 ) (1) 2 π 21 π 22 π 2+ (π 1 2 ) (π 2 2 ) (1) Total π +1 π +2 1 Cuadro6:Distribución2 2

22 M.L.G. Ana M. Bianco FCEyN Supongamos que en n individuos observamos(x, Y) y volcamos esta informaciónenunatabladecontingencia:n ij elnúmerodeindividuosquetienenx=i ey =j,demaneraque n= I i=1 J j=1 n ij. En el caso muestral la información también suele disponerse sobre una tabla comolaquesigue:

23 M.L.G. Ana M. Bianco FCEyN Y =1 Y =2 Y =j Y =J X=1 n 11 n 12 n 1J X=2 n 21 n 22 n 2J X=i n ij X=I n I1 n I2 n IJ Cuadro7:TabladeContingenciaGenéricadeI J Ejemplode2 2 Comencemos por considerar un ejemplo de los más sencillos de tablas de contingencia en el que tenemos dos variables. En general tendremos: Podría interesarnos testear la hipótesis hipótesis de independencia entre las variables. Podemos escribir esta hipótesis como

24 M.L.G. Ana M. Bianco FCEyN C:Creeenlavidapostmortem G:Género Si No Total Fem Masc Total Cuadro 8: General Social Survey, 1991 H o :π ij =π i+ π +j i j Para resolver este problema necesitamos estimar las probabilidades. Podríamos estimar las probabilidades bajo el supuesto de independencia y comparar los valores observadosn con los valores esperados bajo independencia mediante un estadísticoconocidocomoχ 2 depearsoncuyadistribuciónasintóticanecesitaremos estudiar. Podríamos estimar por máxima verosimilitud las probabilidades y realizar un test de cociente de verosimilitud. Para para esto necesitamos asumir una distribución subyacente.

25 M.L.G. Ana M. Bianco FCEyN C G Si No Total Fem n 11 n 12 n 1+ Masc n 21 n 22 n 2+ Total n +1 n +2 n ++ =n Cuadro9:Tablade2 2 Si cada una de las n observaciones es clasificada en forma independiente en unadelasi Jceldasdelatablaconprobabilidadπ ij,entonceselvector aleatorio que representa el número de individuos clasificados en la celda(i, j), n, tiene distribución multinomial. La frecuencias esperadas en cada casilla son µ ij =nπ ij.parai=j=2sería P(n=(n 11,...,n 22))= n! n 11!n 12!n 21!n 22! πn 11π n 12π n 21π n Salvo constantes, el log likelihood en el caso general queda:

26 M.L.G. Ana M. Bianco FCEyN l= I i=1 J j=1 n ijlogπ ij Lamaximizacióndeldebecontemplarque I J i=1 j=1 π ij =1. Lapreguntaaquíescómollegaronlosdatosalatabla.

27 M.L.G. Ana M. Bianco FCEyN Tipos de Muestreo Dada una tabla de contingencia hay varios esquemas de muestreo que pueden conduciralosdatostalcomoloshemosobservadoyquepodríaninfluirenel modelodeprobabilidadautilizar.enestecasotenemosdosfactoresf yc cadaunocondosniveles.engeneral,tendremosunfactorfilaconinivelesy unfactorcolumnaconjnivelesquecorrespondeaunatabladei J. ElnúmerototaldeceldasesN=I J.Lostotalesmarginalesmuestralesson n i+ = J n +j = I n ++ =n= I j=1 n ij totalfila i=1 n ij totalcolumna J n ij grantotal i=1j=1 Usaremosunanotaciónsimilaralaanterior,porejemplo,p ij seráproporción

28 M.L.G. Ana M. Bianco FCEyN muestraldelacasilla(i,j)definidapor p ij = n ij n. Las condicionales muestrales quedarán definidas análogamente, por ejemplo, p j i = p ij p i+ = n ij n i+ i,j. En el ejemplo anterior asumimos que todos los datos han sido recolectados muestreando 1091 individuos que fueron clasificados de acuerdo con el sexo y la creencia en la vida postmortem. Vemos las dos variables como respuesta y nos interesa su distribución conjunta. En los experimentos que responden a este esquema de muestreo, seleccionamos unamuestradenindividuosdeunapoblaciónyregistramoslosvalores(x,y) paracadaindividuo.ladistribuciónconjuntade{n ij }esmultinomialdeparámetrosnyπ={π ij }:M(n,π),donde π ij =P(X=i,Y =j).

29 M.L.G. Ana M. Bianco FCEyN Enestecasoelgrantotalnesconocidoyfijo.Aveces,seexpresalosparámetroscomomediasdelasceldas: µ ij =E(n ij )=nπ ij. Esto se conoce como muestreo multinomial. Dado que la distribucón multinomial aparecerá con frecuencia en el análisis de datos categóricos, repasaremos algunas de sus propiedades.

30 M.L.G. Ana M. Bianco FCEyN Distribución Multinomial Supongamos que realizamos n ensayos independientes, de manera que cada ensayopuederesultarenunodeloseventose 1,...,E N (lose j ssonmutuamenteexcluyentesyexhaustivos).encadaensayo,eleventoe j puedeocurrir conprobabilidadπ j yporlotantoπ π N =1. Si llamamos entonces X j = númerodevecesqueeleventoe j ocurre, X X N =n yladistribucióndex = (X 1,...,X N ) esmultinomialdeparámetrosny π=(π 1,...,π N ),esdecir X=(X 1,...,X N ) M(n,π 1,...,π N ) X=(X 1,...,X N ) M(n,Π).

31 M.L.G. Ana M. Bianco FCEyN De manera que: P(X 1 =x 1,...,X N =x N )= n! x 1!...x N! πx π x N n si N i=1 x i =n 0 caso contrario(c.c.) Como en el caso de la distribución binomial, algunas propiedades más elementales de esta distribución, como el cálculo de esperanza o matriz de covarianza, sededucenfácilmentepensandoaxcomounasumadevectoresde0 sy1 s. Más precisamente, podemos escribir X=Y Y n dondelasy i sonindependientesycadaunaesm(1,π 1,...,π N )=M(1,Π). Y i=(0,...,1,...,0) j

32 M.L.G. Ana M. Bianco FCEyN Y i esunvectorconun1enlacoordenadajsie j ocurrióeneli-ésimoensayo yenelrestodelasposiciones0 s. LoselementosdeY i sonbernoullicorrelacionadas.

33 M.L.G. Ana M. Bianco FCEyN Esperanza y Varianza Porejemplo,supongamosqueN=2yqueY M(1,π 1,π 2 ).Losresultados posibles son son conprobabilidadπ 1 conprobabilidadπ 2 =1 π 1 LamediadeY=(Y 1,Y 2 ) es ElsegundomomentodeYes: E(Y)= π 1 π 2 E(YY )=E Y 2 1 Y 1 Y 2 Y 1 Y 2 Y 2 2

34 M.L.G. Ana M. Bianco FCEyN = π π 2 Porlotanto,lamatrizdecovarianzadeYes: Σ Y =E(YY ) E(Y)E(Y ) = π π 2 π 1 π 2 (π 1, π 2 ) = π 1 (1 π 1 ) π 1 π 2 π 1 π 2 π 2 (1 π 2 )

35 M.L.G. Ana M. Bianco FCEyN VamosademostrarquesihayNresultadosposibleseY M(1,π 1,...,π N ) Probaremosquesiπ j 0, j Luego,siX M(n,π 1,...,π N ) E(Y)=Π=(π 1,...,π N ) Σ Y = (Π) ΠΠ rg(σ Y )=N 1. E(X)=nΠ Σ X = (nπ) nππ

36 M.L.G. Ana M. Bianco FCEyN Otras Propiedades Enumeraremos algunas propiedades de la distribución multinomial que nos resultarán útiles, algunas serán ejercicio de la práctica. 1. El espacio paramétrico natural de la distribución multinomial es el simplex, enr N definidopor S={π:π j >0,π π N =1}. 2.SiX=(X 1,...,X N ) M(n,π 1,...,π N ),entonces X j Bi(n,π j ) Cov(X i,x j )= nπ i π j i j, esdecirlasx i estánnegativamentecorrelacionadas. 3.SiX=(X 1,...,X N ) M(n,π 1,...,π N ),entonces X =(X 1 +X 2,X 3,...,X N ) M(n,π 1 +π 2,π 3,...,π N )

37 M.L.G. Ana M. Bianco FCEyN Es decir, si se colapsa una multinomial sumando celdas la distribución sigue siendo multinomial. 4.SeaX=(X 1,...,X N ) M(n,π 1,...,π N ).Consideremosladistribución condicional de X X1 +X 2 =z X X N =n z Losvectores(X 1,X 2 ) y(x 3,...,X N ) soncondicionalmenteindependientes y multinomiales: (X 1,X 2 ) M(z, (X 3,...,X N ) M(n z, π 1 π 1 +π 2, π 2 π 1 +π 2 ) π 3 π π N,..., π N π π N ) 5.SiX 1,...,X N sonvariablesindependientestalesquex j P(λ j ),entonces

38 M.L.G. Ana M. Bianco FCEyN donde (X 1,...,X N ) N j=1 X j =n M(n,π 1,...,π N ) π j = λ λ N Porlotanto,ladistribucióndeX 1,...,X N puedeserfactorizadaenel producto de y n= N λ j j=1 X j P( N j=1 λ j) (X 1,...,X N ) n=n M(n,π 1,...,π N ) Esto será especialmente útil a la hora de calcular la función de verosimilitud bajo ciertas condiciones.

39 M.L.G. Ana M. Bianco FCEyN En nuestro ejemplo hemos hablado de la función de verosimilitud, recordemos algunas propiedades. Propiedades de los Estimadores de Máxima Verosimilitud Recordemos que si la variable aleatoria Y tiene función de densidad(f.d.)o probabilidadpuntual(f.p.p.)f(y,θ),laverosimiltudl(θ,y)essimplementef(y,θ) miradacomofuncióndeθconyfijo. La función de probabilidad puntual o densidad es definida sobre el soporte y Y, mientras que la verosimilitud es definida sobre un espacio paramétrico Θ. En muchos casos es conveniente trbajar con el logaritmo de la verosimilitud (log-likelihood) l(θ,y)=logl(θ,y) Engeneral,tendremosunamuestraaleatoriaY 1,...,Y n conf.d.of.p.p.f(y,θ), de manera que la verosimilitud será:

40 M.L.G. Ana M. Bianco FCEyN y la log-versosimilitud L(θ)= n i=1 f(y i,θ) l(θ)=logl(θ)= n logf(y i,θ) i=1 UnapropiedadútildelosEMVesladeinvarianciaquedicequesigesuna funciónconinversag 1,demaneraqueφ=g(θ)implicaqueθ=g 1 (φ), entonceselemvdeφ, φ,secalculacomo ˆ siendoθelemvdeθ. ˆ ˆ φ=g(ˆ θ), Como ya sabemos, podemos maximizar L(θ) o bien maximizar l(θ). En problemas regulares, el EMV puede hallarse igualando a 0 las derivadas pimeras de l(θ) respecto de θ. Laderivadaprimeradel(θ)respectodeθsellamascore.Enelcasounivariado tenemos:

41 M.L.G. Ana M. Bianco FCEyN donde l (θ)= n i=1 u i(θ) u i (θ)= θ logf(y i,θ) Sitenemosqparámetros,θ=(θ 1,...,θ q ),elvectordescoreses l (θ)= l θ 1 l θ 2.. l θ q = n i=1 θ 1 logf(y i,θ) n i=1 θ 2 logf(y i,θ).. n i=1 θ q logf(y i,θ) Unapropiedadbienconocidadelscoreesquesuesperanzaesnula:

42 M.L.G. Ana M. Bianco FCEyN E(l (θ)) θ=θ 0 = l ((θ 0 ))f(y,θ 0 )dy= f (y,θ 0 ) f(y,θ 0 ) f(y,θ 0)dy=0 LavarianzadelosscoreesconocidacomolainformacióndeFisher.Enel caso univariado, la información de Fisher es: Recordemos que i(θ)=v(u(θ))=v(l (θ))=e [ (l (θ)) 2] i(θ)=e( l (θ))= E( 2 θ 2logf(y,θ)) Enelcasomultivariado,tendremosI(θ)esunamatrizdeq qtalque: 2 {I(θ)} ij = E( logf(y,θ)) θ i θ j En Estadística se probó que, bajo condiciones de regularidad, los EMV son asintóticamente normales, de manera que

43 M.L.G. Ana M. Bianco FCEyN n(ˆ θ θ) D N(0,I 1 (θ)) Cómo sería en el caso general de una multinomial cualquiera? Parasimplificarlanotación,indicaremos{n 1,...,n N }lasobservacionesde cadacasilla,conn= N i=1 n i ysiendo{π 1,...,π N }lasprobabilidadesdecada celda. Luego la función de verosimilitud será: L=L(π 1,...,π N )= n! N i=1 n i! N i=1 πn i i donde N i=1 π i=1 Comoellnesunafunciónestrictamentecreciente,hallarelmáximodeL equivaleahallarelmáximode

44 M.L.G. Ana M. Bianco FCEyN l=lnl=ln N n! i=1 n i! + N i=1 n ilnπ i donde N i=1 π i=1 Como N i=1 π i =1,entoncesπ N =1 N 1 i=1 π i yn!/ N i=1 n i!esconstante, buscamos el máximo de l=lnl=cte+ N 1 n ilnπ i +n N ln(1 N 1 π i) i=1 i=1 Para buscar los puntos críticos planteamos: Luego, l π i = n i π i n N 1 N 1 i=1 π i = n i π i n N π N =0

45 M.L.G. Ana M. Bianco FCEyN n i = π i n = 1 n N π N n N π ˆπ N = n N N n Porlotanto,talcomoesdeesperar ˆπ i = n ˆπ i N = n i n N n ˆπ i = n i n =p i i=1,...,n

46 M.L.G. Ana M. Bianco FCEyN Muestreo Poisson Otraposibilidadesquelos4datosdelatabladelejemploseanrealizaciones independientes de v.a. con distribución Poison. Un proceso que sustentaría este modelo es que en cada celda los individuos lleguenaleatoriamenteallugardondeselosclasifica.enestecasonnoestáprefijadoytodoslosvaloresdelatablasonaleatorios. En el muestreo de Poisson tenemos que n ij P(λ ij ) i =1,...,I j =1,...,J independientes. En este esquema el gran total no está fijo, sino que es aleatorio. Ejemplo: Supongamos que se realiza en un control de velocidad durante una hora. Para ellosecuentaconunradarqueregistralavelocidaddecadaautoquepasapor el puesto de observación. Supongamos que de cada auto que pasa se registra

47 M.L.G. Ana M. Bianco FCEyN lavelocidadylamarcadelauto.asíseobtienen X = marcadelauto(1=ford,2=fiat,3=chevrolet,4=otros) Y = sielautoexcedeelĺımitedevelocidad(1=si,0=no). Esclaroque,bajoindependencia,n P(λ ++ ). SitenemosunmuestreodePoisson,ladistribucióndelosn ij condicionalaque nestáfijoenunvalor,digamosn,yanoesmáspoisson,másaúnyanoson más independientes. Ladistribucióncondicionaldelosn ij dadoquen=n esmultinomial.para simplificarlanotación,indicaremos{n 1,...,n N },entoncessi N i=1 k i =n P(n 1 =k 1,...,n N =k N N i=1 n i=n ) = P ( n 1 =k 1,...,n N =k N N i=1 n i =n P(n=n ) )

48 M.L.G. Ana M. Bianco FCEyN = N = i=1 N e λ iλ k i i k i! i=1 λk i i = n! N i=1 k i! n! N i=1 k i! N i=1 πk i i N n! e λ i N i=1 λ i i=1 N 1 i=1 λ i dondeπ i = λ i N j=1 λ j ovolviendoalanotaciónoriginal: n n Entonces: π ij = λ ij λ ++

49 M.L.G. Ana M. Bianco FCEyN (n 1,...,n N ) n=n M(n,π 1,...,π N ). Esto nos servirá a la hora de plantear la verosimilitud cuando deseemos estimar. En efecto, podemos factorizar la verosimilitud como el producto del likelihood de lapoissonn(n P(λ ++ ))yellikelihooddeunamultinomialcorrespondiente a{n ij }dadon,conparámetros π ij = λ ij λ ++ Eltotalnnodainformaciónacercadelasπ ij. Es interesante observar, que desde el punto de vista de la verosimilitud, la inferenciasobreπeslamismasinesconsideradofijooaleatorio.

50 M.L.G. Ana M. Bianco FCEyN Muestreo Multinomial Independiente Otra alternativa podría ser que sea razonable asumir que se tomó una muestra de582mujeresyotramuestraindependientede509hombresalosquese clasificó según su creencia. En este caso nos centramos en la distribución condicional de la creencia dado cada nivel de género. Enesteesquemalostotalesporfilaestánfijosytenemosn 1 individuosde génerofemeninoyn 2 individuosdegéneromasculino. Siπ i eslaprobabilidaddequeelindividuocreaenlavidapostmortemparael nivel i de género tendremos: π i =P(C=1 G=i)= π i1 π i+ Lasvariablesdeinterésserán:Y i1 Bi(n i,π i ),i = 1,2,quecuentanel número de individuos que sí creen en cada género. Ladistribuciónconjuntade(Y 11,Y 21 )es

51 M.L.G. Ana M. Bianco FCEyN P((Y 11,Y 21 )=(y 11,y 21 ))= n 1! y 11!y 12! πy 11 1 (1 π 1 ) y 12 n 2! y 21!y 22! πy 21 2 (1 π 2 ) y 22 La hipótesis de interés es la de homogeneidad, es decir que la probabilidad decreenciaeslamismaenambosgénero: H 0 :π 1 =π 2 Notemosquebajoindependenciaπ ij =π i+ π +j,entonceslaprobabilidadcondicional π j i = π ij π i+ =π +j esdecirnodependedelafilai,conlocualhomogeneidadeindependenciason equivalentes. Supongamosquedecidimosdeantemanoquevamosamuestrearn i+ individuos conx=i(i=1,...,i)yqueparacadaunodeellosregistramoselvalorde Y.

52 M.L.G. Ana M. Bianco FCEyN Enesteesquemacadafiladetabla(n i1,n i1,...,n ij ) esmultinomialconprobabilidades y las filas son independientes. π j i = π ij π i+ Estetipodemuestreoesrazonabledeaplicarcuandolosdatosprovienendeun muestreo aleatorio estratificado(estratos definidos por X) o en un experimento enelx=grupodetratamiento. También es adecuado cuando no tenemos totales por filas fijos, pero estamos interesadosenp(y X)ynoenP(X),loquecorrespondeaqueY esel resultadodeinterésynodeseamosmodelarax. Porloquevimos,enestostrestiposdemuestreoelnúcleodelaverosimilitud eselmismo. La importancia de estos resultados es que el análisis que hagamos es independiente del esquema de muestreo y depende de los parámetros de interés.

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

M.C. Robert Jeffrey Flowers Jarvis Fecha de elaboración: Agosto de 2004 Fecha de última actualización: Julio de 2010

M.C. Robert Jeffrey Flowers Jarvis Fecha de elaboración: Agosto de 2004 Fecha de última actualización: Julio de 2010 PROGRAMA DE ESTUDIO Análisis de Datos Categóricos Programa Educativo: Área de Formación : Transversal Horas teóricas: 3 Horas prácticas: 2 Total de Horas: 5 Total de créditos: 8 Clave: F1145 Tipo : Asignatura

Más detalles

Introducción a la regresión ordinal

Introducción a la regresión ordinal Introducción a la regresión ordinal Jose Barrera jbarrera@mat.uab.cat 20 de mayo 2009 Jose Barrera (UAB) Introducción a la regresión ordinal 20 de mayo 2009 1 / 11 Introducción a la regresión ordinal 1

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos

Más detalles

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith) INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más

Más detalles

Unidad IV: Distribuciones muestrales

Unidad IV: Distribuciones muestrales Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia

Más detalles

1.2.2. Técnicas estadísticas más utilizadas en la investigación

1.2.2. Técnicas estadísticas más utilizadas en la investigación Contenido PRÓLOGO... 1. LA ESTADÍSTICA COMO HERRAMIENTA EN LA INVESTIGACIÓN TURÍSTICA 1.1. EL TURISMO Y LA ESTADÍSTICA... 2 1.1.1. El turismo... 2 1.1.2. La estadística... 4 1.2. LA ESTADÍSTICA Y LA INVESTIGACIÓN

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

Distribuciones de probabilidad

Distribuciones de probabilidad Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir

Más detalles

Distribuciones de probabilidad bidimensionales o conjuntas

Distribuciones de probabilidad bidimensionales o conjuntas Distribuciones de probabilidad bidimensionales o conjuntas Si disponemos de dos variables aleatorias podemos definir distribuciones bidimensionales de forma semejante al caso unidimensional. Para el caso

Más detalles

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Facultad de Ciencias Sociales - Universidad de la República

Facultad de Ciencias Sociales - Universidad de la República Facultad de Ciencias Sociales - Universidad de la República Estadística y sus aplicaciones en Ciencias Sociales Edición 2016 Ciclo Avanzado 3er. Semestre (Licenciatura en Ciencia Política/ Licenciatura

Más detalles

ESTADISTICA APLICADA: PROGRAMA

ESTADISTICA APLICADA: PROGRAMA Pág. 1 de 5 ESTADISTICA APLICADA: PROGRAMA a) OBJETIVOS Y BLOQUE 1: Teoría de Probabilidades 1.1 Comprender la naturaleza de los experimentos aleatorios y la estructura de los espacios de probabilidades,

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Tema 4: Probabilidad y Teoría de Muestras

Tema 4: Probabilidad y Teoría de Muestras Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009

Más detalles

Tema 4: Variables aleatorias multidimensionales

Tema 4: Variables aleatorias multidimensionales Tema 4: Variables aleatorias multidimensionales Los contenidos a desarrollar en este tema son los siguientes: Distribución conjunta de probabilidad Probabilidad/densidad marginales y condicionadas Independencia

Más detalles

Contrastes de Hipótesis paramétricos y no-paramétricos.

Contrastes de Hipótesis paramétricos y no-paramétricos. Capítulo 1 Contrastes de Hiptesis paramétricos y no-paramétricos. Estadística Inductiva o Inferencia Estadística: Conjunto de métodos que se fundamentan en la Teoría de la Probabilidad y que tienen por

Más detalles

Prof. Eliana Guzmán U. Semestre A-2015

Prof. Eliana Guzmán U. Semestre A-2015 Unidad III. Variables aleatorias Prof. Eliana Guzmán U. Semestre A-2015 Variable Aleatoria Concepto: es una función que asigna un número real, a cada elemento del espacio muestral. Solo los experimentos

Más detalles

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento

Más detalles

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema: Modelos de probabilidad Modelos de probabilidad Distribución de Bernoulli Distribución Binomial Distribución de Poisson Distribución Exponencial Objetivos del tema: Al final del tema el alumno será capaz

Más detalles

Tema 9: Contraste de hipótesis.

Tema 9: Contraste de hipótesis. Estadística 84 Tema 9: Contraste de hipótesis. 9.1 Introducción. El objetivo de este tema es proporcionar métodos que permiten decidir si una hipótesis estadística debe o no ser rechazada, en base a los

Más detalles

Asignaturas antecedentes y subsecuentes

Asignaturas antecedentes y subsecuentes PROGRAMA DE ESTUDIOS PROBABILIDAD Área a la que pertenece: Área Sustantiva Profesional Horas teóricas: 3 Horas prácticas: 2 Créditos: 8 Clave: F0056 Asignaturas antecedentes y subsecuentes PRESENTACIÓN

Más detalles

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords A. PRUEBAS DE BONDAD DE AJUSTE: Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords B.TABLAS DE CONTINGENCIA Marta Alperin Prosora Adjunta de Estadística alperin@fcnym.unlp.edu.ar http://www.fcnym.unlp.edu.ar/catedras/estadistica

Más detalles

Cálculo de Probabilidades II Preguntas Tema 1

Cálculo de Probabilidades II Preguntas Tema 1 Cálculo de Probabilidades II Preguntas Tema 1 1. Suponga que un experimento consiste en lanzar un par de dados, Sea X El número máximo de los puntos obtenidos y Y Suma de los puntos obtenidos. Obtenga

Más detalles

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que

Más detalles

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas JUEGO DE BASKETBALL Repaso de Distribuciones de Probabilidad Discretas y Continuas PREGUNTA #1 Qué es una variable aleatoria uniforme discreta? Cómo es su distribución? Qué es una variable aleatoria uniforme

Más detalles

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.

Más detalles

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste 1 Contraste de hipótesis Tema 3 1. Pasos del contraste de hipótesis 1.1 Hipótesis estadísticas: nula y alternativa 1.2 Supuestos 1.3 Estadístico de contraste 1.4 Regla de decisión: zona de aceptación y

Más detalles

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos Contenido Prefacio ix 1 Introducci6n a la estadfstica y al an;!llisis de datos 1 1.1 1.2 1.3 1.4 1.5 1.6 Repaso 1 EI papel de la probabilidad 2 Medidas de posici6n: media de una muestra 4 Medidas de variabilidad

Más detalles

El Algoritmo E-M. José Antonio Camarena Ibarrola

El Algoritmo E-M. José Antonio Camarena Ibarrola El Algoritmo E-M José Antonio Camarena Ibarrola Introducción Método para encontrar una estimación de máima verosimilitud para un parámetro ѳ de una distribución Ejemplo simple 24 Si tiene las temperaturas

Más detalles

Probabilidad II Algunas distribuciones notables. Antonio Cuevas Departamento de Matemáticas Universidad Autónoma de Madrid

Probabilidad II Algunas distribuciones notables. Antonio Cuevas Departamento de Matemáticas Universidad Autónoma de Madrid Probabilidad II Algunas distribuciones notables Antonio Cuevas Departamento de Matemáticas Universidad Autónoma de Madrid La distribución normal f (x; µ, σ) = 1 σ 2π e 1 2( x µ σ ) 2, x R, µ R, σ > 0 E(X

Más detalles

Tema 4: Variables aleatorias multidimensionales

Tema 4: Variables aleatorias multidimensionales 1 Tema 4: Variables aleatorias multidimensionales En este tema: Distribución conjunta de probabilidad Probabilidad/densidad marginal Probabilidad/densidad condicionada Esperanza, varianza, desviación típica

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL PROGRAMA DE LA ASIGNATURA DE: IDENTIFICACIÓN DE LA ASIGNATURA

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

Modelos Estocásticos I Tercer Examen Parcial Respuestas

Modelos Estocásticos I Tercer Examen Parcial Respuestas Modelos Estocásticos I Tercer Examen Parcial Respuestas. a Cuál es la diferencia entre un estado recurrente positivo y uno recurrente nulo? Cómo se define el período de un estado? Demuestre que si el estado

Más detalles

Tema 8: Contraste de hipótesis

Tema 8: Contraste de hipótesis Tema 8: Contraste de hipótesis 1 En este tema: Conceptos fundamentales: hipótesis nula y alternativa, nivel de significación, error de tipo I y tipo II, p-valor. Contraste de hipótesis e IC. Contraste

Más detalles

Análisis de la varianza ANOVA

Análisis de la varianza ANOVA Estadística Básica. Mayo 2004 1 Análisis de la varianza ANOVA Francisco Montes Departament d Estadística i I. O. Universitat de València http://www.uv.es/~montes Estadística Básica. Mayo 2004 2 Comparación

Más detalles

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

Resumen teórico de los principales conceptos estadísticos

Resumen teórico de los principales conceptos estadísticos Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Muestreo aleatorio simple Resumen teórico Resumen teórico de los principales conceptos estadísticos Muestreo aleatorio

Más detalles

Robusticidad de los Diseños D-óptimos a la Elección. de los Valores Locales para el Modelo Logístico

Robusticidad de los Diseños D-óptimos a la Elección. de los Valores Locales para el Modelo Logístico Robusticidad de los Diseños D-óptimos a la Elección de los Valores Locales para el Modelo Logístico David Felipe Sosa Palacio 1,a,Víctor Ignacio López Ríos 2,a a. Escuela de Estadística, Facultad de Ciencias,

Más detalles

Estimación del Probit Ordinal y del Logit Multinomial

Estimación del Probit Ordinal y del Logit Multinomial Estimación del Probit Ordinal y del Logit Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid Esquema Introducción 1 Introducción 2 3 Introducción El

Más detalles

Curso de Probabilidad y Estadística

Curso de Probabilidad y Estadística Curso de Probabilidad y Estadística Distribuciones de Probabilidad Dr. José Antonio Camarena Ibarrola camarena@umich.mx Universidad Michoacana de San Nicolás de Hidalgo Facultad de Ingeniería Eléctrica

Más detalles

ACTIVIDAD 2: La distribución Normal

ACTIVIDAD 2: La distribución Normal Actividad 2: La distribución Normal ACTIVIDAD 2: La distribución Normal CASO 2-1: CLASE DE BIOLOGÍA El Dr. Saigí es profesor de Biología en una prestigiosa universidad. Está preparando una clase en la

Más detalles

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso INDICE Capítulo I: Conceptos Básicos 1.- Introducción 3 2.- Definición de calidad 7 3.- Política de calidad 10 4.- Gestión de la calidad 12 5.- Sistema de calidad 12 6.- Calidad total 13 7.- Aseguramiento

Más detalles

T4. Modelos con variables cualitativas

T4. Modelos con variables cualitativas T4. Modelos con variables cualitativas Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Ana J. López y Rigoberto Pérez (Dpto EconomíaT4. Aplicada. Modelos Universidad

Más detalles

Objetivos. 1. Variable Aleatoria y Función de Probabilidad. Tema 4: Variables aleatorias discretas Denición de Variable aleatoria

Objetivos. 1. Variable Aleatoria y Función de Probabilidad. Tema 4: Variables aleatorias discretas Denición de Variable aleatoria Tema 4: Variables aleatorias discretas Objetivos Dominar el uso de las funciones asociadas a una variable aleatoria discreta para calcular probabilidades. Conocer el signicado y saber calcular la esperanza

Más detalles

Distribuciones de probabilidad multivariadas

Distribuciones de probabilidad multivariadas Capítulo 3 Distribuciones de probabilidad multivariadas Sobre un dado espacio muestral podemos definir diferentes variables aleatorias. Por ejemplo, en un experimento binomial, X 1 podría ser la variable

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.

Más detalles

Modelado de la aleatoriedad: Distribuciones

Modelado de la aleatoriedad: Distribuciones Modelado de la aleatoriedad: Distribuciones Begoña Vitoriano Villanueva Bvitoriano@mat.ucm.es Facultad de CC. Matemáticas Universidad Complutense de Madrid I. Distribuciones Discretas Bernoulli (p) Aplicaciones:

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

PROGRAMA ACADEMICO Ingeniería Industrial

PROGRAMA ACADEMICO Ingeniería Industrial 1. IDENTIFICACIÓN DIVISION ACADEMICA Ingenierías DEPARTAMENTO Ingeniería Industrial PROGRAMA ACADEMICO Ingeniería Industrial NOMBRE DEL CURSO Análisis de datos en Ingeniería COMPONENTE CURRICULAR Profesional

Más detalles

Regresión y Correlación

Regresión y Correlación Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios

Más detalles

DISTRIBUCIÓN N BINOMIAL

DISTRIBUCIÓN N BINOMIAL DISTRIBUCIÓN N BINOMIAL COMBINACIONES En muchos problemas de probabilidad es necesario conocer el número de maneras en que r objetos pueden seleccionarse de un conjunto de n objetos. A esto se le denomina

Más detalles

Unidad Temática 3: Probabilidad y Variables Aleatorias

Unidad Temática 3: Probabilidad y Variables Aleatorias Unidad Temática 3: Probabilidad y Variables Aleatorias 1) Qué entiende por probabilidad? Cómo lo relaciona con los Sistemas de Comunicaciones? Probabilidad - Definiciones Experimento aleatorio: Un experimento

Más detalles

Descripción de tablas de contingencia

Descripción de tablas de contingencia GoBack Descripción de Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 40 Un ejemplo Distribución conjunta y tabla de Distribución condicional Independencia y homogeneidad Tablas

Más detalles

CM0244. Suficientable

CM0244. Suficientable IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE

Más detalles

Programa. Asignatura: Estadística Aplicada. año de la Carrera de Contador Público

Programa. Asignatura: Estadística Aplicada. año de la Carrera de Contador Público Sede y localidad Carrera Sede Atlántica, Viedma Contador Publico Programa Asignatura: Estadística Aplicada Año calendario: 2012 Carga horaria semanal: 6 (seis) hs. Cuatrimestre: Primer Cuatrimestre. Segundo

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA PROBABILIDAD Y ESTADÍSTICA 4 horas a la semana 8 créditos Semestre variable según la carrera Objetivo del curso: Analizar y resolver problemas de naturaleza aleatoria en la ingeniería, aplicando conceptos

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento

Más detalles

a. Poisson: los totales marginales y el total muestral varían libremente.

a. Poisson: los totales marginales y el total muestral varían libremente. TEMA 2º: TABLAS DE CONTINGENCIA BIDIMENSIONALES 1º Distribución de frecuencias observadas El único aspecto cuantificable en el análisis cualitativo es el número de individuos que presenta una combinación

Más detalles

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: FORMACIÓN FUNDAMENTAL. Créditos ECTS: 6 Presenciales: 5 No presenciales: 1

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: FORMACIÓN FUNDAMENTAL. Créditos ECTS: 6 Presenciales: 5 No presenciales: 1 MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: AMPLIACIÓN DE ESTADÍSTICA Código:603358 Materia: MATEMÁTICAS Y ESTADÍSTICA Módulo: FORMACIÓN FUNDAMENTAL Carácter: OBLIGATORIA

Más detalles

Tema 2. Descripción Conjunta de Varias Variables

Tema 2. Descripción Conjunta de Varias Variables Tema 2. Descripción Conjunta de Varias Variables Cuestiones de Verdadero/Falso 1. La covarianza mide la relación lineal entre dos variables, pero depende de las unidades de medida utilizadas. 2. El análisis

Más detalles

Maestría en Bioinformática Probabilidad y Estadística: Clase 3

Maestría en Bioinformática Probabilidad y Estadística: Clase 3 Maestría en Bioinformática Probabilidad y Estadística: Clase 3 Gustavo Guerberoff gguerber@fing.edu.uy Facultad de Ingeniería Universidad de la República Abril de 2010 Contenidos 1 Variables aleatorias

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS.

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS. Estadística Tema 4 Curso /7 Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS. Objetivos Conceptos: Conocer los siguientes modelos discretos de probabilidad: uniforme, binomial, geométrico y Poisson. De cada

Más detalles

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo... CONTENIDO Prólogo a la 3. a edición en español ampliada.................................. Prólogo.................................................................. vii xvii 1. Métodos descriptivos................................................

Más detalles

Programa Analítico Plan de estudios Asignatura: Probabilidad y Estadística

Programa Analítico Plan de estudios Asignatura: Probabilidad y Estadística Programa Analítico Plan de estudios 2011 Asignatura: Probabilidad y Estadística CARRERA: LICENCIATURA LIC. CIENCIAS EN DE CIENCIAS LA COMPUTACIÓN-LIC. DE LA COMPUTACIÓN EN SISTEMAS DE INFORMACIÓN AÑO:

Más detalles

Capítulo 6: Variable Aleatoria Bidimensional

Capítulo 6: Variable Aleatoria Bidimensional Capítulo 6: Variable Aleatoria Bidimensional Cuando introducíamos el concepto de variable aleatoria unidimensional, decíamos que se pretendía modelizar los resultados de un experimento aleatorio en el

Más detalles

Prueba Integral Lapso /6

Prueba Integral Lapso /6 Prueba Integral Lapso 2 009-2 76 - /6 Universidad Nacional Abierta Probabilidad y Estadística I (76) Vicerrectorado Académico Cód. Carrera: 06-20 - 508 Fecha: 2-2 - 2 009 MODELO DE RESPUESTAS Objetivos,

Más detalles

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste Técnicas de validación estadística Bondad de ajuste Georgina Flesia FaMAF 28 de mayo, 2013 Pruebas de bondad de ajuste Dado un conjunto de observaciones, de qué distribución provienen o cuál es la distribución

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA FACULTAD DE INGENIERÍA U N A M PROBABILIDAD Y ESTADÍSTICA Irene Patricia Valdez y Alfaro irenev@unam.mx T E M A S DEL CURSO 1. Análisis Estadístico de datos muestrales. 2. Fundamentos de la Teoría de la

Más detalles

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda

Más detalles

Definición de probabilidad

Definición de probabilidad Tema 5: LA DISTRIBUCIÓN NORMAL 1. INTRODUCCIÓN A LA PROBABILIDAD: Definición de probabilidad Repaso de propiedades de conjuntos (Leyes de Morgan) Probabilidad condicionada Teorema de la probabilidad total

Más detalles

ESTADÍSTICA. Se trata de una variable aleatoria binormal con n=5, probabilidad= ¼. B(5, ¼); La probabilidad es P= P(x=3) +P(x=4) + P(x=5):

ESTADÍSTICA. Se trata de una variable aleatoria binormal con n=5, probabilidad= ¼. B(5, ¼); La probabilidad es P= P(x=3) +P(x=4) + P(x=5): ESTADÍSTICA AYUDAS PARA EL TEST (1ºParcial) 1) La suma de probabilidades de todos los casos posibles de un experimento tiene que ser igual a uno. 2) La probabilidad de aprobar este test (5 preguntas, cada

Más detalles

Identificación Paramétrica

Identificación Paramétrica Identificación Paramétrica Métodos para la Obtención de un Modelo Discreto Un modelo, incluyendo el ruido o perturbación, a tiempo discreto puede ser representado por la siguiente i ecuación Donde: ( )

Más detalles

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes

Más detalles

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución

Más detalles

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste Técnicas de validación estadística Bondad de ajuste Georgina Flesia FaMAF 31 de mayo, 2011 Pruebas de bondad de ajuste Dado un conjunto de observaciones, de qué distribución provienen o cuál es la distribución

Más detalles

Indicaciones para el lector... xv Prólogo... xvii

Indicaciones para el lector... xv Prólogo... xvii ÍNDICE Indicaciones para el lector... xv Prólogo... xvii 1. INTRODUCCIÓN Qué es la estadística?... 3 Por qué estudiar estadística?... 5 Empleo de modelos en estadística... 6 Perspectiva hacia el futuro...

Más detalles

OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 4 Optimización no Lineal

OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 4 Optimización no Lineal OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA Tema 4 Optimización no Lineal ORGANIZACIÓN DEL TEMA Sesiones: El caso sin restricciones: formulación, ejemplos Condiciones de optimalidad, métodos Caso con restricciones:

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010)

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010) Nombre y Apellidos:... NIU:... Grupo:... EXAMEN ECONOMETRÍA II (Enero 2010) Lea cuidadosamente cada pregunta. Marque muy claramente la respuesta de cada pregunta en la hoja de respuestas. Observe que los

Más detalles

Estimación por intervalo del parámetro de la distribución de Poisson con una sola observación

Estimación por intervalo del parámetro de la distribución de Poisson con una sola observación Revista Colombiana de Estadística Volumen 30 No. 1. pp. 69 a 75. Junio 2007 Estimación por intervalo del parámetro de la distribución de Poisson con una sola observación Interval Estimation for the Poisson

Más detalles

Variables aleatorias múltiples

Variables aleatorias múltiples Chapter 4 Variables aleatorias múltiples 4.. Distribución conjunta y marginal Definición 4.. Un vector aleatorio n-dimensional es una función que va de un espacio muestral S a un espacio euclediano n-dimensional

Más detalles

TEMA 3. Algunos modelos de probabilidad de tipo discreto. 3.1 Al finalizar el tema el alumno debe conocer...

TEMA 3. Algunos modelos de probabilidad de tipo discreto. 3.1 Al finalizar el tema el alumno debe conocer... TEMA 3. Algunos modelos de probabilidad de tipo discreto En este capítulo se abordan «familias» muy específicas de probabilidad, que con cierta frecuencia se nos presentan en el mundo real. Van a ser distribuciones

Más detalles

Estadística Aplicada

Estadística Aplicada Estadística Aplicada Distribuciones de Probabilidad Variables aleatorias Toman un valor numérico para cada resultado de un espacio muestral Discretas. Sus valores posibles constituyen un conjunto discreto.

Más detalles

Probabilidad y Estadística

Probabilidad y Estadística Programa de la Asignatura: Código: 23 Probabilidad y Estadística Carrera: Ingeniería en Computación Plan: 2013 Carácter: Obligatoria Unidad Académica: Secretaría Académica Curso: Tercer año Primer cuatrimestre

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07 PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07 TEMAS A ESTUDIAR En esta guía nos dedicaremos a estudiar el tema de Estimación por intervalo y comenzaremos a estudiar las pruebas de hipótesis paramétricas.

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Espacios Vectoriales

Espacios Vectoriales Leandro Marín Octubre 2010 Índice Definición y Ejemplos Paramétricas vs. Impĺıcitas Bases y Coordenadas Para definir un espacio vectorial tenemos que empezar determinando un cuerpo sobre el que esté definido

Más detalles