n t T é c n i c Curso de Estadística con R Autor: Francisco Parra Rodríguez Jefe de Servicio de Estadísticas Económicas y Sociodemográficas ICANE

Tamaño: px
Comenzar la demostración a partir de la página:

Download "n t T é c n i c Curso de Estadística con R Autor: Francisco Parra Rodríguez Jefe de Servicio de Estadísticas Económicas y Sociodemográficas ICANE"

Transcripción

1 D o c u m e Curso de Esadísca co R o s Auor: Fracsco Parra Rodríguez Jefe de Servco de Esadíscas Ecoómcas y Socodemográfcas ICANE DOC. Nº /6 ISSN Saader, Caabra T é c c o s

2 . EL MODELO LINEAL GENERAL INTRODUCCIÓN REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS MÍNIMOS CUADRADOS ORDINARIOS REGRESIÓN LINEAL MÚLTIPLE PROPIEDADES ESTADISTICAS DEL ESTIMADOR MÍNIMO CUADRADO: TEOREMA DE GAUSS-MARKOV COEFICIENTES DE DETERMINACIÓN TABLA DE ANALIS DE LA VARIANZA (ANOVA) INFERENCIA ACERCA DE LOS ESTIMADORES Iervalos De Cofaza Corases de Hpóess PREDICCIÓN EN EL MODELO DE REGRESIÓN ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON R LA CONSOLA R STUDIO..... ETENSIONES AL MODELO DE REGRESIÓN LINEAL INTRODUCCIÓN HETEROSCEDASTICIDAD Tes de Barle Corase de Goldfeld-Qua Corase de Whe AUTOCORRELACIÓN Corase de Durb-Waso Corase de Breush-Godfrey DEFICIENCIAS MUESTRALES: MULTICOLINEALIDAD ERRORES DE ESPECIFICACIÓN Omsó de ua varable relevae Iclusó de ua varable ecesara Especfcacó fucoal correca Corase de errores de especfcacó METODOS DE SELECCIÓN DE VARIABLES EN EL MODELO DE REGRESIÓN LINEAL MODELOS CON VARIABLES CUALITATIVAS MODELOS CON VARIABLES CUANTITATIVAS CUALITATIVAS COMO REGRESORES MODELOS ANOVA MODELOS ANCOVA MODELO LINEAL GENERALIZADO EL MODELO PROBABILÍSTICO LINEAL EL MODELO LOGIT MODELO PROBIT MODELOS CON DATOS DE PANEL INTRODUCCIÓN ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS DE PANEL VENTAJAS DESVENTAJAS DE LOS MODELOS DE DATOS DE PANEL MODELO DE EFECTOS FIJOS MODELO DE EFECTOS ALEATORIOS ELECCIÓN DE MODELO DE EFECTOS O EFECTOS ALEATORIOS...7

3 6. MÉTODOS DE ESTIMACIÓN NO PARAMÉTRICOS INTRODUCCIÓN FUNCIÓN NUCLEO ESTIMADORES DE FUNCIÓN NUCLEO POLINOMIOS LOCALES REGRESIÓN POR SPLINES APROIMACIÓN POR SERIES DE FOURIER REGRESIÓN EN EL DOMINIO DE LA FRECUENCIA INTRODUCCIÓN REGRESIÓN BAND SPECTRUM REGRESIÓN EN EL DOMINIO DE LA FRECUENCIA CON PARAMETROS DEPENDIENTES DEL TIEMPO DESESTACIONALIZACIÓN A TRAVÉS DE LA REGRESIÓN DEPENDIENTE DE LA FRECUENCIA MÉTODOS DE CLASIFICACION INTRODUCCION ANALISIS DISCRIMINANTE REGRESION LOGÍSTICA ALGORITMO K-VECINOS MAS CERCANOS ÁRBOLES DE CLASIFICACIÓN MÁQUINAS DE SOPORTE VECTOR METODOLOGÍAS COMBINANDO CLASIFICADORES BIBLIOGRAFÍA...3. ANEO I...37

4 . EL MODELO LINEAL GENERAL.. INTRODUCCIÓN La regresó leal es la écca básca del aálss ecoomérco. Medae dcha écca raamos de deermar relacoes de depedeca de po leal ere ua varable depedee o edógea, respeco de ua o varas varables explcavas o exógeas. Guara (975), defe el aálss de regresó como el esudo de la depedeca de la varable depedee, sobre ua o más varables explcavas, co el obeo de esmar o predecr el valor promedo poblacoal de la prmera e érmos de los valores coocdos o fos (e medas muesrales repedas) de las úlmas. E ese capulo abordaremos el esudo del caso de ua úca ecuacó de po leal co ua varable depedee y ua depedee, y la geeralzacó del modelo al caso de múlples varables exógeas. Las exesoes del modelo leal geeral se aalzará e capíulos sguees... REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS MÍNIMOS CUADRADOS ORDINARIOS. Parmos de la exseca de ua relacó leal ere ua varable edógea () y k varables exógeas ( ):... k k e Nuesro obevo cosse e esmar los parámeros de la ecuacó aeror a parr de los daos muesrales de los que dspoemos. Para ello ulzaremos el méodo de los Mímos Cuadrados Ordaros (MCO), pero aes de ver e que cosse ese méodo debemos plaear ceras hpóess sobre el comporameo de las varables que egra el modelo. La varable e la deomamos érmo de perurbacó o error, y e ella recogemos odos aquellos facores que puede flur a la hora de explcar el comporameo de la varable y que, s embargo, o esá refleados e las varables explcavas,. Esos facores debería ser poco mporaes, ya que o debería exsr gua varable explcava relevae omda e el modelo de regresó. E caso coraro esaríamos curredo e lo que se cooce como u error de especfcacó del modelo. El érmo de perurbacó ambé recogería los posbles errores de medda de la varable depedee,. De lo aeror se desprede que, a la hora de esmar los parámeros del modelo, resulará de val mporaca que dcho érmo de error o eerza gua flueca deermae e la explcacó del comporameo de la varable depedee. Por ello, s el modelo esá be especfcado, cuado se aplca el méodo de Mímos Cuadrados Ordaros, cabe realzar las sguees hpóess de comporameo sobre el érmo de error:. La esperaza maemáca de e es cero, al que E (e ) =. Es decr, el comporameo del érmo de error o presea u sesgo ssemáco e gua dreccó deermada. Por eemplo, s esamos realzado u expermeo e el cual eemos que medr la 3

5 logud de u deermado obeo, a veces al medr dcha logud comeeremos u error de medda por exceso y oras por defeco, pero e meda los errores esará compesados.. La covaraza ere e y e es ula para al que E (e e ) =. Ello quere decr que el error comedo e u momeo deermado,, o debe esar correlacoado co el error comedo e oro momeo del empo,, o dcho de oro modo, los errores o eerce flueca uos sobre oros. E caso de exsr ese po de flueca o correlacó, os ecoraríamos ae el problema de la auocorrelacó e los resduos, el cual mpde realzar ua esmacó por Mímos Cuadrados válda. 3. La marz de varazas y covarazas del érmo de error debe ser escalar al que Var(e ) = I, =,,, dode I es la marz udad. Dado que sempre que medmos ua varable, se produce u cero error, resula deseable que los errores que comeamos e momeos dferees del empo sea smlares e cuaía. Esa codcó es lo que se cooce como supueso de homocedascdad que, e caso de o verfcarse, mpedría u uso correco de la esmacó leal por Mímos Cuadrados. Esas hpóess mplca que los errores sgue ua dsrbucó Normal de meda cero y varaza cosae por lo que, dado su carácer aleaoro, hace que los errores sea por auraleza mpredecbles. Asmsmo, las varables cludas e el modelo debe verfcar que:. El comporameo de la varable depedee se ausa al modelo leal durae odo el perodo muesral, es decr, o se produce u cambo mporae e la esrucura de comporameo de a lo largo de la muesra cosderada.. Las varables explcavas,, so o esocáscas, es decr, so cosderadas fas e muesreos repedos. 3. El úmero de varables explcavas, k, sempre debe ser meor que el amaño muesral,. Es decr, sempre debemos dspoer de más observacoes que parámeros haya e el modelo (coefcees ). Paredo de la relacó leal más seclla: e S supoemos que se verfca los supuesos aerores, la esmacó mímo cuadráca de los parámeros y, dará como resulado gráfco ua reca que se ause lo máxmo posble a la ube de puos defda por odos los pares de valores muesrales (, ), al y como se puede aprecar e el Fgura.. 4

6 5 Fg... Nube de puos o gráfco de dspersó co varables relacoadas lealmee El érmo de error, e, puede ser eeddo, a la vsa del gráfco aeror, como la dsaca que exse ere el valor observado,, y el correspodee valor esmado, que sería la mage de e el ee de ordeadas. El obevo de la esmacó por Mímos Cuadrados Ordaros es, precsamee, mmzar el sumaoro de odas esas dsacas al cuadrado; es decr : e M ) ˆ ˆ ( ) ˆ ( Dervado esa expresó respeco a los coefcees ˆ y ˆ e gualado a cero obeemos el ssema de ecuacoes ormales: o ˆ ˆ ˆ ˆ ˆ ˆ dode represea el amaño muesral y e represea las medas de dchas varables. Resolvedo dcho ssema de ecuacoes obeemos la solucó para los parámeros a y b: o ˆ ˆ ˆ Los parámeros y varables que lleva ecma u símbolo de aceo crcufleo (^) dca que so esmadas por lo que o se correspode co el valor real del parámero so co el calculado por osoros.

7 .3. REGRESIÓN LINEAL MÚLTIPLE Pasamos a couacó a geeralzar el modelo aeror al caso de u modelo co varas varables exógeas, de al forma que se raa de deermar la relacó que exse ere la varable edógea y varables exógeas:,., k. Dcho modelo se puede formular marcalmee de la sguee maera: e... k k e, =,,, dode: es el vecor de observacoes de la varable edógea k... k k... k es la marz de observacoes de las varables exógeas es el vecor de coefcees que preedemos esmar... K e e e es el vecor de érmos de error... e S e la expresó aeror se cosderara que exse érmo depedee,, la marz quedaría como:... k... k 3... k k el modelo quedaría así:... o e k k, =,,, Supoedo que se verfca las hpóess que veíamos aes, el problema a resolver uevamee es la mmzacó de la suma de los cuadrados de los érmos de error al que: 6

8 7 e M ˆ ˆ Desarrollado dcho cuadrado y dervado respeco a cada β obeemos el sguee ssema de ecuacoes ormales expresado e oacó marcal: ˆ ' ' e dode basa co despear β premulplcado ambos membros por la versa de la marz ) ' ( para obeer la esmacó de los parámeros del modelo al que: ' ) ' ( ˆ dode: k k k k k ' k... ` S e el modelo exsera érmo depedee,, las marces aerores sería: k k k k k ' k... ` El resulado de mulplcar dchas marces coduce a la obecó de la esmacó de los parámeros β del modelo: k o k k k k k ˆ... ˆ ˆ ' ' ˆ k Cada uo de los coefcees esmados, ˆ, so ua esmacó sesgada del verdadero parámero del modelo y represea la varacó que expermea la varable depedee cuado ua varable depedee varía e ua udad y odas las demás permaece

9 cosaes (supueso ceers parbus). Dchos coefcees posee propedades esadíscas muy eresaes ya que, s se verfca los supuesos aes comeados, so sesgados, efcees y ópmos..4. PROPIEDADES ESTADÍSTICAS DEL ESTIMADOR MÍNIMO CUADRADO: TEOREMA DE GAUSS-MARKOV ˆ El esmador ( ' ) ( ' ) ' puede escrbrse como: ˆ '( e) ( ' ) ' e S se cumple las hpóess de comporameo sobre el érmo error, la dsrbucó de probabldad del esmador MCO ˆ será uo dsrbucó Normal mulvarae co vecor de medas y marz de varazas y covarazas ( ' ). La esperaza maemáca del esmador MCO se demuesra a parr de: ( ' ) ' e ( ' ) ' E( e) E ( ˆ) E. De la defcó de marz de varazas y covarazas, se ee que: var( ˆ) E Teedo presee que ' ˆ E( ˆ) ˆ E( ˆ) ˆ E ( ˆ) ( ' ) ' e ( ' ) ' e Eoces var( ˆ) E El esmador ( ' ) ' ee' ( ' ) ( ' ) ' Eee' ( ' ) ( ' ) ˆ del parámero verdadero valor del parámero Se dce que u esmador sesgado es sesgado porque su esperaza maemáca cocde co el E( ˆ ). ˆ es mas efcee que oro esmador sesgado ~, s la varaza muesral de ˆ es meor que la varaza muesral de ~. El eorema de Gauss- Markov demuesra que el esmador MCO ˆ es el más efcee de la clase de esmadores leales e sesgados de. Segú el Teorema de Gauss-Markov, cualquer esmador leal de puede expresarse como: ( ' ) ' D ( ' ) ' D e D ( ' ) ' e De dode D es ua marz (k ) arbrara, que esablece la dfereca ere el esmador MCO y el esmador aleravo. 8

10 La esperaza de dcho esmador es: E ~ D S ~ es sesgado, eoces D. E oras palabras el esmador aleravo sólo será sesgado s la marz de dsaca es orogoal a las varables explcavas. A couacó obeemos la marz de covarazas de ese esmador ~ var( ) E Teedo presee que: ~ ~ E( ~ ) E( ~ ) ' ~ E ~ ( ) D ( ' ) ' e De ( ' ) ' De eoces, ~ var( ) ( ' ) ' DEee' D' ( ' ) ( ' ) D' D ~ y como D' D es ua marz semdefda posva, se demuesra que la var( ) var( ˆ ) co depedeca de la ormaldad o o de las dsrbucó ~..5. COEFICIENTES DE DETERMINACIÓN Ua vez esmada la ecuacó de regresó leal ee erés deermar la exacud del ause realzado. Para ello hay que aalzar la varacó que expermea esa varable depedee y, dero de esa varacó, se esuda qué pare esá sedo explcada por el modelo de regresó y qué pare es debda a los errores o resduos. La forma de realzar dcho aálss es a parr de la sguee expresó: SCT SCE SCR dode: SCT: es la Suma de Cuadrados Toales y represea ua medda de la varacó de la varable depedee. SCE es la Suma de Cuadrados Explcados por el modelo de regresó. SCR es la Suma de Cuadrados de los Errores Cuado el modelo ee érmo depedee, cada ua de esas sumas vee dada por: SCT ' SCE ˆ ' ' ˆ ˆ 9

11 ˆ ˆ ' ' ' SCR e SCT SCE A parr de las expresoes aerores es posble obeer ua medda esadísca acerca de la bodad de ause del modelo medae lo que se cooce como coefcee de deermacó (R ), que se defe como: R SCR SCT, R y e el caso parcular de modelo co érmo depedee como: SCE R SCT, R Medae ese coefcee es posble seleccoar el meor modelo de ere varos que ega el msmo úmero de varables exógeas, ya que la capacdad explcava de u modelo es mayor cuao más elevado sea el valor que ome ese coefcee. S embargo, hay que eer cero cudado a la hora de rabaar co modelos que presee u R muy cercao a pues, auque podría parecer que esamos ae el modelo perfeco, e realdad podría ecubrr ceros problemas de ídole esadísca como la mulcolealdad que veremos e el capíulo 3. Por ora pare, el valor del coefcee de deermacó aumea co el úmero de varables exógeas del modelo por lo que, s los modelos que se compara ee dso úmero de varables exógeas, o puede esablecerse comparacó ere sus R. E ese caso debe emplearse el coefcee de deermacó corregdo R, el cual depura el cremeo que expermea el coefcee de deermacó cuado el úmero de varables exógeas es mayor. La expresó aalíca de la versó corregda es: R SCR k SCT k R cuyo valor ambé oscla ere y.6. TABLA DE ANALIS DE LA VARIANZA (ANOVA) La hpóess de o sgfcacó global H :... k se rechaza al vel de sgfcacó α cosruyedo el esadísco expermeal: SCE F k exp SCR k y la regla de decsó que rechaza la hpóess H ocurre cuado Fexp F( k, k. ). El corase e la prácca se realza elaborado ua abla ANOVA, que requere:. esmar el modelo de regresó co odas las varables de erés

12 o... k k e, =,,, que os proporcoa la suma de cuadrados de los resduos eˆ ' eˆ SCR ;. esmar el modelo de regresó bao H... : k u o r, =,...,, que os proporcoa la suma de cuadrados de los resduos, uˆ r ' uˆ r ( ) SCT ; El corase de sgfcacó global se resume e el cuadro sguee, e dode la varacó oal de la varable depedee (SCT) se descompoe e la explcada por la regresó (SCE) y e la o explcada (SCR). Los grados de lberad de esas res sumas de cuadrados so, k y k, respecvamee. A parr de esa formacó muesral, podemos calcular el umerador y deomador del esadísco F. Fuee de varacó Regresó Resdual Toal Suma de cuadrados SCE= SCR= SCT= ( ˆ ( ) ˆ ) ( ) k- -k - Grados de lberad Cuadrado medo SCE k SCR k Esadísco F SCE k SCR k.7. INFERENCIA ACERCA DE LOS ESTIMADORES Hasa el momeo hemos vso como la esmacó por MCO perme obeer esmacoes puuales de los parámeros del modelo. La fereca acerca de los msmos perme complear dcha esmacó puual, medae la esmacó por ervalos y los corases de hpóess. Los prmeros posbla la obecó de u ervalo dero del cual, co u deermado vel de cofaza, osclará el verdadero valor de u parámero, meras que los segudos os permrá exraer cosecuecas del modelo, averguado s exse o o, evdeca acerca de ua sere de coeuras que puede plaearse sobre sus parámeros. La fereca esadísca cosse e la esmacó de los parámeros poblacoales a parr de la formacó exraída de ua muesra de dcha poblacó. El úmero de esmacoes que podemos realzar de ua poblacó, a ravés de la exraccó de dferees muesras de u msmo amaño, es geeralmee muy grade porque cada ua de las muesras posbles que se puede sacar de la poblacó arroaría ua esmacó. Por esa razó, a la esmacó que obeemos e ua vesgacó por muesreo la acompañamos co u ervalo de valores posbles. La amplud de dcho ervalo depederá del grado de cofaza que esablezcamos. El grado o vel de cofaza os expresa el úmero de veces que la meda verdadera de la poblacó esá cluda e ce ervalos de ce muesras exraídas de ua poblacó dada. El

13 vel de cofaza más ulzado es el 95%, lo que quere decr que 95 de cada ervalos cosrudos coedrá el verdadero valor de la meda. El ervalo de cofaza para la meda de ua poblacó ormalmee dsrbuda se cosruye e base a la probabldad de que dcha meda esé compredda ere dos valores a y b equdsaes a ella: P [ ] a b sedo - el vel o grado de cofaza asocado a dcho ervalo. E érmos geerales, los ervalos de cofaza para los esadíscos muesrales se expresa como: Esmador ± (Facor de Fabldad)*(Error Típco del Esmador).7.. Iervalos de Cofaza Preseamos a couacó cómo se cosruye los ervalos de cofaza para los dsos érmos que hayamos esmado e el modelo: a) Iervalo de cofaza para el parámero Para cosrur los ervalos de cofaza de las esmacoes, se pare de que la esmacó MCO proporcoa el valor medo de los posbles valores que pudera eer dcho parámero, y que la dsrbucó de dchos valores sgue ua dsrbucó dervada de la Normal que se cooce como de Sude. Dcha dsrbucó es smérca preseado mayor dspersó que la curva Normal esádar para u amaño muesral pequeño. A medda que aumea ( > ) es práccamee gual que la dsrbucó Normal. El cálculo del ervalo de cofaza para se realza medae la sguee expresó: IC :( S ) ˆ k dode S ˆ es la desvacó ípca esmada para el coefcee ˆ, que se obee de la marz de varazas y covarazas de los esmadores expresada como: K K ˆˆ K K K cuyos esmadores será: S ˆ S ˆ ˆ... S ˆ ˆ S ˆ... S ˆ ˆ S ˆ ˆ S ˆ ˆ... K K S S ˆ ˆ K ˆ ˆ S... ˆ K K

14 obedos a parr de la expresó del érmo de error. S ˆ ˆ S e ', dode S e es la esmacó de la varaza b) Iervalo de cofaza para la varaza del érmo de error La expresó del ervalo de cofaza para la varaza del érmo de error es: IC e S ( k) S e ( k) SCR SCR ; ; : e dode represea el vel de sgfcacó del corase y geeralmee se ulza u 5% de sgfcacó, que correspode a u ervalo de cofaza del 95 %. E ese caso se asume que la Suma de Cuadrados de los Errores se dsrbuye segú ua dsrbucó ambé dervada de la Normal que se cooce como de Pearso. La dsrbucó de Pearso es asmérca. Su propedad fudameal es que s sumamos dos depedees de grados de lberad y, se obee ua ueva varable co grados de lberad gual a la suma de y. Los grados de lberad que hay que cosderar e el cálculo de los ervalos de cofaza del érmo error so de -k..7.. Corases de Hpóess Ua buea pare de las vesgacoes esadíscas esá oreadas al desarrollo de procesos ecamados a la corasacó de hpóess que prevamee se ha esablecdo. Ua hpóess es ua afrmacó que esá suea a verfcacó o comprobacó. Hay que eer presee que ua hpóess o es u hecho esablecdo o frme, las hpóess esá basadas e la expereca, e la observacó, e la expermeacó o e la ucó del sueo que las formula. Cuado las hpóess se plaea de al modo que se puede comprobar por medo de méodos esadíscos recbe el ombre de hpóess esadíscas. Esas hpóess so afrmacoes que se efecúa sobre uo o más parámeros de ua o más poblacoes. Las hpóess esadíscas so de dos pos: hpóess ula e hpóess alerava. La hpóess ula, o que o se verfque dcha afrmacó, smbolzada por H, es la hpóess que se debe comprobar. Para corasar ua hpóess ula examamos los daos de la muesra omados de la poblacó y deermamos s so o o compables co dcha hpóess. S so compables eoces H se acepa, e caso coraro se rechaza. S se acepa la hpóess ula afrmamos que los daos de esa muesra e cocreo o da sufcee evdeca para que cocluyamos que la hpóess ula sea falsa; s se rechaza decmos que los daos parculares de la muesra poe de mafeso que la hpóess ula es falsa, eoces la hpóess alerava. H, es verdadera. El crero que perme decdr s rechazamos o o la hpóess ula es sempre el msmo. Defmos u esadísco de prueba, y uos límes que dvde el espaco muesral e ua regó e dode se rechaza la hpóess esablecda, y ora regó e la que o se rechaza, llamada regó de acepacó. A la regó dode se rechaza la hpóess ula se le llama regó críca. Esa regó es u subcouo del espaco muesral, y s el valor del esadísco de prueba pereece a él se rechaza la hpóess ula. 3

15 El líme ere la regó críca y la regó de acepacó vee deermado por la formacó preva relava a la dsrbucó del esadísco de prueba. Señalar que u esadísco de prueba es ua fórmula que os dce como cofroar la hpóess ula co la formacó de la muesra y es, por ao, ua varable aleaora cuyo valor camba de muesra a muesra. Ora de las cosderacoes a realzar e el corase de hpóess es far la probabldad del error de rechazar la prueba sedo cera, a ese error se le deoma vel de sgfcacó. Por eemplo, s se ulza u vel de sgfcacó de.5, equvale a decr que s para realzar u corase omáramos fas muesras de la poblacó, rechazaríamos la hpóess ula de forma correca u 5 % de las veces. E la formalzacó del procedmeo de corasacó podemos dsgur see pasos prcpales:.- Plaeameo de las hpóess..- Seleccó del vel de sgfcacó. 3.- Descrpcó de la poblacó y amaño de la muesra. 4.- Seleccó del esadísco de prueba y su dsrbucó. 5.- Especfcacó de las regoes de acepacó y de rechazo. 6.- Recoleccó de daos y cálculo del esadísco. 7.- Decsó esadísca. Los corases de hpóess que ormalmee se realza e la esmacó MCO so los sguees: a) Corase dvdual sobre u parámero Formulacó de la hpóess: H H * : * : ˆ * Esadísco expermeal: exp S ˆ Esadísco eórco: co k ( / ) Regla de decsó: S exp co se rechaza la hpóess H b) Corase de sgfcacó dvdual Formulacó de la hpóess: H : H : ˆ Esadísco expermeal: exp S ˆ Esadísco eórco: ( / ) co k Regla de decsó: S co exp se rechaza la hpóess H 4

16 c) Corase de sgfcacó global Formulacó de la hpóess: H :... k SCE k Esadísco expermeal: Fexp SCR R k Esadísco eórco: F co Fk, k, R k k Regla de decsó: S Fexp Fco se rechaza la hpóess H.8. PREDICCIÓN EN EL MODELO DE REGRESIÓN Ua vez esmado y valdado el modelo, ua de sus aplcacoes más mporaes cosse e poder realzar predccoes acerca del valor que omaría la varable edógea e el fuuro o para ua udad exramuesral. Esa predccó se puede realzar ao para u valor dvdual como para u valor medo, o esperado, de la varable edógea, sedo posble efecuar ua predccó puual o por ervalos. Su cálculo se realza medae las expresoes que fgura a couacó: a) Predccó dvdual: se raa de hallar el valor esmado para la varable u perodo haca delae. E ese caso basa co susur el valor de las varables exógeas e el modelo e el sguee perodo y calcular el uevo valor de. b) Iervalo de predccó. Para hallar u ervalo de predccó debe ulzarse la sguee expresó: IC ˆ ' ' ; Ŷ k Se ' : k Se ' c) Iervalos de predccó para u valor medo o esperado, Ŷ, La expresó a ulzar e ese caso será: ' ' IC : ˆ S ' ;Ŷ S ' E k e k e.9. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON R R es u eoro especalmee dseñado para el raameo de daos, cálculo y desarrollo gráfco. Perme rabaar co facldad co vecores y marces y ofrece dversas herrameas para el aálss de daos. R es ua mplemeacó ope-source del leguae S (Bell Labs -prcpos de los 9), que ambé es la base del ssema S-Plus (eoro comercal). R y S-Plus aú compare ua gra mayoría de códgo e sruccoes, s be R es sofware lbre, grauo e dode los usuaros 5

17 dspoe de lberad para eecuar, copar, dsrbur, esudar, cambar y meorar el sofware. De hecho R dspoe de ua comudad de desarrolladores/usuaros derás que se dedca cosaemee a la meora y a la amplacó de las fucoaldades y capacdades del programa. E la web hp:// se ecuera dspoble oda la formacó acerca de R. La salacó de R se realza a ravés de la CRAN (ComprehesveR Archve Nework): hp://cra.r-proec.org Acualmee R se dsrbuye para los sguees Ssemas Operavos: Wdows: eoro gráfco. Lux (Deba/Madrake/SuSe/RedHa/VeLux) MacOS Códgo fuee: amplacó a ssemas Ux Las fucoes de R se agrupa e paquees (packages, lbrares), los que coee las fucoes más habuales se cluye por defeco e la dsrbucó de R, y el reso se ecuera dspobles e la Comprehesve R Archve Nework (CRAN). Las edades que R crea y mapula se llama obeos. Dchos obeos puede ser: Escalares: úmeros, caraceres, lógcos (booleaos), facores Vecores/marces/lsas de escalares Fucoes Obeos ad-hoc Dchos obeos se guarda e u workspace. Durae ua sesó de R odos los obeos esará e memora, y se puede guardar e dsco para próxmas sesoes. 6

18 R rabaa sobre esrucuras de daos. La esrucura más smple es u vecor umérco, que cosse e u couo ordeado de úmeros. U vecor de reales se crea medae la fucó c y se guarda co el ombre Cadad. > Cadad <- c(.456,.35,.5,.,.,.8,.45,.4) Se crea ahora el vecor de ombre Preco. > Preco <- c(8,9,94,99,6,8,,5) Para obeer los esadíscos báscos del vecor (Cadad): meda, desvacó esadar, varaza y medaa, se ulza las sguees fucoes R: > mea(cadad) > sd(cadad) > var(cadad) > meda(cadad) S se quere eer u resume sumaro de esadísco de ua varable: > summary(cadad) E R los valores "descoocdos" o "o dspobles" (mssgs) se smbolza co el valor especal NA (NoAvalable). Cualquer operacó que cluya u NA e geeral devolverá NA como resulado.la fucó s.a os perme saber s u elemeo es mssgo o. Oros pos de obecose R. Arrays y marces (marx): geeracó muldmesoal de los vecores. Todos los elemeos de la marz ha de ser del msmo po. 7

19 Facores (facor): úles para el uso de daos caegórcos. Lsas (ls): geeralzacó de los vecores dode los elemeos puede ser de dferees pos (cluso vecores o uevas lsas). Daa frames: marces dode las dferees columas puede eer valores de dferees pos. Fucoes (fuco): couo de códgo de R eecuable y paramerzable. Ua abla debe esar e u obeco po marz. Eemplo: Tabla<-marx(c(65,537,598,4,36,46,38,,8,37,6,67),row=3,byrow=T) La fucó read.able perme leer daos desde fcheros e formao ASCII. Devuelve como resulado u daa.frame, por ao, se supoe que cada líea coee los daos para u dvduo. El fchero ECEL persoas.xls ee el sguee aspeco: Guardamos el fchero ECEL como u fchero ASCII delmado por abulacoes > mazaas <- read.able(fle="mazaas.x",header=t) Tecleamos > mazaas 8

20 La fucó de R que os perme esmar u modelo de regresó leal es la fucó lm. La forma de vocar a la fucó para esmar u modelo de regresó leal smple es lm(y~x). Se puede cosular la ayuda de la fucó para ver odas las posbldades que ofrece. E uesro eemplo, obeemos: > lm(cadad~preco) Call: lm(formula = Cadad ~ Preco) Coeffces: (Iercep) Preco E lugar de vocar smplemee la fucó podemos guardar su resulado e ua varable y veremos así que obeemos más formacó. > reg = lm(cadad~preco) S queremos obeer el vecor de resduos basará solcar: > reg$resduals Para realzar el aálss del modelo esmado ulzaremos la fucó summary. Así: > summary(reg) 9

21 .. LA CONSOLA R STUDIO RSudo es ua erfaz que perme acceder de maera seclla a oda la poeca de R. Para ulzar RSudo se requere haber salado R prevamee. Al gual que R-proec, RSudo es sofware lbre. El obevo de los creadores de RSudo es desarrollar ua herramea poee que sopore los procedmeos y las éccas requerdas para realzar aálss de caldad y dgos de cofaza. Al msmo empo, preede que RSudo sea a secllo e uvo como sea posble para proporcoar u eoro amgable, ao para los ya expermeados como para los uevos usuaros La salacó de RSudo se puede realzar desde la pága ofcal del programa hp://

22 Para famlarzaros co la cosola R-Sudo, vamos a cargar los daos de la ecuesa de presupuesos famlares de España que se dsrbuye a ravés de la sguee dreccó web: hp:// u=resulados&secc= &dp= , para ello os vamos a auxlar del leguae Markdow. Markdow es u leguae de marcado lgero creado por Joh Gruber que raa de cosegur la máxma legbldad y facldad de publcacó ao e su forma de erada como de salda, sprádose e muchas covecoes exsees para marcar mesaes de correo elecróco usado exo plao. E Aexo I aparece las sruccoes báscas de Markdow.

23 E el meú fle seleccoamos R Markdow, y creamos u documeo al que llamamos Curso de esadísca e R. Isalamos la lbrería o Package-R: McroDaosEs que cluye las fucoes para leer el fchero de mcrodaos de la Ecuesa de Presupuesos Famlares. Base 6 (EPF), cuyos mcrodaos se descarga e la sguee dreccó web: hp:// u=resulados&secc= &dp= Compleamos el Chuk co las sguees seecas: ```{r} lbrary(mcrodaoses) sewd("d:/curso de esadsca co R") ecpf4 <- epf..hogares("fchero de usuaro de hogar a4.x") sr(ecpf4) ``` Eecuamos el Chuk:

24 Para realzar ua esmacó MCO del gaso de los hogares a parr de los gresos, hay que ulzar las sguees varables: GASTMON: Impore oal del gaso moearo aual del hogar elevado emporal y poblacoalmee (para el salaro e espece se coablza sólo el mpore del pago realzado por el hogar). IMPEAC: Impore exaco de los gresos mesuales eos oales del hogar. Defmos el gaso por hogar y esmamos ua regresó leal ere gasos e gresos e u uevo Chuk que eecuamos: ```{r, echo=false} ecpf4$gast=ecpf4$gaso/(*ecpf4$facor/) es <- lm(ecpf4$gast~ecpf4$mpexac) summary(es) ``` ## ## Call: ## lm(formula = ecpf4$gast ~ ecpf4$mpexac) ## ## Resduals: ## M Q Meda 3Q Max ## ## ## Coeffces: ## Esmae Sd. Error value Pr(> ) 3

25 ## (Iercep).e+3.9e <e 6 *** ## ecpf4$mpexac 7.3e 5.63e 3 7. <e 6 *** ## ## Sgf. codes: '***'. '**'. '*'.5 '.'. ' ' ## ## Resdual sadard error: 6 o 44 degrees of freedom ## Mulple R squared:.45, Adused R squared:.45 ## F sasc:.63e+4 o ad 44 DF, p value: <.e 6 La lbrería-r: gvlma, uo a la preseacó de los resulados de la regresó cluye u es sobre los supuesos báscos del modelos de mímos cuadrados ordaros, se eecua co el sguee Chuk: ```{r, echo=false} lbrary(gvlma) gvmodelo <- gvlma(es) summary(gvmodelo) plo(gvmodelo) ``` ## Warg: package 'gvlma' was bul uder R verso 3..3 ## Call: ## lm(formula = ecpf4$gast ~ ecpf4$mpexac) ## ## Resduals: ## M Q Meda 3Q Max ## ## ## Coeffces: ## Esmae Sd. Error value Pr(> ) ## (Iercep).e+3.9e <e 6 *** ## ecpf4$mpexac 7.3e 5.63e 3 7. <e 6 *** ## ## Sgf. codes: '***'. '**'. '*'.5 '.'. ' ' ## ## Resdual sadard error: 6 o 44 degrees of freedom ## Mulple R squared:.45, Adused R squared:.45 ## F sasc:.63e+4 o ad 44 DF, p value: <.e 6 ## ## ## ASSESSMENT OF THE LINEAR MODEL ASSUMPTIONS ## USING THE GLOBAL TEST ON 4 DEGREES OF FREEDOM: ## Level of Sgfcace =.5 ## ## Call: ## gvlma(x = es) ## ## Value p value Decso ## Global Sa Assumpos NOT sasfed! ## Skewess Assumpos NOT sasfed! ## Kuross Assumpos NOT sasfed! ## Lk Fuco Assumpos NOT sasfed! ## Heeroscedascy Assumpos accepable. 4

26 . ETENSIONES AL MODELO DE REGRESIÓN LINEAL.. INTRODUCCIÓN Como veíamos e el capulo aeror, el modelo de regresó leal requere que se cumpla las sguees hpóess sobre los érmos de error: Meda cero: E(e ) = =,, Varaza cosae: Var(e ) = I =,, Resduos correlacoados: Cov(e,e ) = El cumplmeo de algua de dchas hpóess, mplca la o aleaoredad de los resduos y, por ao, la exseca de algua esrucura o relacó de depedeca e los resduos que puede ser esmada, debedo ser cosderada e la especfcacó cal del modelo. Los prcpales problemas asocados al cumplmeo de las hpóess de ormaldad de los resduos so, por u lado, la heeroscedascdad, cuado la varaza de los msmos o es cosae, y la auocorrelacó o exseca de relacó de depedeca o correlacó ere los dferees resduos, lo que volaría el supueso de érmos de error correlacoados. S se cosruye ua gráfca de los resulados de ua esmacó mímo cuadráca (e ordeadas) free al valor absoluo de los resduos (e abscsas), cuado ésos úlmos presea ua dsrbucó aleaora, es decr ua dsrbucó Normal de meda cero y varaza cosae, N (, ), el resulado obedo (véase Fg...) muesra que el amaño del error es depedee del amaño de la varable esmada, ya que errores co valor elevado se correspode co valores baos y alos de la varable depedee esmada; s embargo, ua dsrbucó de resduos co problemas de heeroscedascdad da lugar a ua fgura como la que puede observarse e la fgura.., e dode se mafesa ua clara relacó de depedeca ere la varable esmada y el amaño del error. E ese caso los errores de mayor amaño se correspode co los valores más alos de la varable esmada. Resduos aleaoros de meda cero y varaza cosae Varable esmada Resduos valor absoluo (e ) Fg... Resduos Homocedáscos 5

27 Resduos co heerocedascdad Varable esmada Resduos valor absoluo (e) Fg... Resduos Heeroscedáscos La represeacó gráfca de los errores e forma de sere emporal, es decr, poedo e el ee de ordeadas los errores y e abscsas el perodo emporal e que esá daados, perme aprecar la auseca o preseca de correlacó ya que a los resduos o correlacoados (fgura.3.) les correspode ua represeacó gráfca e la que o se apreca paua emporal algua, sucedédose de forma mpredecble o aleaora, meras que e los resduos co problemas de auocorrelacó la paua emporal es evdee, evdecádose que cada resduo podría ser prevso e fucó de la sucesó de los errores correspodees a perodos emporales pasados (fgura.4.) Resduos aleaoros co meda cero y varaza cosae Fg..3. Resduos s Auocorrelacó 6

28 Resduos co problema de auocorrelacó Fg..4. Resduos co Auocorrelacó Esos problemas asocados a los errores puede deecarse co ess esadíscos dseñados para ello. A couacó se descrbe dchos ess y la forma e que debe procederse para esmar modelos e dode la esmacó mímo-cuadráca presea problemas de ese po asocados a los resduos... HETEROSCEDASTICIDAD Decmos que el érmo de error de ua esmacó mímo-cuadráca presea heeroscedascdad cuado la varaza del msmo es dferee para las dsas observacoes que egra la muesra, lo que mplca que la varabldad de los errores mímo-cuadrácos obedos esá relacoados de algua maera co los daos ulzados e el modelo, ya sea por esar relacoados co la escala emporal de los daos recogdos o por presear algua relacó de depedeca co algua de las varables exógeas ulzadas. Las cosecuecas para la esmacó mímo-cuadráca so que los esmadores de los coefcees segurá sedo sesgados y leales pero ya o será de míma varaza o efcees. Esos problemas se resuelve ulzado ua écca de esmacó leal que recbe el ombre de Mímos Cuadrados Geeralzados (MCG), méodo que se esudará más adelae. La deeccó de la heeroscedascdad se realza a ravés de dversos corases paramércos, ere los que cabe desacar el corase de Barle (Mood, 95), el cosrase de Goldfeld- Quad (965) y el corase de Whe (98), los cuales descrbmos a couacó.... Tes de Barle El es de Barle se basa e de que la suposcó de que las observacoes de los daos de la varable a esmar por el modelo puede agruparse e G grupos (g=,,..., G), cada uo de los cuales se caracerza por eer u dso po de observacoes asocadas a la varable explcava, de al maera que sería el úmero de observacoes correspodees al prmer grupo, el úmero de observacoes asocadas al segudo grupo y, e geeral, G es el úmero de observacoes asocadas al grupo g-ésmo. A cada grupo le correspode u valor medo de la varable depedee y ua varaza para ese valor medo. El es corasa s dcha varaza es gual o o ere los dsos grupos que se ha cosrudo para la varable depedee, admédose la hpóess de exseca de heeroscedascdad s la varaza es sgfcavamee dferee ere los grupos formados. 7

29 Los pasos a segur e la prácca para realzar el es de Barle so los sguees:. Se esma la varaza ( s g ) de cada grupo de observacoes, g=,,..., G medae la sguee expresó: s g g g ( y y ) g g. Se calcula el esadísco S: G G g log sg g logs g g S G 3( G ) g g g Bao el supueso de homocedascdad, S se dsrbuye como ua ch-cuadrado (χ ) co G grados de lberad. Por lo ao, se rechazará la hpóess de gual varaza e odos los grupos s S es mayor que el valor críco de la dsrbucó ch-cuadrado al vel de sgfcacó esadísca fado.... Corase de Goldfeld-Qua El corase de Goldfeld-Qua se ulza para corasar la homocedascdad cuado la forma de la heeroscedascdad o es coocda, auque se uye que la varaza guarda ua relacó moóoa crecee o decrecee respeco a algua varable exógea (que deomaremos varable z). La operava de ese es es la sguee:. Ordear odas las observacoes de las varables del modelo, de meor a mayor, e fucó de la varable z.. Elmar c observacoes cerales de la ordeacó aeror, de al forma que quede dos submuesras de (-c)/ observacoes cada ua. Al seleccoar c, debe hacerse de al forma que (-c)/ sea susacalmee mayor que el úmero de parámeros del modelo. 3. Esmar dos veces el modelo orgal medae Mímos Cuadrados Ordaros, ulzado e cada esmacó cada ua de las submuesras. 4. Deomado SR y SR a las sumas de los cuadrados de los resduos de ambas submuesras (de maera que el subídce correspoda a la submuesra co la meor suma) se defe el esadísco F: F SCR SCR La dea que subyace bao ese corase es la sguee: s exse heeroscedascdad eoces, co la ordeacó de la muesra, la varaza del érmo de error será mayor haca el fal de la muesra que al prcpo de la msma. Como el cuadrado de los 8

30 resduos esá asocado co la varaza de los msmos, eoces SR debería ser sesblemee mayor que SR. Por ello, se rechazara la hpóess ula de homocedascdad sempre que el valor del esadísco F excede el valor e ablas de la dsrbucó F (-c-k)/, (-c-k)/, acepádose la exseca de heeroscedascdad e caso coraro...3. Corase de Whe El corase de Whe se desarrolló ambé para evar la ecesdad de cosderar ua forma específca para la heeroscedascdad. El corase se basa e que, bao la hpóess ula de homocedascdad, la marz de varazas y covarazas de los esmadores MCO de es: ' Por el coraro, s exse heeroscedascdad, la marz de varazas y covarazas vee dada por: ( ' ) ' ( ' ), dag(,,..., ) Por ao, s omamos la dfereca ere ambas queda: ( ' ) ' ( ' ) ( ' ) Por ello, basa co corasar la hpóess ula de que odas esas dferecas so guales a cero, lo que equvale a corasar que o hay heeroscedascdad. Los pasos a segur para realzar el corase de Whe so los sguees:. Esmar el modelo orgal y obeer la sere de resduos esmados. Realzar ua regresó del cuadrado de la sere de resduos obedos e el paso aeror sobre ua cosae, las varables exógeas del modelo orgal, sus cuadrados y los producos cruzados de segudo orde (los producos resulaes de mulplcar cada varable exógea por cada ua de las resaes). Es decr, se raa de esmar por MCO la relacó: eˆ k k k k k k 3 k k k k k 3. Al aumear el amaño muesral, el produco R (dode es el úmero de observacoes y R es el coefcee de deermacó de la úlma regresó) sgue ua dsrbucó Ch-cuadrado co p grados de lberad, dode p es el úmero de varables exógeas ulzadas e la seguda regresó. Se acepará la hpóess de exseca de heeroscedascdad cuado el valor del esadísco supere el valor críco de la dsrbucó Ch-cuadrado (c) al vel de sgfcacó esadísca fado ( R c ). Eemplo.. Para realzar e R el cosrase de heerocedascdad de Whe e el modelo esmado para el gaso de los hogares e España (aparado.), prmero hay que salar e Package-R: seres : 9

31 > sall.packages("seres") y después eecuar el sguee programa R: lbrary(seres) y <- marx(ecpf4$gast,col=) x <- marx(ecpf4$mpexac,col=) whe.es(x,y) Whe Neural Nework Tes daa: x ad y -squared = , df =, p-value <.e-6 E ese eemplo el valor del esadísco R 746, 56, dado que el valor de la dsrbucó Ch-cuadrado eórca para el vel de sgfcacó, 5 da u valor críco c, 3 habría que acepar la hpóess de exseca de heerocedascdad. El p-value es la probabldad asocada al esadísco calculado, al ser de.e-6 y por ao meor que,5, suaría al esadísco e la zoa de acepacó de la hpóess H..3. AUTOCORRELACIÓN Decmos que exse auocorrelacó cuado el érmo de error de u modelo ecoomérco esá correlacoado cosgo msmo a ravés del empo al que E ( e, e ). Ello o sgfca que la correlacó ere los errores se dé e odos los perodos so que puede darse a sólo ere alguos de ellos. E preseca de auocorrelacó, los esmadores MCO sgue sedo sesgados pero o posee míma varaza, debédose ulzar e su lugar el méodo de esmacó de los Mímos Cuadrados Geeralzados (MCG). La exseca de auocorrelacó e los resduos es fáclmee defcable obeedo las fucoes de auocorrelacó (acf) y auocorrelacó parcal (acp) de los errores mímocuadrácos obedos e la esmacó. S dchas fucoes correspode a u rudo blaco, se cosaará la auseca de correlacó ere los resduos. S embargo, el mero exame vsual de las fucoes aerores puede resular cofuso y poco obevo, por lo que e la prácca ecoomérca se ulza dversos corases para la auocorrelacó, sedo el más ulzado el de Durb-Waso (95), que pasamos a ver segudamee..3.. Corase de Durb-Waso S se sospecha que el érmo de error del modelo ecoomérco ee ua esrucura como la sguee: eˆ ˆ e u eoces el corase de Durb-Waso perme corasar la hpóess ula de auseca de auocorrelacó. Dcho corase se basa e el cálculo del esadísco d, ulzado para ello los errores mímo-cuadrácos resulaes de la esmacó: 3

32 d (ˆ e eˆ eˆ ) El valor del esadísco d oscla ere y 4, sedo los valores cercaos a los dcavos de auseca de auocorrelacó de prmer orde. La erpreacó exaca del es resula complea, ya que los valores crícos apropados para corasar la hpóess ula de o auocorrelacó requere del coocmeo de la dsrbucó de probabldad bao el supueso de cumplmeo de dcha hpóess ula, y dcha dsrbucó depede a su vez de los valores de las varables explcavas, por lo que habría que calcularla e cada aplcacó. Para faclar la erpreacó del es Durb y Waso dervaro dos dsrbucoes: d U y d D, que o depede de las varables explcavas y ere las cuales se ecuera la verdadera dsrbucó de d, de forma que a parr de u deermado vel de sgfcacó, se adopa la sguee regla de decsó:. S d d D rechazamos la hpóess ula de o auocorrelacó free a la hpóess alerava de auocorrelacó posva.. S d 4 d D rechazamos la hpóess ula de o auocorrelacó free a la hpóess alerava de auocorrelacó egava. 3. S d U d 4- d U acepamos la hpóess ula de o auocorrelacó. El esadísco d de Durb-Waso es aproxmadamee gual a ˆ e dode ˆ es el coefcee de auocorrelacó smple muesral del reardo. d (ˆ e eˆ eˆ ) eˆ eˆ eˆ ˆ Eemplo.. E el sguee eercco plaeamos ua regresó leal ere el cosumo de eergía elécrca e España y el PIB a precos de mercado valorado e moeda cosae (mlloes de euros). E R, el es de Durb-Waso se ecuera e el Package-R: lmes, y su saxs es: > dwes(formula) Realzar el eercco aeror requere del sguee programa R: > sall.package( bges ) > lbrary(bges) > daos <- read.able(fle="lbro.x",header=t) > daos Años CEEl PIB

33 > dwes(daos$pib ~ daos$ceel) Durb-Waso es daa: daos$pib ~ daos$ceel DW =.68, p-value =.9 alerave hypohess: rue auocorrelao s greaer ha.3.. Corase de Breush-Godfrey El es de correlacó seral de Breusch Godfrey es u es de auocorrelacó e los errores y resduos esadíscos e u modelo de regresó. Hace uso de los errores geerados e el modelo de regresó y u es de hpóess dervado de ése. La hpóess ula es que o exsa correlacó seral de cualquer orde de. El es es más geeral que el de Durb Waso, que solo es váldo para regresores oesocáscos y para esear la posbldad de u modelo auoregresvo de prmer orde para los errrores de regresó. El es Breusch Godfrey o ee esas resrccoes, y es esadíscamee más poderoso que el esadísco d. Los pasos para realzar el corase so los sguees:. Esmar el modelo orgal y obeer la sere de resduos esmados. Esmar la ecuacó de regresó auxlar: eˆ k k eˆ peˆ p 3. Al aumear el amaño muesral, el produco pr (dode es el úmero de observacoes, p, el úmero de reardos del error ulzados e la regresó auxlar y R es el coefcee de deermacó de dcha regresó) sgue ua dsrbucó Ch-cuadrado co p grados de lberad, dode p es el úmero de varables exógeas ulzadas e la seguda regresó. Se acepará la hpóess de exseca de auocorrelacó cuado el valor del esadísco supere el valor críco de la dsrbucó Ch-cuadrado (c) al vel de sgfcacó esadísca fado pr c ). Eemplo.3. El es de Breusch Godfrey ambe se realza co la lbrería-r: lmes, y se programa para 3 p del sguee modo: > sall.package( bges ) > lbrary(gbes) > bges(daos$pib ~ daos$ceel,order=3) 3

34 Breusch-Godfrey es for seral correlao of order up o 3 daa: daos$pib ~ daos$ceel LM es = , df = 3, p-value =.464 E ese eemplo el valor del esadísco pr 5, 37, dado que el valor de la dsrbucó Ch-cuadrado eórca para el vel de sgfcacó, 5 da u valor críco c 7, 8 habría que rechazar la hpóess de exseca de auocorrelacó. El p-value es la probabldad asocada al esadísco calculado, al ser de,454 y por ao mayor que,5, suaría al esadísco e la zoa de acepacó de la H, la que cosuye los valores del esadísco ferores al valor críco..3. DEFICIENCIAS MUESTRALES: MULTICOLINEALIDAD El feómeo de la mulcolealdad aparece cuado las varables exógeas de u modelo ecoomérco esá correlacoadas ere sí, lo que ee cosecuecas egavas para la esmacó por MCO, ya que la exseca de ua relacó leal ere las varables exógeas, mplca que la marz ( ' ) va a eer deermae cero, es decr será ua marz sgular y por ao o será verble. Dado que ˆ ( ' ) ', o será posble calcular la esmacó mímo cuadráca de los parámeros del modelo, lógcamee, la varaza de los msmos. Eso es lo que se cooce por el ombre de mulcolealdad exaca. Cosderemos por eemplo la relacó leal: u Supogamos que las varables depedees presea relacó leal exaca: c La marz ( ) quedaría: ' susuyedo ' c por c eemos: c c c c Como el valor de u deermae o se alera s se resa de ua fla o columa u múlplo cosae de cualquer ora fla o columa. S mulplcamos la seguda fla de ( ) por c y resamos el resulado de la ercera fla eemos: 33

35 A c c pueso que ' A, la marz ( ) es sgular y por ao o verble. S embargo, e la prácca o os ecoraremos co u caso a exremo como el que acabamos de expoer, so que geeralmee os ecoraremos ae lo que se cooce como mulcolealdad aproxmada, sedo ua de las columas de la marz ( ' ), aproxmadamee, ua combacó leal del reso por lo que será ua marz aproxmadamee sgular. Al o ser el deermae de ( ' ) gual a cero, exsrá versa y podrá esmarse los parámeros pero co las sguees cosecuecas:. Por u lado, pequeñas varacoes muesrales producdas al corporar o susraer u úmero reducdo de observacoes muesrales podría geerar mporaes cambos e los parámeros esmados.. Por oro lado, la marz de covarazas del esmador MCO, S ˆ ˆ S e ' ser u múlplo de ( ' ), será muy grade por ser el deermae de ( ' ) muy pequeño por lo que la esmacó realzada será muy poco precsa al ser la desvacó ípca de cada parámero muy elevada. Las solucoes propuesas para resolver el problema de la mulcolealdad so varadas, s be e geeral resula poco sasfacoras:. Ua posbldad, sugerda por Johso (984), cosse e exclur aquella varable exógea que puede esar muy correlacoada co el reso y poserormee esmar el coefcee asocado a dcha varable medae oro procedmeo para clurlo e el modelo.. Ora posbldad es la que se cooce como regresó cresa, roducedo ua cosae c e la marz ( ' ) de al forma que el esmador de MCO quedaría como ˆ ( ' ci k ) ', evado así la sgulardad de la marz. Evdeemee, los coefcees esmados esará sesgados pero la marz de covarazas de los msmos será, seguramee, meor que la que obedríamos s roducr la cosae por lo que probablemee la meor varaza compese e pare el sesgo roducdo. Ora cuesó o meos rval es la seleccó del valor de c, para lo que o exse u méodo defdo; ua posbldad, sugerda por Hoerl y Keard (97) es comezar co u valor muy pequeño de c e r aumeádolo hasa que observemos que las esmacoes comeza a esablzarse. 3. També se ha sugerdo la posbldad de reformular el modelo, covrédolo e u modelo de varas ecuacoes (esmacó por ramos). 4. Falmee, cuado la mulcolealdad se debe a la preseca como varables explcavas de varos reardos de ua msma varable, puede especfcarse ua relacó ere sus coefcees para elmar alguo de los reardos del modelo., al 34

36 .4. ERRORES DE ESPECIFICACIÓN Los errores de especfcacó hace refereca a u couo de errores asocados a la especfcacó de u modelo ecoomérco. E cocreo cabe referrse a: Omsó de varables relevaes Iclusó de varables ecesaras Adopcó de formas fucoales equvocadas E Ecoomía la eoría o suele cocrear la forma fucoal de las relacoes que esuda. Así, por eemplo, cuado se aalza la demada se señala que la cadad demadada es versamee proporcoal al preco; cuado se esuda el cosumo agregado se apua que la propesó margal a cosumr (relacó ere rea y/o cosumo) es mayor que cero y meor que uo. Por oro lado es frecuee ulzar la codcó ceers parbus para aslar la formacó de oras varables relevaes que fluye y/o modfca la relacó esudada. Por esa razó, la exseca de errores de especfcacó e la relacó esmada es u facor a cosderar y a resolver e el proceso de la esmacó ecoomérca. Co depedeca de la auraleza de los errores de especfcacó, dado que el proceso de esmacó MCO debe de cumplrse deermadas hpóess báscas, que los esmadores MCO debe de ser sesgados, efcees y cossees, y que el esmador de la varaza del érmo de error ha de ser sesgado, debemos preguaros: qué ocurrría co esas propedades ae errores de especfcacó? Para respoder a esa cuesó, parmos del modelo de regresó leal cuya especfcacó geeral es: Co las propedades habuales: = o ß k k + e Meda cero : E(e ) = =,, Varaza cosae : Var(e ) = I =,, Resduos correlacoados : Cov(e,e ) = No exseca de relacó leal exaca ere dos o más varables depedees.4.. Omsó de ua varable relevae Para aalzar las cosecuecas de la omsó de ua varable relevae, vamos a parr del sguee modelo verdadero: = e (.) S embargo, por algú movo, se ha proceddo esmar el sguee modelo: = + + v (.) Dado que la varable excluda esá relacoada co la varable depedee, eoces se deduce que: v = ß + e. Esmado la pedee por MCO e el modelo (.), se obee: 35

37 36 ˆ y sedo y, de forma que al susur y por su expresó e el modelo verdadero (.) quedaría: ˆ e e x x Al omar esperazas codcoales co respeco a los valores de las varables depedees y dado que E(e x, x,, x k ) =, se obee que: ˆ E lo que mplca que ) ˆ ( E o será gual a, por lo que esará sesgado sedo su sesgo: Expresó cuyo sgo vee deermado por el sgo del coefcee y por el sedo de la correlacó ere las varables y. Co respeco a la varaza, dado que de la esmacó MCO resula que:, ˆ r Var e dode r, es el R resulae de regresar sobre. además: ˆ Var v eoces ) ˆ ( Var será dferee de ) ˆ ( Var, y por lo geeral será mas pequeña ya que <r,<; pero aú e el caso e que r,=, que mplcaría que y o esá correlacoadas, y auque el esmador MCO de o fuera sesgado (ya que el sesgo de las varables omdas se aularía porque el ermo sería cero), las varazas sería ya de por sí dferees debdo e la esmacó de la ecuacó (.) y e la de la ecuacó (3.).

38 .4.. Iclusó de ua varable ecesara Supógase ahora que el modelo verdadero es: = + + e Pero se especfca el sguee modelo: = o v (.3) Los esmadores MCO de (.3) so ahora sesgados y cossees, ya que E ( ˆ), E ( ˆ ) y ( ˆ ) E ; a ese respeco hay que eer presee que al ser ua varable ecesara el parámero esmado o será sgfcavamee dso de cero. Pero como desde el puo de vsa de las varazas ahora resula que: Var ˆ e v Varˆ r, Pueso que < r,<, se cumplría que Var( ˆ ) ( ˆ Var ), es decr, la varaza de la esmacó MCO de sería mayor que la esmacó MCO de Especfcacó fucoal correca S especfcamos la forma fucoal de ua relacó (ya sea leal, cuadráca, cúbca, expoecal, logarímca, ec.) y la verdadera relacó presea ua forma dferee a la especfcada ee, e alguos casos, las msmas cosecuecas que la omsó de varables relevaes, es decr, proporcoa esmadores sesgados e cossees. E geeral, ua especfcacó fucoal correca lleva a obeer perurbacoes heeroscedáscas y/o auocorrelacoadas, o aleadas de los parámeros de la dsrbucó del érmo de error del modelo correcamee especfcado Corase de errores de especfcacó Para cosaar la preseca de errores de especfcacó e los modelos se ulza la prueba geeral de errores de especfcacó de Ramsey. Dcha prueba, e su versó más seclla, se realza medae los sguees pasos:. A parr del modelo especfcado, obeemos esmada, es decr ˆ.. Se efecúa ua ueva regresó cluyedo ˆ e algua forma, co uo o varos regresores adcoales, por eemplo: ˆ ˆ 3 3 e 37

39 3. Cosderado el R obedo e el modelo calmee especfcado, R A, y el R obedo e la seguda regresó, R B, se cosruye el sguee esadísco: F R R B A l RB ( k) El cual se dsrbuye segú ua F de Sedecor co l, k grados de lberad, sedo l el úmero de regresores uevos cludos e el segudo modelo y k el úmero de observacoes meos el umero de parámeros del segudo modelo. 4. S el valor F calculado es sgfcavo al vel deseado, Fexp Fco se puede acepar la hpóess de que el modelo esá mal especfcado..5. MÉTODOS DE SELECCIÓN DE VARIABLES EN EL MODELO DE REGRESIÓN LINEAL Ua de las cuesoes más mporaes a la hora de ecorar el modelo de ause más adecuado cuado se dspoe de u amplo couo de varables explcavas, es la correca especfcacó del modelo eórco, ya que como se ha vso la clusó de ua varable ecesara o la omsó de ua varable relevae, codcoa los esadíscos que resula e la esmacó MCO del modelo, por oro lado, e u elevado úmero de explcavas o cabe descarar la exseca de correlacoes que orge u problema de mulcolealdad aproxmada, y e esos casos hay que deermar cual de ellas cabe clur e la especfcacó del modelo. E oras palabras, ae u couo elevado de explcavas debemos seleccoar de ere odas, u subcouo de ellas que garace que el modelo esé lo meor especfcado posble. Ese aálss cabe hacerlo esudado las caraceríscas y propedades de cada ua de las varables depedees, a parr, por eemplo, de los coefcees de correlacó de cada ua de ellas y la depedee, y de cada explcava co las resaes, seleccoado modelos aleravos y observado los resulados esadíscos de la esmacó MCO de cada uo de ellos. S embargo, e la prácca, la seleccó del subcouo de varables explcavas de los modelos de regresó se dea e maos de procedmeos más o meos auomácos. Los procedmeos más usuales so los sguees: Méodo backward: se comeza por cosderar cludas e el modelo eórco a odas las varables dspobles y se va elmado del modelo de ua e ua segú su capacdad explcava. E cocreo, la prmera varable que se elma es aquella que presea u meor coefcee de correlacó parcal co la varable depedee-o lo que es equvalee, u meor valor del esadísco y así sucesvamee hasa llegar a ua suacó e la que la elmacó de ua varable más supoga u desceso demasado acusado e el coefcee de deermacó. Méodo forward: se comeza por u modelo que o coee gua varable explcava y se añade como prmera de ellas a la que presee u mayor coefcee de correlacó -e valor absoluo- co la varable depedee. E los pasos sucesvos se va corporado al modelo aquella varable que presea u mayor coefcee de correlacó parcal co la varable depedee dadas las depedees ya cludas e 38

40 el modelo. El procedmeo se deee cuado el cremeo e el coefcee de deermacó debdo a la clusó de ua ueva varable explcava e el modelo ya o es mporae. Méodo sepwse: es uo de los más empleados y cosse e ua combacó de los dos aerores. E el prmer paso se procede como e el méodo forward pero a dfereca de ése, e el que cuado ua varable era e el modelo ya o vuelve a salr, e el procedmeo sepwse es posble que la clusó de ua ueva varable haga que ora que ya esaba e el modelo resule redudae. El modelo de ause al que se llega paredo del msmo couo de varables explcavas es dso segú cuál sea el méodo de seleccó de varables elegdo, por lo que la ulzacó de u procedmeo auomáco de seleccó de varables o sgfca que co él se llegue a obeer el meor de los modelos a que da lugar el couo de daos co el que se rabaa. Eemplo.4. Ulzado los mcrodaos de la EPF, vamos a complear u modelo explcavo de los gasos por hogar, para ellos seleccoamos como posbles varables explcavas, además de los gresos correes del hogar, las sguees varables: Nmemb (Número de membros del hogar) mem (Número de membros del hogar de 5 a 34 años) mem (Número de membros del hogar de 35 a 64 años) mem (Número de membros del hogar de 65 a 84 años) mem3 (Número de membros del hogar de 85 o más años) umac (Número de membros acvos e el hogar) umac (Número de membros o acvos e el hogar) umocu (Número de membros ocupados e el hogar) umocu (Número de membros o ocupados e el hogar) umesu (Número de esudaes e el hogar) umoesu (Número de o esudaes e el hogar) phogar (Tpo de hogar -prmera clasfcacó-) suocuhog (Suacó del hogar respeco a la ocupacó) suachog (Suacó del hogar respeco a la acvdad) Todas las varables excepo las res úlmas so umércas, las dos úlmas so varables cualavas (facores). Las caegorías de phogar so: Hogar de u solo adulo Ua persoa de 65 o más años Ua persoa de 3 a 64 años 3 Ua persoa de meos de 3 años 4 U adulo co ños meores de 6 años Las caegorías 7 a se refere exclusvamee a hogares formados por padres e hos, cluyedo los adopados y los que so hos sólo de u membro de la parea. E el caso e que haya oras persoas e el hogar, ése se clasfcaría e.oros hogares. Se cosdera adulo a oda persoa de 6 o más años 39

41 Parea s hos 5 Parea s hos eedo al meos uo de los membros 65 años o más 6 Parea s hos eedo los dos membros meos de 65 años Parea co hos meores de 6 años 7 Parea co u ho meor de 6 años 8 Parea co dos hos meores de 6 años 9 Parea co res o más hos meores de 6 años Oras famlas ucleares Padre o madre solo, co al meos u ho de 6 o más años Parea co al meos u ho de 6 o más años Oros hogares Las caegorías de suocuhog so: El suseador prcpal y el cóyuge ocupados, al meos oro de los membros ambé ocupado El suseador prcpal y el cóyuge ocupados, guo de los oros membros ocupados (s es que los hay) 3 El suseador prcpal o el cóyuge ocupado, oro de los membros ocupado 4 El suseador prcpal o el cóyuge ocupado, al meos oros dos membros ocupados 5 El suseador prcpal o el cóyuge ocupado, guo de los oros membros ocupado (s es que los hay) 6 N el suseador prcpal su cóyuge ocupado, oro membro ocupado 7 N el suseador prcpal su cóyuge ocupados, al meos oros dos membros ocupados 8 Ngú ocupado e el hogar -9 No cosa E ao que las caegorías de suachog so: El suseador prcpal y el cóyuge acvos, al meos oro de los membros ambé acvo El suseador prcpal y el cóyuge acvos, guo de los oros membros acvos (s es que los hay) 3 El suseador prcpal o el cóyuge acvo, oro de los membros ambé acvo 4 El suseador prcpal o el cóyuge acvo, al meos oros dos membros acvos 5 El suseador prcpal o el cóyuge acvo, guo de los oros membros acvos (s es que los hay) 6 N el suseador prcpal su cóyuge acvos, oro membro acvo 7 N el suseador prcpal su cóyuge acvos, al meos oros dos membros acvos 8 Ngú acvo e el hogar -9 No cosa Para realzar la seleccó de u modelo por el méodo forward ecesamos salar la lbrería- R: leaps, ua vez salada eecuamos el sguee Chuk: ```{r, echo=false} daos <- daa.frame(ecpf4[,],ecpf4[,5:34],ecpf4[,4],ecpf4[,5:5 3],ecpf4$mpexac) sr(daos) lbrary(leaps) 4

42 regf.fwd=regsubses(y~.,daa=daos,mehod="forward") plo(regf.fwd) coef(regf.fwd,9) ``` El modelo seleccoado cluye como explcavas: ##(Iercep) ## ##memb ## ##mem ## ##mem3 ## ##umac ## ##phogar: Ua persoa de 3 a 64 años. ## ##phogar: Parea co u ho meor de 6 años. ## ##suocuhog: Ngú ocupado e el hogar. ## ##suachog: El suseador prcpal o el cóyuge acvo, oro de los membros ambé acvo. ## ##umoesu ##

43 3. MODELOS CON VARIABLES CUALITATIVAS 3.. MODELOS CON VARIABLES CUANTITATIVAS CUALITATIVAS COMO REGRESORES E u modelo ecoomérco, las varables represea a los cocepos u operacoes ecoómcas que queremos aalzar. Normalmee ulzamos varables cuaavas, es decr, aquellas cuyos valores vee expresados de forma umérca; s embargo, ambé exse la posbldad de clur e el modelo ecoomérco formacó cualava, sempre que esa pueda expresarse de esa forma. Las varables cualavas expresa cualdades o arbuos de los agees o dvduos (sexo, relgó, acoaldad, vel de esudos, ec.) y ambé recoge acoecmeos exraordaros como guerras, erremoos, clmaologías adversas, huelgas, cambos polícos ec. No cabe duda de que ua forma de recoger facores de ese po sería la ulzacó de varables proxy o aproxmadas a las varables ulzadas. Por eemplo, s quero ulzar ua varable que mda el vel culural de u país (varable cualava) puedo ulzar como varable proxy el úmero de bbloecas exsees e u país, o represea ua clmaología adversa a parr de las emperauras medas o precpacoes. S embargo, o sempre es posble ecorar ese po de varables y, e cualquer caso, debemos de ser coscees de la posble exseca de errores e la defcó de la varable. Pueso que las varables cualavas ormalmee recoge aspecos de la preseca o o de deermado arbuo (ser hombre o muer, eer esudos uversaros o o eerlos, ec. ) se ulza varables cosrudas arfcalmee, llamadas ambé fccas o dummy, que geeralmee oma dos valores, ó, segú se dé o o cera cualdad o arbuo. Habualmee a la varable fcca se le asga el valor e preseca de la cualdad y e caso coraro. Las varables que oma valores y, ambé recbe el ombre de varables dcoómcas o baras. Las varables dcoómcas puede combarse para caracerzar varables defdas por su pereeca o o a u grupo. S cluyo ua varable cualava que me defe la pereeca o o de u país a u grupo, por eemplo rea ala, meda y baa, roducré res varables cualavas e el modelo asocadas a la pereeca o o a cada grupo; la prmera caracerzaría a los dvduos co rea ala, la seguda a los dvduos co rea meda, y la ercera a los dvduos co rea baa. Los modelos que ulza varables cualavas como regresores se dfereca e dos grupos, los modelos de Aálss de la Varaza o modelos ANOVA, que úcamee cluye varables cualavas como regresores; y los modelos de Aálss de la Covaraza o modelos ANCOVA que cluye ao varables cualavas como cuaavas. Los modelos ANOVA so muy ulzados e Socología, Pscología, Educacó, ec.; e Ecoomía so más comues los modelos ANCOVA. 4

44 MODELOS ANOVA U problema esadísco clásco es la comparacó de medas de dos dsrbucoes ormales. Supogamos que las observacoes de la varable, provee de dos dsrbucoes ormales co medas y y varaza comú. El amaño de la prmera dsrbucó se crcuscrbe a las prmeras observacoes, y el de la seguda las resaes observacoes. Queremos cosrasar la hpóess : o H free a la alerava : o H al vel de sgfcacó de. Ese corase de gualdad de medas cabe formularlo e el marco del modelo leal geeral. Así, bao o H eemos el sguee modelo de regresó múlple ulzado varables Dummy: e D D Sedo: s s D,...,,..., s s D,...,,..., El esmador mímo cuadráco del modelo plaeado sería: D D D D D D D D ˆ ˆ Teedo presee que D, D, D D, D y D, el esmador mímo cuadráco quedaría: ˆ ˆ Para corasar la hpóess : o H free a la alerava : o H, cosruríamos el esadísco expermeal ˆ ˆ exp ˆ ˆ ˆ ˆ S, e dode ˆ e. La hpóess : o H se rechaza co el esadísco eórco ) / ( co s co exp.

45 El aálss aeror se exede a la comparacó de medas co res o más dsrbucoes ormales. Supoemos ahora que las observacoes procede de res dsrbucoes ormales co medas, y 3 y varaza comú, correspodees a res muesras que coee las prmeras observacoes, sguees y 3 ulmas observacoes. El modelo leal ulzado varables Dummy quedaría: d d d e 3 Dode las varables baras se defe: s e el grupo J DJ s e el grupo J El esmador mímo cuadráco del vecor de parámeros es: ˆ ˆ ˆ Para corasar la hpóess H o : 3, se ulza el corase de sgfcacó global, R para el que cosrumos es esadísco expermeal F exp, sedo el esadísco ( R ) 3 eórco F co F(, 3), la hpóess se rechazaría co la regla de decsó Fexp Fco. Eemplo 3.. Paredo de la base de daos ecpf4 preparamos u Chuk e el que cosrumos la abla aova co la fucó aov, para los gasos por hogar y la varable caegórca suachog, y esmamos u modelo ANOVA co la fucó model.ables. ```{r, echo=false} sr(ecpf4$suachog) mod <- aov(ecpf4$gast ~ecpf4$suachog) summary(mod) model.ables(mod) ``` ## Nml. em w/ 8 labels for,,3,... um [:46] ## Df Sum Sq Mea Sq F value Pr(>F) ## ecpf4$suachog.e <e 6 *** ## Resduals e ## 44

46 ## Sgf. codes: '***'. '**'. '*'.5 '.'. ' ' ## Warg replcaos(pase("~", xx), daa = mf): o facors gored: ## ecpf4$suachog ## Tables of effecs. ##ecpf4$suachog ##ecpf4$suachog ## 9 ## 74.6 ##El suseador prcpal y el cóyuge acvos, al meos oro de los membros ambé acvo. ##.93 ## El suseador prcpal y el cóyuge acvos, guo de los oros membros acvos (s es que los hay) ##4.34 ##El suseador prcpal o el cóyuge acvo, oro de los membros ambé acvo ##.6 ##El suseador prcpal o el cóyuge acvo, al meos oros dos membros acvos ##36.88 ## El suseador prcpal o el cóyuge acvo, guo de los oros membros acvos (s es que los hay) ##53.4 ##N el suseador prcpal su cóyuge acvos, oro membro acvo ##69.4 ##N el suseador prcpal su cóyuge acvos, al meos oros dos membros acvos ##85.68 ##Ngú acvo e el hogar ##.95 El esadísco F al ser mayor que el valor eórco perme rechazar la hpóess H o :... 9 por lo que cabe admr que las dferees caegorías de suacó de hogar ee flueca e el gao e cosumo de los hogares. De hecho el códgo *** os muesra que la varable es sgfcava a u muy bao. 45

47 Ulzado la fucó lm, e cluyedo u érmo cosae. ```{r, echo=false} mod <- lm(ecpf4$gast ~ as.facor(ecpf4$suachog)) aova (mod) ``` ## Aalyss of Varace Table ## ## Respose: ecpf4$gast ## Df Sum Sq Mea Sq F value ## as.facor(ecpf4$suachog) e ## Resduals e ## Pr(>F) ## as.facor(ecpf4$suachog) <.e 6 *** ##Resduals ## ## Sgf. codes: '***'. '**'. '*'.5 '.'. ' ' Ese modelo es más fácl de erprear, ya que cosderado u cosumo promedo por hogar de 96.7, los hogares e dode el suseador prcpal y el cóyuge esá acvos, y guo de los oros membros esá acvos (s es que los hay), cosumría al mes euros que el hogar medo, e ao que el suseador prcpal su cóyuge acvos, pero al meos oros dos membros esá acvos, cosumría euros más al mes que el hogar medo MODELOS ANCOVA Para lusrar la ulzacó de u modelo ANCOVA vamos a supoer que esamos modelzado la relacó que exse ere el dero que ahorra u grupo de dvduos,, y la rea que declara cada uo de ellos, : = + +e, sedo =.. De ese grupo de dvduos coocemos alguas oras caraceríscas que puede ser rascedees a la hora de uesro aálss, por eemplo s esá o o esá casados. Ulzado dcha formacó creamos las sguees varables dummy: D, s esá casado, s o esá casado D, s o esá casado ( D ), s esá casado S por eemplo la muesra de dvduos que eemos es de =, de los cuales cuaro de ellos esá casados, las varables dummy edría la sguee esrucura: 46

48 D D De cara a esudar los efecos del esado cvl sobre el ahorro podemos esar eresados e saber s los casados pare de u vel de ahorro dferee de los soleros, o be s las dferecas ere soleros y casados derva e que uos y oros ee ua dferee propesó margal a ahorrar. E el prmer caso se raa de coocer s es dferee ere los dos grupos de dvduos, y e el segudo, s lo es. El plaeameo del problema para observar las dferecas de cada grupo respeco a se puede realzar a ravés de las sguees especfcacoes del modelo ANCOVA: E ese caso: = + D + +e (3.) = + D + +e (3.) = D + D + +e (3.3) S se ulza la especfcacó del modelo (3.), el érmo depedee de los casados vedrá dado por la suma ( + ), y para los soleros por. S queremos aalzar la gualdad e el vel de ahorro de ambos grupos, habría que corasar la hpóess ula H : = S se ulza la especfcacó del modelo (3.), el érmo depedee de los soleros vedrá dado por la suma ( + ), y para los casados por. S queremos aalzar la gualdad e el vel de ahorro de ambos grupos, habría que corasar la hpóess ula H : = S se ulza la especfcacó del modelo (3.3) el érmo depedee de los casados vedrá dado por el coefcee, y para los soleros por. S queremos aalzar la gualdad e el vel de ahorro de ambos grupos, habría que corasar la hpóess ula H : = Las res especfcacoes so equvalees, y hay que eer presee que e la especfcacó del modelo (3.3) se prescde del érmo cosae ya que de o hacerlo así edríamos u problema de mulcolealdad exaca ere el érmo cosae y las dos varables dummy. S plaeamos el modelo (3.3) de la sguee forma: = + D + D + +e La marz quedaría: 47

49 E la que se apreca que la suma de las columas y 3 da como resulado la prmera columa, lo que provoca que la marz ( ) sea o sgular. Para el aálss del comporameo de cada grupo respeco a la pedee, aquí propesó margal a ahorrar, podemos plaear las sguees especfcacoes del modelo ANCOVA: E ese caso: = + + (D )+e (3.4) = + + (D )+e (3.5) = + (D )+ + (D )+e (3.6) S se ulza la especfcacó del modelo (5.4), la propesó margal de los dvduos casados vedrá dado por la suma ( + ), y la de los soleros por. S queremos aalzar la gualdad e la propesó margal del ahorro e ambos grupos, habría que corasar la hpóess ula H : = S se ulza la especfcacó del modelo (5.5), la propesó margal de los dvduos soleros vedrá dado por la suma ( + ), y la de los casados por. S queremos aalzar la gualdad e la propesó margal del ahorro e ambos grupos, habría que corasar la hpóess ula H : =. S se ulza la especfcacó del modelo (5.6), la propesó margal de los dvduos casados vedrá dado por, y la de los soleros por. S queremos aalzar la gualdad e la propesó margal del ahorro e ambos grupos, habría que corasar la hpóess ula H : = S queremos clur e modelo ora caracerísca de los dvduos como sería por eemplo la profesó y dsgumos ere res profesoes: agrculores, asalarados y empresaros, habría que crear res ueva varables dummy: 48

50 E E E3, s es agrculor, s o es agrculor, s es asalarado, s o es asalarado, s es empresaro, s o es empresaro S be a la hora de especfcar el modelo hay que evar los problemas de mulcolealdad ere odas las varables dummy cludas y el érmo cosae. Ua forma de evar los problemas es o clur algua de las caegorías e forma de varable dummy, y dear que la cosae recoa el efeco de la caegoría o cluda. Ua especfcacó posble de u modelo ANCOVA sería eoces: = + D + E + E + +e Las varables cualavas ambé puede correspoder a hechos que cocurre e u perodo de empo y eer la forma de sere emporal. Ese po de varables se ulza para observar los efecos que sobre el modelo provoca sucesos exraordaros como so las huelgas, ua clmaología adversa, cambos polícos e cluso cambos e la meodología esadísca de elaboracó de los daos. Supogamos que eemos el sguee modelo: = + +e sedo =,.,T, T + T E el perodo T sabemos de la exseca de u suceso exraordaro que afeca a la evolucó de la varable depedee durae u perodo deermado de empo, y queremos lógcamee saber el efeco que causa dcho suceso exraordaro sobre la ecuacó a esmar. Para ello defmos las sguees varables dummy: D s T s T D s T ( D ) s T La esrucura de ambas varables sería la sguee:.... D. D... D ee aos uos como observacoes hay hasa T y D ee aos uos como observacoes hay ere T y T. El aálss del efeco del suceso exraordaro sobre la regresó puede realzarse de forma separada para cada perodo de a T y T a T, o couamee para odo el perodo, be sobre el ermo cosae o sobre la pedee. 49

51 Para el aálss de los efecos sobre el érmo cosae edremos que plaear los sguees modelos de regresó: E ese caso: = + D + +e (3.7) = + D + +e (3.8) = D + D + +e (3.9) S se ulza la especfcacó del modelo (3.7) el aálss de la varabldad de exge corasar la hpóess ula H : = S se ulza la especfcacó del modelo (3.8) el aálss de la varabldad de exge corasar la hpóess ula H : = S se ulza la especfcacó del modelo (3.9) el aálss de la varabldad de exge corasar la hpóess ula H : = S queremos aalzar el efeco del acoecmeo exraordaro sobre la pedee del modelo, plaearemos las sguees ecuacoes de regresó: = + + (D )+e (3.) = + + (D )+e (3.) = + (D )+ + (D )+e (3.) E cuyo caso: S se ulza la especfcacó del modelo (3.), el aálss de la varabldad de exge corasar la hpóess ula H : = S se ulza la especfcacó del modelo (3.), el aálss de la varabldad de exge corasar la hpóess ula H : = S se ulza la especfcacó del modelo (3.), el aálss de la varabldad de exge corasar la hpóess ula H : = Para omar ua decsó acerca de que modelo ANCOVA seleccoar ere las varas especfcacoes que ulza varables cualavas, hay ulzar el corase de errores de especfcacó descro e el aparado Eemplo 3.. Paredo de la base de daos ecpf4 preparamos u Chuk, co la fucó lm, ulzado ahora como explcavas la eracó suachog e gresos del hogar: ```{r, echo=false} mod3 <- lm(ecpf4$gast ~ as.facor(ecpf4$suachog)* ecpf4$ mpexac) aova (mod3) ## Aalyss of Varace Table 5

52 ## ## Respose: ecpf4$gast ## Df Sum Sq ## as.facor(ecpf4$suachog) e+9 ## ecpf4$mpexac.39e+ ## as.facor(ecpf4$suachog):ecpf4$mpexac e+7 ## Resduals e+ ## Mea Sq F Value ## as.facor(ecpf4$suachog) e ## ecpf4$mpexac.39e ## as.facor(ecpf4$suachog):ecpf4$mpexac 7.777e ## Resduals.87e+6 ## Pr(>F) ## as.facor(ecpf4$suachog) <.e 6 *** ## ecpf4$mpexac <.e 6 *** ## as.facor(ecpf4$suachog):ecpf4$mpexac 4.83e 7 *** ## Resduals ## ## Sgf. codes: '***'. '**'. '*'.5 '.'. ' ' 5

53 4. MODELO LINEAL GENERALIZADO. Los modelos leales (regresó, ANOVA, ANCOVA), se basa e los sguees supuesos:. Los errores se dsrbuye ormalmee.. La varaza es cosae. 3. La varable depedee se relacoa lealmee co las varables depedees. de maera aalíca edríamos:... k k e, =,,, dode e esa dsrbuda de cómo ua ormal de meda cero, varaza cosae (homocedásca),, y dode la covaraza ere e y e es ula para, E(e e ) = (auseca de auocorrelacób). Es decr, e N(, ). Esos supuesos lleva mplíco que la dsrbucó de la varable depedee sea ambé ua ormal N(, ), dode: E... ( ) k k E muchas ocasoes, s embargo, os ecoramos co que uo o varos de esos supuesos o se cumple por la auraleza de la formacó. E alguos casos, esos problemas se puede llegar a solucoar medae la rasformacó de la varable respuesa (por eemplo omado logarmos). S embargo esas rasformacoes o sempre cosgue corregr la fala de ormaldad, la heerocedascdad (varaza o cosae) o la o lealdad de uesros daos. Ua alerava a la rasformacó de la varable depedee/respuesa y a la fala de ormaldad es el uso de los modelos leales geeralzados (MLG). Los MLG fuero formulados por Joh Nelder y Rober Wedderbur (989) como ua maera de ufcar varos modelos esadíscos, cluyedo la regresó leal, regresó logísca y regresó de Posso, bao u solo marco eórco. Los MLG so, por ao, ua exesó de los modelos leales que perme ulzar dsrbucoes o ormales de los errores (bomales, Posso, gamma, ec) y varazas o cosaes. Los MLG perme especfcar dsos pos de dsrbucó de errores, Cayuela () expoe los sguees eemplos: Posso, muy úles para coeos de acoecmeos, por eemplo: úmero de herdos por accdees de ráfco; úmero de hogares asegurados que da pare de sesro al día. Bomales, de gra uldad para proporcoes y daos de preseca/auseca, por eemplo: asas de moraldad; asas de feccó; porceae de sesros morales. Gamma, muy úles co daos que muesra u coefcee de varacó cosae, eso es, e dode la varaza aumea segú aumea la meda de la muesra de maera cosae, por eemplo : úmero de herdos e fucó del úmero de sesros Expoecal, muy úles para los aálss de supervveca. 5

54 Ora razó por la que u modelo leal puede o ser adecuado para descrbr u feómeo deermado es que la relacó ere la varable respuesa y las varables depedees o es sempre leal. La fucó de vículo se ecarga de lealzar la relacó ere la varable depedee y las varables depedees medae la rasformacó de la varable respuesa: Tabla 4. Las fucoes de lgadura/vículo mas ulzadas Fuee: Cayuela L. () E la sguee abla se muesra alguas de las combacoes más comues de varables respuesas y varables explcavas co dsos pos de fucoes de vículo y dsrbucoes de errores. Tabla 4.. Modelos MLG más comues Fuee: Cayuela L. () La esmacó de los parámeros, se realza por máxmo verosmlud 3, y os auses de ' se calcula como g, ua vez esmados los parámeros del vecor. x ˆ, 3 S be el méodo de MCO es el más frecueemee usado para calcular los parámeros del modelo de regresó, hay méodos aleravos. Uo de ellos es el méodo de Máxma Verosmlud (Maxmum Lkelhood). Para ulzar el méodo debemos coocer la dsrbucó de probabldad del érmo aleaoro. 53

55 Para valorar el ause de los MLG se ulza el esadísco ch-cuadrado, que se defe como el doble de la dfereca ere el máxmo del logarmo de la verosmlud que se podría cosegur co la míma (o máxma) paramerzacó y el valor del máxmo del logarmo de la verosmlud que se cosgue co el modelo a evaluar, y el esadísco AIC (Akake Iformao Crero), formulado por Akake (974): l k AIC N N dode l es el valor e el ópmo del logarmo de la fucó de verosmlud co k parámeros esmados y N las observacoes. Sguedo esos creros, se seleccoará aquel modelo para el que se obega u AIC más bao. La especfcacó de u MLG se realza e res pares: La compoee aleaora correspodee a la varable que sgue ua dsrbucó de la famla expoecal (ormal, log-ormal, posso, gamma, ) La compoee ssemáca, o predcor, que se deoa y correspode al vecor de ' compoees... x. La fucó de lgadura (o fucó lk g ()) que relacoa la esperaza maemáca de la varable co el predcor leal, g( ), la fucó de lgadura debe de ser moóoa y dferecable. k k k S supoemos que se dsrbuye como ua N(, ), la fucó explíca de probabldad (PDF) para se puede escrbr como: ( )( ) / f ( ) e S se seleccoa ua muesra aleaora de,,, s : La fucó de probabldad (lkelhood fuco) de las s (o la fucó de verosmlud de la muesra) es: l f,,, ) ( Podemos escrbr ahora: o ( )( ) ( )( ) / / e e l l ( / ) e ( ) El efoque Máxmo Verosíml para calcular y (y ) es obeer las expresoes para esos parámeros que maxmza la fucó de probabldad de las s e la ecuacó aeror. 54

56 Eemplo 4.. Ulzado la seleccó de varables del Eemplo.4, vamos a esmar u modelo ulzado la dsrbucó de posso y u po de fucó vculo logarímca, para ello eecuamos el sguee Chuk : ```{r, eval=false,echo=false} es <- glm(ecpf4$gas ~ memb + mem + mem3 + umac + phogar + suocuhog + suachog + umoesu, daa=daos,famly=posso (lk = "log")) coef(es) ``` ## (Iercep) ## ##memb ## ##mem ##.8737 ##mem3 ## ##umac ##.3564 ##phogarua persoa de 3 a 64 años ## ##phogarua persoa de meos de 3 años ##.3857 ##phogaru adulo co ños meores de 6 años ## ##phogarparea s hos eedo al meos uo de los membros 65 años o más ## ## hos eedo los dos membros meos de 65 años ## ##phogarparea co u ho meor de 6 años ##.7 ##phogarparea co dos hos meores de 6 años ##.39 ##phogarparea co res o más hos meores de 6 años ## ##phogarpadre o madre solo, co al meos u ho de 6 o más años ## ##phogarparea co al meos u ho de 6 o más años ## ##phogaroros hogares ## ##suocuhogel suseador prcpal y el cóyuge ocupados, guo de los oros membros ocupados (s es que los hay) ## ##suocuhogel suseador prcpal o el cóyuge ocupado, oro de los membros ocupado 55

57 ## ##suocuhogel suseador prcpal o el cóyugeocupado, al meos oros dos membros ocupados ## ##suocuhogel suseador prcpal o el cóyugeocupado, guo de los oros membros ocupado (s es que los hay) ## ##suocuhogn el suseador prcpal su cóyuge ocupado, oro membro ocupado ##.6733 ##suocuhogn el suseador prcpal su cóyuge ocupados, al meos oros dos membros ocupados ## ##suocuhogngú ocupado e el hogar ## ## suachogel suseador prcpal y el cóyuge acvos, guo de los oros membros acvos (s es que los hay) ## ##suachogel suseador prcpal o el cóyuge acvo, oro de los membros ambé acvo ## ##suachogel suseador prcpal o el cóyuge acvo, al meos oros dos membros acvos ##.536 ##suachogel suseador prcpal o el cóyuge acvo, guo de los oros membros acvos (s es que los hay) ## ##suachogn el suseador prcpal su cóyuge acvos, oro membro acvo ## ##suachogn el suseador prcpal su cóyuge acvos, al meos oros dos membros acvos ## ##suachogngú acvo e el hogar ##.97 ##umoesu ## EL MODELO PROBABILÍSTICO LINEAL El modelo de probabldad leal se caracerza por eer la varable edógea dcoómca o bara, es decr oma el valor = s u deermado suceso ocurre y el valor = e caso coraro. Esos modelos esá muy exeddos e el aálss esadísco pero ecuera ua dfícl aplcacó e Ecoomía debdo a las dfculades de erpreacó ecoómca de los resulados que ofrece ese po de vesgacoes. A ese respeco, hay que cosderar que esos modelos lo que realmee vesga es la probabldad de que se dé ua opcó (valores =) o o se dé (=). A pesar del carácer dcoómco de la varable edógea, el modelo de probabldad leal se especfca de la forma habual, eedo presee que las varables exógeas o so dcoómcas so couas: 56

58 = + +e sedo =, N (4.) De acuerdo co la expresó (4.), el hecho de que la varable edógea ome valores dscreos ( ó ), el érmo de perurbacó e, puede omar ambé dos valores úcamee: S = e = - - co probabldad p. S = e = - - co probabldad (-p). Dado que la esperaza del érmo de error ha de ser ula E(e )=, eoces se demuesra que p= - - y (-p) = +, lo que perme evaluar la probabldad de que la varable edógea ome el valor correspodee: Prob ( =) = Prob (e = - - ) = p = - -. Prob ( =) = Prob (e = - - ) = (-p) = +. A su vez la varaza del érmo de perurbacó, se calcularía a parr de p: Var( e ) ( )( ) p ( p) Ua problemáca heree a los esmadores MCO de esos modelos, so los sguees: La perurbacó aleaora (e ) o sgue ua dsrbucó Normal. Es secllo observar ese hecho ya que el carácer baro ( ó ) de la varable edógea afeca a la dsrbucó de la perurbacó, eedo ésa ua dsrbucó Bomal 4. Ese problema se aeúa cuado se ulza amaños de muesra (N) grades e dode la dsrbucó Bomal es suscepble de aproxmarse a ua Normal. La perurbacó aleaora o ee ua varaza cosae (es heeroscedásca), lo cual supoe ua fala de efceca. Para solucoarlo habría que realzar rasformacoes que os dese ua perurbacó homocedásca; esa rasformacó cosse e mulplcar odas las varables por ua cera cadad que elme el problema de la heeroscedascdad. Dcha cadad es: ( )( ) sedo ˆ o y ˆ los esmacoes MCO del modelo. No obsae, el mayor problema que plaea esos modelos es que las predccoes realzadas sobre la varable edógea o sempre se ecuera e el ervalo [,], ya que puede ser mayores que cero y meores que uo. Ese problema ee dos solucoes, ua es omar como valor cero odas las esmacoes de la varable edógea co valores egavos, y uo cuado esas resule mayores que uo; la seguda, solucó es ulzar fucoes de dsrbucó que esé acoadas ere cero y uo como so la Logísca y la Normal; de ésas se derva los modelos Log y Prob que pasamos a ver a couacó. 4 La dsrbucó bomal se basa e ua prueba coocda como expermeo de Beroull o problema de las pruebas repedas, que cosse e averguar la probabldad de que e exraccoes o pruebas se haya cosegudo valores de y/o (-) valores de. 57

59 4.. EL MODELO LOGIT El problema que presea los modelos probablíscos leales e cuao a la exseca de predccoes esablecdas fuera rago (egavas o mayores que uo), es debdo a que ulza ua fucó de probabldad que depede lealmee de las varables explcavas (), que se resolvería acoado dcha dsrbucó de probabldad. El modelo Log e cocreo ulza, para ello, la fucó de dsrbucó logísca: Fgura 4.. Curva Logísca Debdo a que la fucó de dsrbucó logísca o ee forma leal, el modelo Log se esma de forma dferee, así e vez de mmzar las sumas de las dferecas al cuadrado ere los valores observados y los esmados por el modelo, el carácer o leal de los modelos Log requere la ulzacó del méodo de Máxma Verosmlud para ser esmado, maxmzado la verosmlud de que u suceso ega lugar, auque se podría esmar por MCO medae ua rasformacó logarímca de los daos (Guara, 997). La probabldad de que = (p) se defe ahora medae la sguee expresó: p z ( e ) dode Z = k k, sedo so los coefcees a esmar y es el vecor de varables depedees La probabldad de que = (-p) sería: p) ( e ( z ) E cosecueca, la razó ere ambas será gual a: p ( e ( p) ( e z ) z e z ) 58

60 Tomado el logarmo aural de la expresó aeror se obee Dode L es el deomado Log. p (4.) z L l l( e ) ( p ) Los coefcees dca el cambo e el Log causado por el cambo e ua udad e el valor de, meras que los e defe el cambo e la razó de probabldades p ( p) causado por el cambo e ua udad e el valor de. S es posvo, e será mayor que, es decr, p se cremeará; s es egavo, e ( p) será meor que, es decr, p ( p) dsmurá. Adcoalmee, puede demosrarse que el cambo e la probabldad (p) causado por el cambo e ua udad e el valor de es p, es decr, depede o sólo del ( p) coefcee, so ambé del vel de probabldad a parr del cual se mde el cambo. A la hora de esmar u modelo Log, hay que eer presee que para esmar el modelo además de los valores, se ecesa los valores del Log (L ). Por oro lado, señalar que la esmacó de los coefcees de modelo (4.) se realza ulzado el méodo de Máxma Verosmlud, es decr, elgedo como esmadores de los coefcees a aquellos que maxmza la fucó de verosmlud, cosruda sobre la base de p. Pero s z ( e ) eemos la posbldad de agrupar los daos dvduales, eoces podría esmarse el modelo por MCO. Eemplo 4.. E la base de daos daos defmos como pobres, aquellos hogares que ee u greso per cápa feror al 6% de la medaa. ```{r, echo=false} daos$gpc=daos$ecpf4.mpexac/daos$memb daos$pobre=felse(daos$gpc<.6*meda(daos$gpc),,) sr(daos) able(daos$pobre) ``` ## 'daa.frame': 46 obs. of 7 varables: ## $ memb : um ## $ mem : um... ## $ mem : um... ## $ mem : um... ## $ mem3 : um... ## $ umac : um... ## $ umac : um 3... ## $ umocu : um... ## $ umocu : um 3... ## $ umesu : um... 59

61 ## $ umoesu : um ## $ phogar : Facor w/ levels "Ua persoa de 65 o más años",..: ## $ suocuhog : Facor w/ 8 levels "El suseador prcpal y el cóyugeocupados, al meos oro de los membros ambé ocupado",..: NA NA ## $ suachog : Facor w/ 8 levels "El suseador prcpal y el cóyuge acvos, al meos oro de los membros ambé acvo",..: NA NA ## $ ecpf4.mpexac: um ## $ gpc : um ## $ pobre : um... ## ## ## Seleccoamos el meor modelo explcavo del greso per capa co regsubse por el méodo exhausvo (paso por paso): ```{r} regf.exh=regsubses(daos$gpc~.,daa=daos[,:5],mehod="exhaus ve") plo(regf.exh) coef(regf.exh,9) ``` ##(Iercep) ## ##memb ## ##mem 6

62 ## ##mem ## ##umac ##.446 ##umocu ## ##phogarparea co res o más hos meores de 6 años ## ##phogarpadre o madre solo, co al meos u ho de 6 o más años ## ##suocuhogel suseador prcpal y el cóyuge ocupados, guo de los oros membros ocupados (s es que los hay) ## ##suocuhogel suseador prcpal o el cóyugeocupado, al meos oros dos membros ocupados ## Esmamos u modelo log co glm ulzado las varables aes seleccoadas, y realzamos u coeo para ver los resulados obedos. ```{r} # Regreso logsca es3 <- glm(daos$pobre ~ memb + mem + umac + umocu + phogar + suocuhog, daa=daos,famly=bomal) es3.probs=predc(es3,ype="respose") es3.pred=felse(es3.probs>.5,,) able(es3.pred,es3$y) mea(es3.pred==es3$y) ``` ## ## es3.pred ## ## ## [].8585 El modelo predcvo acera e el 8% de los casos. 6

63 4.3. MODELO PROBIT Meras que el modelo Log ulza la fucó de dsrbucó logísca para acoar la dsrbucó de probabldad e el modelo de probabldad leal, el modelo Prob ulza la fucó de dsrbucó Normal. Fgura 4.. Fucó de desdad (zq.) y de dsrbucó (dcha.) de ua Normal (,) Las fucoes de dsrbucó ormal y logísca so muy semeaes: la dfereca prcpal es que la fucó de dsrbucó ormal se acerca más rápdamee a los ees que la logísca (fgura 4.3). Fgura Para eeder la flosofía del modelo Prob, vamos a supoer que exse ua varable descoocda s que cumple lo sguee: S I = + s eoces = S I = + <s eoces = Dado el supueso de ormaldad e u suceso, la probabldad de que ese sea meor o gual al valor (s), se calcula a parr de la fucó de dsrbucó acumulada de ua dsrbucó Normal esadarzada, eso es, co esperaza cero y desvacó ípca uo. p pr( ) o d pr( s) e (4.3) 6

64 Lo aeror equvale a que la relacó ere la edógea y las explcavas vega dada por la sguee expresó: y o du ( ) u e (4.4) Dode: ( + ) es la fucó de dsrbucó ormal u es el érmo de perurbacó que se dsrbuye como ua ormal N(, ). Dado que (4.4) es ua relacó o leal e los parámeros o puede esmarse por MCO. No obsae, hay ua forma seclla de asgar valores a las probabldades que aparece e la expresó (4.3). Esa forma cosse e obeer formacó acerca de I y de los parámeros a parr de la versa de (4.3): I p * I F F dode F - es la versa de la fucó de dsrbucó Normal. Dode I es egava sempre que p <.5; e la prácca se agrega el úmero 5 a I y a su resulado se le deoma Prob. Es decr, Prob=5+I Ahora, para esmar los parámeros se regresa: I * u El érmo de la perurbacó es o obsae heeroscedásco. Guara (999) sugere que se realce la rasformacó comeada e el caso del modelo Log, para que el modelo rasformado sea homocedásco. Eemplo 4.3 La esmacó e R del modelo prob esmado e el eemplo 4.3, se programa: ```{r,echo=false} # Regreso prob es4 <- glm(daos$pobre ~ memb + mem + umac + umocu + phogar + suocuhog, daa=daos,famly=bomal(lk=prob)) es4.probs=predc(es4,ype="respose") es4.pred=felse(es4.probs>.5,,) able(es4.pred,es4$y) mea(es4.pred==es4$y) ``` ## ## es4.pred ## ## 95 3 ## []

65 5. MODELOS CON DATOS DE PANEL 5.. INTRODUCCIÓN U modelo de daos de pael es, segú la defcó más exedda, u modelo que ulza muesras recogdas a dvduos a lo largo de saes de empo. Los modelos de daos de pael cluye así formacó de ua muesra de agees ecoómcos (dvduos, empresas, bacos, cudades, países, ec.) durae u período deermado de empo, combado, por ao, la dmesó emporal y esrucural de los daos. Los modelos de daos de pael se aplca a couos o bases de daos de seres de empo agregadas para los msmos dvduos; ésos couos de daos suele eer u úmero relavamee grade de dvduos y pocas observacoes e el empo, o por el coraro podemos eer daos para u úmero grade de perodos pero para u úmero pequeño de dvduos. U eemplo de ese po de bases de daos es el pael de hogares de la Uó Europea (7. hogares e la UE), las ecuesas de opoes empresarales del Msero de Idusra (3. empresas), los ídces Nelse (5. hogares e España) para medr la audeca elevsva, ec. Esos couos de daos que so coocdos como daos de pael o daos logudales hay que dferecarlos de las ecuesas rasversales que so repedas e el empo pero o a los msmos dvduos (por eemplo, la Ecuesa de Poblacó Acva) 5. El prcpal obevo que se persgue al agrupar y esudar los daos e pael es capurar la heerogeedad o observable ere los agees ecoómcos como ere perodos emporales. Dado que esa heerogeedad o se puede deecar exclusvamee co esudos de seres emporales, ampoco co esudos de core rasversal, hay que realzar u aálss más dámco corporado a los esudos de core rasversal la dmesó emporal de los daos. Esa modaldad de aalzar la formacó es muy usual e esudos de auraleza empresaral, ya que los efecos dvduales específcos de cada empresa y los efecos emporales del medo so deermaes cuado se rabaa co ese po de formacó. Los efecos dvduales específcos se defe como aquellos que afeca de maera desgual a cada uo de los agees de esudo coedos e la muesra (dvduos, empresas, bacos). Esos efecos so varables e el empo y se supoe que afeca de maera dreca a las decsoes que oma dchas udades. Usualmee, se defca ese po de efecos co cuesoes de capacdad empresaral, efceca operava, el saber-hacer (Kow-how), acceso a la ecología, ec. Por su pare, los efecos emporales so aquellos que afeca por gual a odas las udades dvduales del esudo y que, además, varía e el empo. Ese po de efecos suele asocarse, por eemplo, a shocks macroecoómcos que afeca por gual a odas las empresas o udades de esudo (ua subda de los pos de erés, u cremeo de los precos de la eergía, u aumeo de la flacó, ec.), o a cambos e la regulacó de mercados (amplacó de la Uó Europea, reduccó de arfas aracelaras, aumeo de la mposcó dreca, ec.). 5 E los paeles de daos a veces ambé hay que susur dvduos por fala de respuesa, pero o es el caso de las ecuesas rasversales e dode la muesra se reueva de forma ssemáca, de maera que a u perodo de empo deermado, por eemplo u año, los hogares de la muesra sea dferees a los del perodo aeror. La fala de respuesa e los daos de pael como e oro po de ecuesa a la hora de los aálss esadíscos debe de depurarse, be elmado odos los daos del dvduo co fala de respuesa o elmado úcamee los dvduos co fala de respuesa e cada varable aalzada. 64

66 5.. ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS DE PANEL La especfcacó geeral de u modelo de regresó co daos de pael es la sguee: K u dode =,...N se refere al dvduo o a la udad de esudo (core rasversal), =,...T a la dmesó e el empo, sería la varable a explcar correspodee a cada udad de esudo, es u escalar co N parámeros que recoge los efecos específcos del -ésmo dvduo, es u vecor de K parámeros que se asoca a las =,.K varables explcavas. A parr del modelo geeral, y co base e ceros supuesos y resrccoes acerca del valor de alguos de los parámeros, se derva las dferees varaes de modelos de daos de pael que resummos a couacó e la sguee abla. Tabla 5.. MODELOS ALTERNATIVOS PARA COMBINAR DATOS DE SERIES DE TIEMPO DE CORTE TRANSVERSAL TIPO DE MODELO EPRESIÓN CARACTERÍSTICAS Modelo Leal K e Modelo Esáco de Daos de Pael. Modelo Esáco de Daos de Pael de ua Vía (oe-way) (A) Modelo Esáco de Efecos Fos co varable dummy (los coefcees cosaes se esma a parr de varables cualavas) (B) Modelo Esáco de Daos de Pael de Doble Vía (wo-ways) (C) Modelo de Regresoes Apareemee No Relacoadas (SUR) 6 Modelo Dámco de Daos de Pael K K K e e e K K K, e e e es u vecor de varables cualavas y α es u vecor de coefcees cosaes. E u modelo de daos de pael, las varables explcavas puede ser de res pos: Ua varable por cada dvduo, s que exsa refereca emporal e dcha varable: las varables so las msmas para cada udad de core rasversal y se refere a arbuos del dvduo o agee, por eemplo, el po de empresa, su amaño, la forma gerecal; el sexo de u rabaador, el vel de formacó, la profesó y oras caraceríscas socales de los dvduos. Ua varable por perodo, pero s que exsa dferecas e el valor que oma la varable e cada dvduo: las varables oma dsos valores e cada perodo 6 Sglas de Seemgly Urelaed Regresso. 65

67 emporal pero o varía ere los dvduos. Como eemplo de ese po de varables cabe car a la asa de flacó, los pos de erés, ec. Ua varable que camba e el empo y por dvduo: se raa de varables que camba ere dvduos e u momeo del empo, y que además camba a lo largo del empo. Como eemplo de esas varables se puede mecoar los gresos oales, el vel de beefcos, el sock de capal o el vel de edeudameo, ere oras. Los modelos de daos de pael se erprea a ravés de sus compoees de error. Cosderado la oacó marcal abrevada de u modelo geeral de daos de pael: u ' El érmo de error u cludo e la ecuacó aeror, puede descompoerse de la sguee maera: u e dode represea los efecos o observables que dfere ere las udades de esudo pero o e el empo (capacdad empresaral, efceca de cada udad, ec. ); λ defca los efecos o cuafcables que varía e el empo pero o ere las udades de esudo; y e se refere al érmo de error puramee aleaoro. La mayoría de los aálss realzados co daos de pael ulza el modelo de compoee de error coocdo como oe way para el cual λ = (modelo A). Las dferees varaes para el modelo oe way de compoees de errores surge de los dsos supuesos que se hace acerca del érmo, pudédose presear res posbldades: El caso más secllo es el que cosdera ; es decr, la o exseca de heerogeedad o observable ere los dvduos o empresas. La seguda posbldad cosse e supoer a u efeco fo y dso para cada dvduo o empresa. E ese caso, la heerogeedad o observable se corpora a la cosae del modelo ( ). Falmee, la ercera alerava es raar a como ua varable aleaora o observable que varía ere dvduos/empresas pero o e el empo. Bao la prmera especfcacó, los sasface odos los supuesos del modelo leal geeral y, por ao, se emplea como méodo de esmacó MCO, obeedo esmadores leales e sesgados y co la veaa de gaar grados de lberad. Ahora be, e los casos e que se rechaza el supueso de homogeedad e u ssema de daos de pael, es decr, que exse heerogeedad o observable ya sea a ravés del empo, ere udades de esudo (dvduos) o e ambos sedos, debe buscarse ua especfcacó que la capure de forma apropada co el f de evar que los esmadores de los parámeros de las varables explcavas esé sesgados. 66

68 5.3. VENTAJAS DESVENTAJAS DE LOS MODELOS DE DATOS DE PANEL Los modelos de daos de pael presea ua sere de veaas y desveaas e comparacó co los modelos de seres emporales y de core rasversal. Las más relevaes so las sguees: Veaas La écca perme al vesgador ecoómco dspoer de u mayor úmero de observacoes, cremeado los grados de lberad, reducedo la mulcolealdad ere las varables explcavas y, e úlma saca, meorado la efceca de las esmacoes ecoomércas. Tal y como se mecoó aerormee, la écca perme capurar la heerogeedad o observable ya sea ere udades dvduales de esudo como e el empo. Co base e lo aeror, la écca de daos de pael perme aplcar ua sere de corases para cofrmar o rechazar dcha heerogeedad y deermar cómo capurarla. Los daos de pael supoe, e corpora al aálss, el hecho de que los dvduos o agees ecoómcos (cosumdores, empresas, regoes, países, ec. ) so heerogéeos. Los aálss de seres de empo y de core rasversal o corpora esa heerogeedad corredo así el resgo de obeer resulados sesgados. Perme esudar meor la dámca de los procesos de ause, ya que a ravés de ellos se puede aalzar los cambos e el empo de las dsrbucoes rasversales. Perme elaborar y probar modelos relavamee compleos de comporameo e comparacó co los aálss de seres emporales y de core rasversal. U eemplo claro de ese po de modelos es aquel que raa de medr veles de efceca écca por pare de udades ecoómcas dvduales. Falmee, pueso que las udades rasversales de u pael de daos ormalmee se refere a dvduos, famlas o empresas, se eva los sesgos que aparece cuado se rabaa co varables agregadas. Desveaas E érmos geerales, las desveaas asocadas a la écca de daos de pael se relacoa co los procesos para la obecó y el procesameo de la formacó esadísca sobre las udades dvduales de esudo; es decr cuado ésa se obee por medo de ecuesas, erevsas o ulzado algú oro medo de fereca esadísca de los daos. Eemplos de ese po de lmacoes so los problemas de seleccó o aleaora de la muesra, de recogda de daos co adecuadas asas de coberura de la poblacó, porceaes de o respuesa, preguas cofusas, dsorsó delberada de las respuesas, ec. Asmsmo, ua escasa dmesó emporal puede valdar alguo de los elemeos eórcos de los modelos de daos de pael. Por ulmo, alguas vesgacoes ha demosrado que la ulzacó de modelos de efecos fos produce resulados sgfcavamee dferees al los modelos co efecos aleaoros cuado se esma ua ecuacó usado ua muesra de muchas udades de 67

69 core rasversal co pocos perodos de empo (7 dvduos co 5 perodos, por eemplo) MODELO DE EFECTOS FIJOS Como ya se mecoó, los modelos de daos de pael perme coemplar la exseca de efecos dvduales específcos a cada udad, varables e el empo, que deerma la maera e que cada udad de core rasversal oma sus decsoes. Esos modelos asume que los efecos de las varables omdas, ya sea específcas a cada dvduo y/o que camba e el empo, o so mporaes e forma dvdual, pero sí e couo. Por oro lado, dado que el efeco de las varables omdas se supoe cosae e el empo para cada dvduo, o que o varía e odos los dvduos e u deermado momeo e el empo, o ua combacó de ambos, se puede capurar e el érmo cosae de u modelo de regresó como u promedo que oma e cuea explícamee la heerogeedad ere dvduos y/o e el empo coeda e los daos. Segú la forma de corporar la heerogeedad o observada, se puede dferecar los modelos de efecos fos y modelos de efecos aleaoros. Los modelos de efecos fos se cooce ambé como modelos mímos cuadrácos co varables fccas. Los modelos de daos de pael de efecos fos ee la sguee expresó geeral: K e dode es la varable depedee,, es u escalar que recoge los efecos específcos del ésmo dvduo y se supoe cosae e el empo, y, es el vecor de las k varables explcavas y, de los K parámeros que recoge los efecos de las varables explcavas; u es el érmo de error que se supoe aleaoros dsrbudos co meda cero y varaza cosae de valor u. El pael de daos correspode a =,..., N udades o dvduos de core rasversal, observados para los períodos =,..., T. Por ao, lo que se preede resolver es u ssema de regresoes específcas co N ecuacoes de core rasversal:... e y T observacoes. Su oacó marcal abrevada es: ' e Agrupado las observacoes emporales, para cada udad rasversal se llega al sguee modelo: ' e que e el supueso de ua úca varable explcava edría la sguee expresó: 68

70 69 NT T T N NT T T N N NT T T N e e e e e e Co ese modelo se cosdera que las varables explcavas afeca por gual a las udades de core rasversal y que ésas se dfereca por caraceríscas propas de cada ua de ellas, meddas por medo de la ercepcó e el orge. Es por ello que las N ercepcoes se asoca co varables dummy co coefcees específcos para cada udad, los cuales se debe esmar. La esmacó de y se realza por MCO, s be hay que eer presee que ese modelo presea ua pérdda mporae de grados de lberad. U es úl e ese po de modelos es realzar la prueba F, para comprobar s para cualquer. Por oro lado, cabe señalar que cuado se quera clur u érmo cosae hay que roducr úcamee N- varables fccas. Ora maera de plaear ese modelo es especfcádolo e desvacoes respeco a la meda, es decr, resado a cada varable la meda e el perodo para cada udad -esma. El esmador a ulzar e ese caso ee la sguee expresó: ' ' ˆ N T N T dode, so las medas muesrales del dvduo -ésmo. El esmador de la varaza de es: ˆ ˆ ' N T e Var dode ˆe es la varaza resdual, calculada como ' ˆu ee NT N K, dode e e es la suma de los resduos del modelo al cuadrado. E geeral, el esmador de mímos cuadrados ordaros (MCO) es apropado cuado los resduos so correlados e el empo y homocedáscos e los cores rasversales. Los efecos fos se esma e u segudo paso a ravés de la sguee ecuacó:

71 ˆ ' ˆ T ' ˆ El modelo aeror puede exederse al modelo de efecos fos de doble vía, e el que aparece ambé los efecos o observables emporales, al que: T ' u e Expresó que equvale a roducr dos couos de varables fccas, uas dvduales y oras emporales; e ese caso el esmador MCO edría las msmas propedades del modelo aeror. El esmador a ulzar edría la sguee expresó: N T N T ˆ ' ' dode,, so las medas muesrales del dvduo -ésmo,, las medas muesrales del perodo, y, las medas muesrales de las varables para odos los N dvduos y T perodos. Los efecos fos se esma e u segudo paso a ravés de las sguees relacoes: ˆ ˆ ' ˆ ' ˆ 5.5. MODELO DE EFECTOS ALEATORIOS A dfereca del modelo de efecos fos, el modelo de efecos aleaoros cosdera que los efecos dvduales o so depedees ere sí, so que esá dsrbudos aleaoramee alrededor de u valor dado. Ua prácca comú e el aálss de regresó es asumr que el gra úmero de facores que afeca al valor de la varable depedee pero que o ha sdo cludas explícamee como varables depedees del modelo, puede resumrse apropadamee e la perurbacó aleaora. Así, e ese modelo se cosdera que ao el mpaco de las varables explcavas como las caraceríscas propas de cada udad so dferees. El modelo de efecos aleaoros o modelo de compoees de la varaza asume que el érmo es la suma de ua cosae comú, ua varable aleaora específca de core rasversal e varae e el empo asocada a cada dvduo e correlada co el resduo e, y oro asocado al empo λ, ambé correlacoado co el resduo e. E lugar de raar como ua cosae fa, esa especfcacó asume que N(, ) depedee e gualmee dsrbuda, e correlada co e y. 7

72 A su vez el modelo ambé requere que esá correlado e el empo al que E(, s ), y además esá correlada co, e y. S supoemos que, la especfcacó del modelo eoces se covere e: u, u e La esmacó de ese modelo exge de la ulzacó de Mímos Cuadrados Geeralzados pues los resduos del modelo esá correlacoados ere sí al esar cludo ao e e como e e, para s. s El esmador apropado de ese modelo expresado e desvacoes a la meda es, por ao: ˆ MCG dode: N N N N ' ' Q ' Q ' T T Q I T e e' T T Geeralmee las varazas (varaza ere grupos) y u o so coocdas y, por ao, habrá que esmar u valor para. Para esmar dcho valor u camo sería ulzar las esmacoes de las varazas de los resduos obedas e la solucó MCO del modelo ELECCIÓN DE MODELO DE EFECTOS O EFECTOS ALEATORIOS La decsó acerca de la esrucura apropada para el aálss, es decr, efecos fos vs efecos aleaoros, depederá de los obevos que se persga. Así, Hausma (978) acosea ulzar el modelo de efecos fos para realzar ferecas sobre la muesra ulzada, meras que el de efecos aleaoros resula más úl para realzar ferecas sobre la poblacó. Adcoalmee, s el erés del esudo parcular esá pueso e los coefcees de las pedees de los parámeros, y o ao e las dferecas dvduales, se deberá elegr u méodo que relegue esas dferecas y rae la heerogeedad o observable como aleaora. El coexo de los daos, es decr, cómo fuero obedos y el eoro de dode provee, deerma ambé la eleccó del modelo. Co el modelo de efecos fos la heerogeedad o observable se corpora e la ordeada al orge del modelo y co el de efecos aleaoros, como ya se mecoó, se corpora e el érmo de error, modfcádose la varaza del modelo. Asmsmo, emplear u modelo de efecos fos o aleaoros geera dferecas e las esmacoes de los parámeros e los casos e que se cuea co T pequeño y N grade. E esos casos debe hacerse el uso más efcee de la formacó para esmar esa pare de la 7

73 relacó de comporameo coeda e las varables que dfere susacalmee de u dvduo a oro. E prcpo, el efoque de efecos fos es más aracvo, ya que o requere realzar supuesos paramércos sobre la dsrbucó codcoal de la heerogeedad observable. S embargo, su desveaa es que solo puede ulzarse e ceras dsrbucoes y requere hacer supuesos muy resrcvos sobre la dsrbucó del érmo de error como lo so las hpóess que exge el méodo MCO. A ese respeco hay que eer presee que el modelo de efecos fos asume la exseca de dferecas ere udades que se capura e forma de movmeos de la curva de regresó. (Fg. 5.). Fgura 5.. El modelo de efecos fos, s se esma ulzado varables dummy o defca drecamee la causa de la varacó e el empo y los dvduos, e mplca u alo cose formavo e érmos de grados de lberad. E cuyo caso debe realzarse alguas cosderacoes co respeco a la esrucura de los daos, dado que s N es grade y T pequeño, podría darse el caso e que el úmero de parámeros e el modelo de efecos fos sea muy grade e relacó co el úmero de daos dspobles, lo que daría lugar a parámeros poco sgfcavos y ua esmacó efcee. Para elegr ere los esmadores del modelo fo y aleaoro puede ulzarse el es de Hausma, que compara drecamee ambos esmadores. El corase se basa e el hecho de que bao la hpóess de que E el esmador del modelo de efecos aleaoros ˆ EA es asócamee más efcee que el esmador MCO del modelo de efecos fos ˆ EF ; s embargo, s E, el esmador MCO maedrá la cosseca, meras que el esmador MCG será sesgado e cossee. El esadísco propueso por Hausma es: ' m qˆ Var( qˆ) qˆ 7

74 dode qˆ ˆ ˆ EA EF, y la marz dagoal Var( qˆ) Var( ˆ ) ( ˆ EA Var EF ). Bao la hpóess ula H E el esadísco m se dsrbuye como ua varable k. Eemplo 5.. La lbrería plm ofrece recursos e R para esmar modelos daa pael. > sall.packages("plm") E esa lbrería eemos u couo de daos pael relavos a empresas para las que dspoemos de las sguees cfras: año, vesó brua, valor de la empresa y capal. El couo de daos es para el perodo de 935 a 954. > daa("grufeld", package="plm") > sr(grufeld) 'daa.frame': obs. of 5 varables: $ frm :... $ year : $ v : um $ value : um $ capal: um E el couo de daos los campos defcavos de las empresas y años debe de ser ídces. Para esmar u modelo de daa pael de efecos fos que relacoe la versó realzada por la empresa co su valor coable y su capal, se requere la sguee seeca R: > gru.fe <- plm(v~value+capal,daa=grufeld,model="wh") > summary(gru.fe) Oeway (dvdual) effec Wh Model Call: plm(formula = v ~ value + capal, daa = Grufeld, model = "wh") Balaced Pael: =, T=, N= Resduals : M. s Qu. Meda 3rd Qu. Max Coeffces : Esmae Sd. Error -value Pr(> ) value <.e-6 *** capal <.e-6 *** --- Sgf. codes: ***. **. *.5.. Toal Sum of Squares: 444 Resdual Sum of Squares: 5348 R-Squared : Ad. R-Squared :.775 F-sasc: 39.4 o ad 88 DF, p-value: <.e-6 Para esmar u modelo co efecos aleaoros: > gru.re <- plm(v~value+capal,daa=grufeld,model="radom") > summary(gru.re) Oeway (dvdual) effec Radom Effec Model (Swamy-Arora's rasformao) Call: plm(formula = v ~ value + capal, daa = Grufeld, model = "radom") 73

75 Balaced Pael: =, T=, N= Effecs: var sd.dev share dosycrac dvdual hea:.86 Resduals : M. s Qu. Meda 3rd Qu. Max Coeffces : Esmae Sd. Error -value Pr(> ) (Iercep) * value < e-6 *** capal < e-6 *** --- Sgf. codes: ***. **. *.5.. Toal Sum of Squares: 384 Resdual Sum of Squares: 5489 R-Squared :.7695 Ad. R-Squared : F-sasc: o ad 97 DF, p-value: <.e-6 Los efecos fos se exrae co la fuco fxef. > summary(fxef(gru.fe, ype = 'dmea')) Esmae Sd. Error -value Pr(> ) e- *** e-3 *** * e-5 *** ** * e-5 *** --- Sgf. codes: ***. **. *

76 6. MÉTODOS DE ESTIMACIÓN NO PARAMÉTRICOS 6.. INTRODUCCIÓN Se dce que se ausa el modelo paramérco cuado se esma sus parámeros a parr de u couo de observacoes que sgue dcho modelo, de maera que puede hacerse predccoes de uevos valores de coocdo el valor de, y eer formacó precsa acerca de la cerdumbre asocada a la esmacó y a la predccó. S embargo, s el modelo paramérco o es el adecuado al aálss de daos que esamos realzado, puede llevar a coclusoes que quede muy aleadas de la realdad, dado que el modelo paramérco colleva u grado de exacud e las afrmacoes que de él se derva y que so adecuadas sempre y cuado se cumpla los supuesos báscos sobre los que se apoya su cosruccó eórca. De hecho, los modelos paramércos presea ua esrucura eórca a rígda que o puede adaparse a muchos couos de daos de los que hoy día se dspoe para el aálss ecoómco. La ecoomería o paramérca aparece como cosecueca de eos por solucoar problemas que exse e la ecoomería paramérca como, por eemplo, la cosseca ere los daos y los prcpos de maxmzacó, homocedascdad, o la ecesdad de asumr ua deermada relacó, por lo geeral de forma leal ere las varables de erés. Esa preocupacó llevó a ua sere de vesgadores a ulzar formas fucoales flexbles para aproxmarse a relacoes descoocdas ere las varables. El plaear formas fucoales flexbles requere el coocmeo del valor esperado de la varable, codcoal e las oras,. Eso colleva la ecesdad de esmar la fucó de desdad de codcoal e. La ecoomería o paramérca o pare de supuesos sobre la dsrbucó de probabldad de las varables bao esudo, so que raa de esmar dcha dsrbucó para ecorar la meda codcoal y los momeos de orde superor (por eemplo, la varaza) de la varable de erés. Ua de las desveaas de ese méodo es, s embargo, la ecesdad de coar co muesras muy grades s es que se desea esmar la fucó de relacó ere ambas varables de maera precsa. Además el amaño de la muesra debe aumear cosderablemee coforme aumea el úmero de varables volucradas e la relacó. Los modelos de regresó paramércos supoe que los daos observados provee de varables aleaoras cuya dsrbucó es coocda, salvo por la preseca de alguos parámeros cuyo valor se descooce. y N, x, co Ese es u modelo esadísco co res parámeros descoocdos: ; y. Ua formulacó geeral de u modelo de regresó paramérco es la sguee: p y m( x ; ),,...,, Dode m( x ; ) es ua fucó coocda de x y de, que es descoocdo,... es ua varable aleaora décamee dsrbuda co E y V. El modelo de regresó leal smple sería u caso parcular co o, y m( x ; o, ) o x. Se supoe que se observa pares de daos x, y que provee del sguee modelo de regresó o paramérco: y m( ) x 75

77 Dode... E y V, y los valores de la varable explcava x...x so coocdos, por lo que se dce que el modelo ee dseño fo, y dado que la varaza de los errores es cosae el modelo es Homocedásco. es ua varable aleaora décamee dsrbuda co Cosderado, ua varable aleaora bvarae co desdad coua f x, y, cabe defr la fucó de regresó como m( x) E( / x), es decr el valor esperado de cuado oma el valor coocdo x. Eoces E( / ) m( ), y defedo m( ), se ee que: m( ), E( / ), V ( / ) Sea regresó o paramérco: m( ), =.,, =, ua muesra aleaora smple de,. Esos daos sgue el modelo de Ua vez esablecdo el modelo, el paso sguee cosse e esmarlo (o ausarlo) a parr de las observacoes dspobles. Es decr hay que cosrur u esmador mˆ ( x) de la fucó de regresó y u esmador ˆ de la varaza del error. Los procedmeos de esmacó de m(x) se cooce como méodos de suavzado. El abaco de éccas dspobles para esmar o paramércamee la fucó de regresó es amplísmo e cluye, ere oras, las sguees: Ause local de modelos paramércos. Se basa e hacer varos (o cluso fos, desde u puo de vsa eórco) auses paramércos eedo e cuea úcamee los daos cercaos al puo dode se desea esmar la fucó. Suavzado medae sples. Se plaea el problema de buscar la fucó m ˆ ( x) que mmza la suma de los cuadrados de los errores ( e ˆ y m( x ) ) más u érmo que pealza la fala de suavdad de las fucoes ( m ˆ ( x) ) caddaas (e érmos de la egral del cuadrado de su dervada seguda). Méodos basados e seres orogoales de fucoes. Se elge ua base oroormal del espaco vecoral de fucoes y se esma los coefcees del desarrollo e esa base de la fucó de regresó. Los auses por seres de Fourer y medae waveles so los dos efoques más ulzados. Téccas de apredzae supervsado. Las redes euroales, los k vecos más cercaos y los árboles de regresó se usa habualmee para esmar m (x). 6.. FUNCIÓN NÚCLEO Los hsogramas so sempre, por auraleza, fucoes dscouas; s embargo, e muchos casos es razoable supoer que la fucó de desdad de la varable que se esá esmado es coua. E ese sedo, los hsogramas so esmadores sasfacoros. Los hsogramas ampoco so adecuados para esmar las modas, a lo sumo, puede proporcoar ervalos modales", y al ser fucoes cosaes a rozos, su prmera dervada es cero e cas odo puo, lo que les hace compleamee adecuados para esmar la dervada de la fucó de desdad. Los esmadores de po úcleo (o kerel) fuero dseñados para superar esas dfculades. La dea orgal es basae agua y se remoa a los rabaos de Rosebla y Parze e los años 76

78 5 y prmeros 6. Los esmadores kerel so, s duda, los más ulzados y meor esudados e la eoría o paramérca. Dada ua m.a.s. del esmador... co desdad f, esmamos dcha desdad e u puo por medo fˆ h K h dode h es ua sucesó de parámeros de suavzado, llamados veaas o ampludes de bada (wdows, badwdhs) que debe eder a cero leamee" ( h, h ) para poder asegurar que fˆ ede a la verdadera desdad f de las varables y K es ua fucó que cumple K. Por eemplo: Núcleo gaussao e u Núcleo Epaechkov 7 3 u I u 4 dode I es la fucó que vale s u y s u u Núcleo Tragular u I u Núcleo Uforme I u Núcleo Bwegh 5 u I u 6 Núcleo Trwegh 35 u I u 3 Para elegr la veaa h puede segurse la sguee regla 8 7 Ora expresó alerava de la fucó úcleo de Epaechkov es: 3 u 4 5 I u 5 dode I u 5 es la fucó que vale s u 5 y s u Por lo geeral, los programas formácos elge el acho de veaa sguedo creros de opmzacó (error cuadráco medo). 77

79 h K 8 Dode 3 5 s es el amaño de la muesra s K K K u K Por eemplo: Eemplo 6. depede del úcleo K, y se calcula como: d d 5 S K es el úcleo gaussao, eoces K 4 S K es el úcleo Epaechkov, eoces 5 E R la esmacó de ua fucó de desdad kerel se realza co la fucó desy, co los daos del vecor x hay que realzar el sguee programa: > x <- c(.,.6,.9,4.5,.7,4.6,5.4,.9,5.4,.) K 5 > desy(x,kerel="epaechkov") Call: desy.defaul(x = x, kerel = "epaechkov") Daa: x ( obs.); Badwdh 'bw' =.65 M. x : M. y :. s Qu.:-.97 s Qu.:.366 Meda :.8 Mea :.8 Meda :.947 Mea :.86 3rd Qu.: rd Qu.:.545 Max. : Max. :.6948 > plo(desy(x,kerel="epaechkov")) 78

80 6.3. ESTIMADORES DE FUNCIÓN NÚCLEO POLINOMIOS LOCALES La alerava o paramérca a los modelos de regresó, supoe que m( ) e dode m es ua fucó que o se supoe cofada" dero de ua famla paramérca. Se raa de esmar m a parr de ua muesra, ;,. Los esmadores úcleo esablece que el peso de, e la esmacó de m es W (, ) K h h fˆ( ) dode K() es ua fucó de desdad smérca (por eemplo, la ormal esádar) y f ˆ( ) es u esmador kerel de la desdad como el defdo e el aparado aeror. W, ) es, para cada, ua fucó de poderacó que da mayor mporaca" a los valores ( de la varable auxlar que esá cercaos a. Ua expresó alerava para W, ) W (, ) K h K h ( 79

81 A parr de los pesos sguee: m a, b W a b W puede resolverse el problema de mímos cuadrados poderados los parámeros así obedos depede de, porque los pesos W ambé depede de, la reca de regresó localmee ausada alrededor de sería : l ( ) a( ) b( )( ) la esmacó de la fucó e el puo e dode mˆ ( ) l ( ) a( ) Las fucoes úcleo usadas e la esmacó o paramérca de la regresó so las msmas que e la desdad. S se geeralza al ause local de regresoes polómcas de mayor grado, es decr s preedemos esmar ua forma leal del po:... q q co la salvedad de que e vez del valor e la regresó leal múlple se ulza el valor. El esmador de polomos locales de grado q asgado los pesos W obedos medae la fucó úcleo se resuelve el sguee problema de regresó polómca poderada: m.. q W q... q ˆ Los parámeros ˆ depede del puo e dode se realza la esmacó, y el polomo ausado localmee alrededor de sería: P q, q ˆ Sedo m() el valor de dcho polomo esmado e el puo e dode : mˆ q Pq, ˆ o. E el caso parcular del ause de u polomo de grado cero, se obee el esmador de Nadaraya Waso, o esmador úcleo de la regresó: mˆ K ( ) K h W, K Defda la marz.... h q... q 8

82 defdos los vecores...,... pesos W,... q. Se calcula la marz de W W,.. W, W, Habría que esmar por mímos cuadrados geeralzados el modelo solucó es: ' ˆ ' ( ) W W Puede omar los pesos: K h W (, ) K h o W (, ) K h, cuya El esmador del parámero de suavzado h ee ua mporaca crucal e el aspeco y propedades del esmador de fucó de regresó. Valores pequeños de h da mayor flexbldad al esmador y le perme acercarse a odos los daos observados, pero orga alos errores de predccó (sobre-esmacó), valores mas alos de h ofrecerá u meor grado de auses a los daos pero predcca meor, pero s h es demasado elevado edremos ua fala de ause a los daos (sub-esmacó). Eemplo 6. Ulzado la base de daos cars de R, que coe las varables ds (dsaca de parada) y speed (velocdad), vamos a realzar la represeacó gráfca de la regresó kerel realzada co el esmador de Nadaraya Waso co dferees parámeros de suavzado. > daa(cars) > plo(cars$speed, cars$ds) > les(ksmooh(cars$speed, cars$ds, "ormal", badwdh = ), col = ) > les(ksmooh(cars$speed, cars$ds, "ormal", badwdh = 5), col = 3) 8

83 S la cadad de daos de que dspoemos lo perme, lo habual es obeer dos muesras ua para la esmacó del modelo (muesra de ereameo) y ora muesra para predecr (muesra de es). E ese caso ua medda de caldad del paramero h de suavzado es el error cuadráco medo de la poblacó de la muesra de es: ECMPes ( h) mˆ,, Dode,,,,..., es la muesra es y mˆ es el esmador o paramérco cosrudo co la muesra de ereameo. El valor h que mmce dcho error sería el parámero de suavzacó elegdo. S o de puede dspoer de ua muesra de es, la alerava cosse e sacar de la muesra cosecuvamee cada ua de las observacoes, y esmar el modelo co los resaes daos y predecr el dao ausee co el esmador obedo, para después calcular el error de predccó. Se cosruye eoces la sguee medda del error de predccó (valdacó cruzada) para cada h: ECMPCV ( h) mˆ Dode mˆ es el esmador obedo al exclur la observacó -esma. El valor h que mmce dcho error de valdacó cruzada sería el parámero de suavzacó elegdo. Teedo presee que el valor que predecmos ˆ o dea de ser ua combacó leal de los valores observados: ˆ ˆ ' ' W W S Sedo ombra s. Dado que: ECMP ' ' S W W, marz que se deoma de suavzado cuyo elemeo, se CV ( h) ˆ s 8

84 o es ecesaro ausar las regresoes o paramércas, so que vasa co evaluar odos los daos y aoar los valores de la dagoal prcpal de la marz S. Ua modfcacó de la fucó aeror (Valdacó cruzada geeralzada) perme obeer u esmador de la varaza de los errores del modelo: ˆ ECMP GCV ( h) v s Dode v TrazaS Eoces: ECMP GCV y ˆ h) v ( ˆ ˆ v 6.4. REGRESIÓN POR SPLINES Para poder esmar la fucó f de la forma más seclla posble, deberíamos poder represear f de forma que f ( x ) e, e,..., se covera e u modelo leal. eso se puede hacer elgedo ua base de fucoes de dmesó q que geere u subespaco de fucoes que cluya a f como elemeo y que pueda expresarse como: q f ( x) s x Sedo u parámero descoocdo, asocado al elemeo, s (x) de dcha base de fucoes. De maera que: q x s e, e,..., Se covere e u modelo leal de dmesó q. La regresó co fucoes base polómcas es la propuesa más seclla para ese po de esmacoes. Supogamos que f es u polomo de grado 4 de forma que el espaco de polomos de grado 4 coee a f. Ua base de ese subespaco es: s( x) s ( x) x s3( x) x 3 s4 ( x) x 4 s5 ( x) x Co lo que el modelo (.) se covere e: 83

85 84 e x x x x U sple es ua curva dferecable defda e porcoes medae polomos, que se ulza como bases de fucoes para aproxmar curvas co formas complcadas. Las bases de sples más populares: Bases de polomos rucados. Bases de sples cúbcos. Bases de B-sples. Bases de h plae sples. Ua fucó sple esá formada por varos polomos, cada uo defdo sobre u subervalo, que se ue ere sí obedecedo a ceras codcoes de coudad. Supogamos que se ha fado u eero q, de maera que dspoemos de q+ puos, a los que deomaremos odos, ales que q..., e los que roceamos uesro couo de. Decmos eoces que ua fucó sple de grado q co odos e q,...,, es ua fucó S que sasface las codcoes: () e cada ervalo,, S es u polomo de grado meor o gual a q. () S ee ua dervada de orde (q-) coua e o q,. Los sples de grado so fucoes cosaes por zoas. La expresó maemáca de u sple de grado es la sguee: q q q q o o x c x S x c x S x c x S x S, ) (.., ) (, ) ( ) ( E la fgura 6. se muesra las gráfcas correspodees a los sples de grado cero. Fgura 6.. Los sples de grado, se defe e u solo ramo de udo y squera es coua e los udos. Equvale a realzar ua regresó por ramos. q q o e x c x c x c...

86 85 sedo reso x c, U sple de grado o leal se puede defr por: q q q q q o o o x b x a x S x b x a x S x b x a x S x S, ) (.., ) (, ) ( ) ( La represeacó gráfca de u sple leal aparece e la fgura 6.: Fgura 6.. Las fucoes de sples más comúmee ulzadas so las de grado 3 ó cúbcas. So polomos de grado res a rozos, que so couos e los odos al gual que su prmera y seguda dervada, proporcoado u excelee ause a los puos abulados y a ravés de cálculo que o es excesvamee compleo. Sobre cada ervalo q q o,,...,,,,, S esá defdo por u polomo cúbco dferee. S el polomo cúbco que represea a b e el ervalo,, por ao: q q q q q q q o o o o o x d x c x b x a x S x d x c x b x a x S x d x c x b x a x S x S, ) (.., ) (, ) ( ) ( Los polomos S y S erpola el msmo valor e el puo, es decr, se cumple: x S y x S

87 por lo que se garaza que S es couo e odo el ervalo. Además, se supoe que S' y S'' so couas, codcó que se emplea e la deduccó de ua expresó para la fucó del sple cúbco. Aplcado las codcoes de coudad del sple S y de las dervadas prmera S' y seguda S'', es posble ecorar la expresó aalíca del sple. Ua de las bases de sples cúbcos más ulzadas basadas e q odos erores, x *,,..., q, es: So ( x) S ( x) S( x) x S ( x) R( x, x Sedo R( x, z) * ) z x x z x z 4 Co esa base de sples defmos f a ravés de u modelo leal co marz de regresores co flas y q columas cuya _esma fla es: * * * x, x, Rx, x,..., Rx x, x, R, k Los elemeos de ua base de sples cúbcos so polomos de grado 3. U Sple cúbco se represea e la fgura 6.3: Fgura 6.3. U ema mporae es la eleccó del grado de suavzacó del sple. Ua de las posbldades es a ravés del corase de hpóess, valorar la posbldad de ulzar uo o más odos. Pero lo acoseado es maeer fa la base de sples y corolar el grado de suavzacó añadedo ua pealzacó a la fucó obevo de mímos cuadrados: ' S Dode S es ua marz de orde q q co coefcees coocdos que depede de la base elegda y u parámero de suavzado. La solucó del modelo de regresó leal pealzado e dode la marz de regresores esá ahora defda por la base de sples y la pealzacó sería: ˆ peal ' S ' y El modelo de regresó leal co sples pealzados es equvalee al sguee modelo de regresó leal: 86

88 ' ' e ' E dode (,,...)' es u vecor de dmesó ( q), es decr el vecor segudo de aos ceros como odos se ha ulzado e la base de sples. La marz de regresores ' ee ahora orde ( q) q, sedo B ua marz que B cumple S B' B y que se obee a ravés de la descomposcó de Cholesky y el parámero de suavzado y e u vecor de ( q) errores aleaoros. El parámero de suavzacó,, es a pror descoocdo y hay que deermarlo, s es muy alo suavza los daos e exceso, u crero ulzado para elegr el parámero es del valor que mmza el esadísco geeral de valdacó cruzada: y ' S ' y' y ' S ' y v g raza I ' S ' La regresó por sples puede realzarse co múlples varables explcavas, s eemos ahora dos explcavas, x y z, y queremos esmar el sguee modelo advo: y f ( z ) e ( x ) f Represearíamos cada ua de esas dos fucoes a ravés de ua base de sples pealzados, que omado la base cúbca quedaría: q f ( x) x R x, x y f q ( z) z R z, Eemplo 6.3 z * * Paredo de la base de daos cars ulzada e el eemplo 6.4, la fucó R smooh.sple realza la regresó por sples ulzado ua base de splee cúbcos pealzados: > plo(speed, ds, ma = "daa(cars) & smoohg sples") > cars.spl <- smooh.sple(speed, ds) > cars.spl Call: smooh.sple(x = speed, y = ds) Smoohg Parameer spar=.7835 lambda=.6 ( eraos) Equvale Degrees of Freedom (Df): Pealzed Crero: GCV: E la fucó smooh.sple el parámero de suavzado es u valor geeralmee ere y, e ao que el coefcee que deoma se obee e el crero de acepacó (logarmo de verosmlud pealzado). E el eercco el programa elge u spar, S se desea u fucó meos suavzada habrá que elegr u parámero de suavzado más bao, e líea roa se represea e el gráfco la regresó por sples que se obedría co u parámero de suavzado de valor,. 87

89 > cars.spl <- smooh.sple(speed, ds,spar=.) > les(cars.spl, col = "blue") > les(cars.spl, col = "red") 6.5. APROIMACIÓN POR SERIES DE FOURIER La forma de Fourer perme aproxmar arbraramee cerca ao a la fucó como a sus dervadas sobre odo el domo de defcó de las msmas. La dea que subyace e ese po de aproxmacoes (que podría deomarse sem-o-paramércas) es amplar el orde de la base de expasó, cuado el amaño de la muesra aumea, hasa cosegur la covergeca asóca de la fucó aproxmae a la verdadera fucó geeradora de los daos y a sus dervadas (Galla, A.R.; 98, 984). U polomo de Fourer vee dado por la expresó: k a u coswo v swo Dode k es el úmero de cclos eórcos o armócos que cosderamos, sedo el máxmo /. w es la frecueca fudameal (ambé deomada frecueca agular fudameal). oma los valores eeros compreddos ere y (es decr, =,, 3,...). Los coefcees de los armócos vee dados por las expresoes: a y, u y cosw, v y swo La aproxmacó a ua fucó o peródca g(x) por ua sere de expasó de Fourer se escrbe como: g J x / a u cosx v s sx El vecor de parámeros es a, u v,...,, u J v J de logud K J. 88

90 Supoedo que los daos sguera el modelo por mímos cuadrados, mmzado s y g x / K y g( x ) e para =,,, esmaríamos Dado que la varable exógea x o esa expresada e forma peródca, debe de rasformase o ormalzarse e u ervalo de logud meor que,. Eemplo 6.5, E ese eemplo vamos a ulzar la base de daos de la Ageca Española de Meeorológca (Aeme) desde el R-package fda.usc. La base de daos coee medcoes daras de emperaura, velocdad del veo y precpacoes de 73 dferees esacoes meeorológcas de España para los años 98 a 9. E ese eemplo vamos a aalzar las emperauras medas daras de Saader que represeamos gráfcamee e R, co la sguee programacó: > lbrary(fda) > lbrary(fda.usc) > daa(aeme,package = "fda.usc") > = aeme$emp$argvals > emp = as.daa.frame(aeme$emp$daa,row.ames=f) > rage. = aeme$emp$rageval > v.emp = daa.frame((aeme$emp$daa)) # 365 x 73 marx > ames(v.emp) = aeme$df$ame > plo(s(v.emp[,]),ma="temperauras medas daras Saader 98-9") Temperauras medas daras Saader 98-9 s(v.emp[, ]) Tme A couacó se va a suavzar esas emperauras daras ulzado fucoes peródcas de Fourer, e cocreo vamos a ulzar las fucoes de base gual a 5. Es decr, los armócos que se obedría co: 89

91 5 u coswo v swo > Saader5 = creae.fourer.bass(rageval = rage(),bass = 5) > plo(saader5) La fucó: smooh.bass(argvals=:, y, fdparob), del R-package fda, dode argvals es el domo, y es el couo de valores a suavzar, y fdparob, la fucó base ulzada como regresores: > Saaderfourer5.fd = smooh.bass(argvals =, y = v.emp[,],fdparob = Saader5) > plo(s(v.emp[,]),ma="temperauras medas daras Saader 98-9") > les(saaderfourer5.fd,col="red") 9

92 Temperauras medas daras Saader 98-9 s(v.emp[, ]) Tme 9

93 7. REGRESIÓN EN EL DOMINIO DE LA FRECUENCIA 7.. INTRODUCCIÓN Nerlove (964) y Grager (969) fuero los prmeros vesgadores e aplcar el Aálss especral a las seres de empo e ecoomía. El uso del aálss especral requere u cambo e el modo de ver las seres ecoómcas, al pasar de la perspecva del empo al domo de la frecueca. El aálss especral pare de la suposcó de que cualquer sere, puede ser rasformada e cclos formados co seos u cóseos: f f x a cos b seo (7.) dode es la meda de la sere, a y b so su amplud, f so las frecuecas que del couo de las observacoes, es u ídce de empo que va de a N, sedo N el úmero de perodos para los cuales eemos observacoes e el couo de daos, el cocee f covere cada valor de e escala de empo e proporcoes de y rago desde N hasa sedo (es decr,,5 cclos por ervalo de empo). La dámca de las alas frecuecas (los valores más alos de f ) correspode a los cclos coros e ao que la dámca de la baas frecuecas (pequeños valores de f ) va a correspoder co los cclos f largos. S osoros hacemos que la ecuacó (7.) quedaría, así: x a cos b seo (7.) El aálss especral puede ulzarse para defcar y cuafcar e procesos apareemee a aperódcos, sucesoes de cclos de perodo de coro y largo plazo. Ua sere dada x puede coeer dversos cclos de dferees frecuecas y ampludes, y esa combacó de frecuecas y ampludes de carácer cíclco la hace aparecer como ua sere o peródca e rregular. De hecho la ecuacó (7.), muesra que cada observacó de ua sere de empo, es el resulado sumar los valores e que resula de N cclos de dferee logud y amplud, a los que habría que añadr s cabe u ermo de error. Realzar u aálss de Fourer a ua sere emporal de daos, equvale a esudar la varabldad de dcha sere e base a los cclos de dferees frecuecas a que da lugar: 4 p,,...,. La frecueca p recbe el ombre de armóco, p. los armócos p, puede expresarse de la sguee forma: a cos b seo R cos p p p p p p p dode R p a b y a p p p b a p p 9

94 La represeacó gráfca de R p I free recbe el ombre de perodograma de las 4 sere de daos. Ua edeca produce u pco e la represeacó gráfca del perodograma e la frecueca cero, meras que las varacoes esacoales procure "pcos" e las frecuecas esacoales y sus múlplos eeros, de maera que s u perdograma presea u "pco" e algua frecueca, preseará ambé "pcos" e las frecuecas,3, REGRESIÓN BAND SPECTRUM Haa (963) fue que propuso la regresó e domo de la frecueca (regresó bad specrum). Egle (974), demosró que dcha regresó o aleraba los supuesos báscos de la regresó clásca, cuyos esmadores era Esmadores Leales Isesgados y Ópmos (ELIO). E Egel (974) el perodograma de la explcava, x, es defdo como: f ˆ w x x k k sedo wk el vecor fla: k k ( T ) k wk, e, e,..., e dode k w k ; y =;; ;T-; k x sería el elemeo k-ésmo de la rasformada fa T T de Fourer del vecor columa de x. El cross-perodograma ere las seres x e fˆ w x w y xy k k k dode * es la complea cougada de la raspuesa. y El perodograma es u esmador sesgado del especro, s embargo es asócamee sesgado e cossee co la varaza de cada esmador especral a medda que la muesra ede a fo. Esa cosseca que oblgaría al uso de veaas e el perodograma co el f de obeer esmacoes del especro, o aula las propedades de la regresó realzada co el perodograma. Hacedo Se cumple que cóseos. WW ' I w w W w. w W ' W debdo a las orogoaldad de los producos de seos y obeedo el vecor ~ x como la rasformada de Fourer de x e T perodos, podemos rasformar el modelo de regresó múlple: y x u (7.3) E ~ y ~ x u~ 93

95 Se raa de ua regresó co varables aleaoras compleas pero que o afeca a los supuesos báscos del modelo de regresó clásco. Las propedades del error u ~ : S var( ~ ( ~~ u ) E uu ') E( Wuu' W ') WE( uu') W ' uww ' I, eoces var( u~ ) I. u Asumedo que x es depedee de u, el eorema de Gauss-Markov mplcaría que ~ x ~ ' x ~ x ' ~ y ˆ es u esmador ELIO co la sguee marz de varaza y covarazas: var( ˆ) u ( ~ x' ~ x ) El esmador mímo-cuadráco ˆ e érmos del perodograma se formularía: dode f ˆ xx k ˆ T k fˆ xx T fˆ es la marz de cross-perodogramas de cada frecueca e x cross-perodograma de e y. k k xy k fˆ xy k es el vecor del La rasformacó de los daos orgales del domo del empo al domo de la frecueca ulzado seres fas de seos y cóseos e la regresó bad specrum, se realza a ravés de la marz orogoal A, co el elemeo (,)h (Harvey, 978) : a, T T s cos,4,6,...,( T ) /( T ) T T T T ( ) 3,5,7,...,( T ) / T T De esa forma los problemas dervados del uso de la rasformada complea de Fourer puede ser eluddos. Asmsmo afrma que el vecor de resduos defdo e (7.3) da lugar a u vecor de resduos del modelo rasformado a ravés de A: y Auˆ vˆ A de forma que : (7.4) 94

96 p T p ˆ ˆ v v,,..., s T par T p ˆ ˆ v v,,..., s T mpar T p ˆ v, y T mpar po ˆ v Puede ser ulzado de forma cossee como esmador del perodograma deû. Al ser ˆ u esmador MCO de, puede ulzarse el es del perodograma acumulado de Durb (Durb, 969). Ta H.B ad Ashley R (999), señala que el procedmeo de elaboracó del crossperodograma cosa de res eapas:.- Trasformar los daos orgales del domo del empo al domo de la frecueca ulzado seres fas de seos y coseos. Implcaría premulplcar los daos orgales por ua marz orogoal, A, sugerda por Harvey (978)..- Permr la varacó de k a ravés de m badas de frecueca usado varables Dummy m ( D... D ). Esas varables se elabora a parr de submuesras de las T observacoes del s domo de frecuecas, de esa forma D ~ x k s la observacó esá e la bada de s frecuecas s y D, e el reso de los casos. Para obeer las submuesras propoe el sablogram es (Ashley, 984). 3.- Re-esmar el resulado del modelo de regresó e el domo del empo co las esmacoes... k y los coefcees de las m varables Dummy. Implcaría premulplcar la ecuacó de regresó amplada por las varables Dummy por la raspuesa de A. Eemplo 7. E la abla sguee se recoge las cfras de Cosumo de eergía fal elécrca (TEP) y del PIB e Mlloes de euros de España e el perodo 99 y 8. 95

97 Cosumo de Eergía Fal Elécrca (TEP) PIB (Mll euros año ) , , , , , , , , , , , , Fuee: INE La regresó Mímo Cuadráca e el domo del empo de ambas seres ofrece los sguees resulados: >y <- c(44,37,777,6,655,367,4,54,65,779,7759,8 96,9834,87,5,548) >x <- c(48458,479583,49,5545,5786,54884,5778,599966,6363,6535 5,679,69695,749,748,76985,797367) > summary(lm(y~x)) Call: lm(formula = y ~ x) Resduals: M Q Meda 3Q Max Coeffces: Esmae Sd. Error value Pr(> ) (Iercep) e e e- *** x 3.687e- 5.99e < e-6 *** --- Sgf. codes: ***. **. *.5.. Resdual sadard error: 4.6 o 4 degrees of freedom Mulple R-squared:.9964, Adused R-squared:.996 F-sasc: 388 o ad 4 DF, p-value: <.e-6 La rasformacó de los daos del domo del empo al domo de la frecueca se realza premulplcado los daos orgales por la marz orogoal A defda e (7.4). Para ello os auxlamos de la fucó gdf del package-r: descompoer. > lbrary(descompoer) > gdf(y) 96

98 [,] [,] [,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [,] [,] [,] [3,] [4,] [5,] [6,] -57. > gdf(x) [,] [,] [,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [,] [,] [,] [3,] [4,] [5,] -9.4 [6,] Creamos ua cosae de uos y la rasformamos al domo de la frecueca: > Cosae <- c(rep(,6)) > gdf(cosae) [,] [,] 4.e+ [,] e-6 [3,] e-6 [4,].e+ [5,] e-6 [6,] e-6 [7,] -.3e-6 [8,] e-5 [9,].3e-6 [,] e-6 [,] e-6 [,] e-5 [3,] -.3e-6 [4,].547e-5 [5,] -.547e-5 [6,].e+ La regresó MCO co los daos e el domo de la frecueca da el msmo resulado: > RBS <- lm(gdf(y)~+gdf(cosae)+ gdf(x))) > RBS 97

99 Call: lm(formula = gdf(y) ~ + gdf(cosae) + gdf(x)) Resduals: M Q Meda 3Q Max Coeffces: Esmae Sd. Error value Pr(> ) gdf(cosae) e e e- *** gdf(x) 3.687e- 5.99e < e-6 *** --- Sgf. codes: ***. **. *.5.. Resdual sadard error: 4.6 o 4 degrees of freedom Mulple R-squared:.9998, Adused R-squared:.9998 F-sasc: 3.77e+4 o ad 4 DF, p-value: <.e-6 Se crea ahora varables Dummys para separar alas frecuecas de las baas frecuecas. > D <- c(rep(,6),rep(,)) > D <- c(rep(,6),rep(,)) > D [] > D [] La sguee regresó e el domo de la frecueca perme observar los efecos de las alas y baas frecuecas e la regresó: > RBSD <- lm(gdf(y)~+gdf(cosae)+c(gdf(x)*d)+c(gdf(x)*d))) > RBSD Call: lm(formula = gdf(y) ~ + gdf(cosae) + c(gdf(x) * D) + c(gdf(x) * D)) Resduals: M Q Meda 3Q Max Coeffces: Esmae Sd. Error value Pr(> ) gdf(cosae) -6.9e e e- *** c(gdf(x) * D) 3.73e- 6.36e < e-6 *** c(gdf(x) * D) 3.54e-.363e e- *** --- Sgf. codes: ***. **. *.5.. Resdual sadard error: 36.3 o 3 degrees of freedom Mulple R-squared:.9998, Adused R-squared:.9998 F-sasc:.63e+4 o 3 ad 3 DF, p-value: <.e-6 La represeacó gráfca de los resulados obedos, requere rasformar los daos ausados e el domo de la frecueca a daos ausados e el domo ulzado la raspuesa de A, ese paso se realza co la fucó gd del package-r descompoer. > plo(s(y,99,frequecy = ),ma="cosumo de eerga elecrca e TEP 99-8",col=) > les (s(gd(rbs$fed.values),99,frequecy=),col=) 98

100 > les (s(gd(rbsd$fed.values),99,frequecy=),col=3) > leged("op", col=3,c("","esmado RBS","Esmado RBSD"),cex=.6,by="",fll=c(,,3)) 7.3. REGRESIÓN EN EL DOMINIO DE LA FRECUENCIA CON PARAMETROS DEPENDIENTES DEL TIEMPO El obevo es esmar u modelo de po u (7.5) dode es u vecor de T x observacoes de la varable depedee,, es u vecor de T x parámeros, e es u vecor de T x observacoes de la varable depedee y u es u vecor de T x errores de meda cero y varaza cosae, asumedo que las seres, e so rasformadas e seres de Fourer: y u u N y y a cos b s N a cos b s N u u a cos b s T Pre-mulplcado cada observacó de (7.5) por W se obee: (7.6) dode A T, A T, y T A. 99

101 El ssema (7.6) puede reescrbrse como: T T A I A AI A u (7.6) S deomamos, de los errores: ˆ Ae. e N N T e AI A u, se buscaría ua solucó que mmzara la suma cuadráca N Ua vez ecorada la solucó a dcha opmzacó se rasformaría las varables y parámeros al domo del empo para obeer el ssema (7.5). Para obeer ua solucó a la mmzacó de los errores e que ofrezca el msmo resulado que la regresó leal por mímos cuadrados ordaros, requere ulzar ua marz de regresores cuya prmera columa sería el vecor de amaño T (,,,...), la seguda columa T sería la prmera fla de la marz A I A y las columas, correspodería las flas de A I N A T N correspodees a las frecuecas de seos o cóseos que queremos regresar. Deomado a ueva esa marz de amaño N p,, dode p, sedo la frecuecas de seo y coseo elegdas como explcavas, los coefcees de la solucó MCO sería: ' ' y dode o, sería el parámero asocado a la cosae,, el asocado a la pedee, y, los asocados a las frecuecas de seos y cóseos elegdas. Eemplo 7. Ulzado los daos del eemplo 7. vamos a plaear la regresó e el domo de la T frecueca co parámeros depedees del empo. Para obeer la marz = A I A, se ulza la fucó cdf del package-r descompoer. Co el sguee chuk se obee la esmacó MCO: ```{r} a <- marx(y, row=) b <- marx(x, row=) cx <- cdf(b) C <- marx(c(,rep(,5)),row=) <- rbd(c,cx) <- as.marx([:,]) cy <- gdf(a) B <- solve(%*%())%*%(%*%cy) <- ()%*%B F <- gd() daa.frame(y,f,mco=lm(y~x)$fed.values) B ``` N

102 ## [,] [,] [,3] [,4] [,5] [,6] [,7] ## [,] ## [,] ## [,8] [,9] [,] [,] [,] [,3] [,4] ## [,] ## [,] ## [,5] [,6] ## [,].. ## [,] ## y F MCO ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## B ## [,] ## [,].67567e+4 ## [,] e Ua esmacó ulzado ahora como regresores además del PIB los cclos de baas frecuecas del PIB, se realzaría co el sguee chuk: ```{r} a <- marx(y, row=) b <- marx(x, row=) cx <- cdf(b) C <- marx(c(,rep(,5)),row=) <- rbd(c,cx) <- as.marx([:4,]) cy <- gdf(a) B <- solve(%*%())%*%(%*%cy) <- ()%*%B F <- gd() daa.frame(y,f,mco=lm(y~x)$fed.values)

103 B # Represeacoes gráfcas plo(s(y,99,frequecy = ),ma="cosumo de eerga elecrca e TEP 99-8",col=) les (s(f,99,frequecy=),col=) les (s(lm(y~x)$fed.values,99,frequecy=),col=3) leged("op", col=3,c("","esmado RBS","Esmado MCO"),cex=.6,by="",fll=c(,,3)) ``` ## [,] [,] [,3] [,4] [,5] [,6] ## [,] ## [,] ## [3,] ## [4,] ## [,7] [,8] [,9] [,] [,] [,] ## [,] ## [,] ## [3,] ## [4,] ## [,3] [,4] [,5] [,6] ## [,].... ## [,] ## [3,] ## [4,] ## y F MCO ## ## ## ## ## ## ## ## ## ## ## ## ## ##

104 ## ## B ## [,] ## [,].396e+4 ## [,].48679e ## [3,] e 4 ## [4,] 8.873e 4 Cosumo de eerga elecrca e TEP 99-8 s(y, 99, frequecy = ) Esmado RBS Esmado MCO Tme Co obeo de comprobar los resulados de la esmacó, se calcula el perodograma de eˆ A' e y su represeacó gráfca, a ravés de las sguees chuk R: a) Nveles de sgfcacó para el es de Durb (969): ```{r}. <- c(.4,.3544,.35477,.33435,.3556,.344,.899,.788,.6794,.5884,.57,.435,.3639,.3,.43,.895,.397,.933,.498,.89,.975,.9343,.9,.8677,.837,.877,.7799,.737,.4466,.435,.488,.455,.396,.38,,.55,.87,.87,.96,.96,.77,.835,.79,.79,.67,.67,.499 3

105 .5 <- c(.45,.4436,.48,.3975,.37359,.355,.3395,.3538,.,.63,.68,.94,.596,.83,.9985,.97,.947,.966,.895,.658,.59,.5769,.563,.5495,.5363,.535,.5,.4989,.487,.4754,.464,.453,.453,.436,.436,.4,.4,.396,.396,.378,.378,.3548,.3548,.3375,.3375,.38,.38,.348,.348,.894,.894,.745,.745,.6,.6,.464,.464,.37,.37,.97,.97,.7,.7,.949,.949,.83,.83,.76,.76,.64,.64,.496).5 <- c(.475,.5855,.467,.4464,.474,.445,.3894,.3697,.3577, ,.38,.996,.857,.7897,.77,.6685,.637,.56,.536,.4679,.445,.3835,.3445,.374,.7,.383,.6,.75,.457,.73,.9,.639,.337,.44,.99,.9684,.9465,.6748,.663,.648,.6355,.63,.63,.599,.599,.576,.576,.554,.554,.539,.539,.397,.397,.3756,.3756,.36,.36,.3468,.3468,.333,.333,.398. <- c(.49,.56667,.53456,.5495,.4769,.4544,.43337,.45,.399,.3848,.6866,.643,.6,.56,.57,.485,.45,.465,.3843,.3534,.337,.95,.676,.4,.54,.96,.667,.436,.,.859,.8385,.845,.845,.7973,.7973,.667,.667,.5978,.5978,.5795,.5795,.4533,.4533,.4396).5 <- c(.495,.59596,.579,.54,.5576,.48988,.467,.4489,.437,.457,.4,.847,.86,.758,.768,.677,.6393,.943,.753,.534,.337,.46,.96,.8534,.8534,.888,.888,.85,.85,.644,.644,.668,.668,.6,.6,.594, TesD <- daa.frame(.,.5,.5,.,.5) ``` b) Fucó para realzar el es de Durb Realza ua prueba esadísca para esudar la depedeca seral sobre el perodograma acumulado de la varable y, co ua sgfcacó de,(sgfcace=);,5(sgfcace=);,5(sgfcace=3);,(sgfcace=4) y,5 (sgfcace=5) (Durb; 969) ```{r} d <- fuco(y,sgfcace) { # Auhor: Fracsco Parra Rodríguez 4

106 # Some deas from: #Harvey, A.C. (978), Lear Regresso he Frequecy Doma, Ieraoal Ecoomc Revew, 9, # DURBIN, J., "Tess for Seral Correlao Regresso Aalyss based o he Perodogram ofleas-squares Resduals," Bomerka, 56, (No., 969), -5. # hp://ecoomera.wordpress.com/3/8//esmao-of-mevaryg-regresso-coeffces/ per <- perodograma(y) p <- as.umerc(per$desdad) <- legh(p) s <- p[] <- : for( :) {s <-p[]+s[(-)] s <- c(s,s) s <- s/s[] } whle ( > ) <- f (sgfcace==) c<- c(tesd[,]) else {f (sgfcace==) c <- c(tesd[,]) else {f (sgfcace==3) c <- c(tesd[,3]) else {f (sgfcace==4) c <- c(tesd[,4]) c <- c(tesd[,5])}}} m <- -c+(/legh(p)) max <- c+(/legh(p)) daa.frame(s,m,max) } ``` Fucó para presear gráfcamee los resulados de la prueba de Durb (Durb; 969): ```{r} gd <- fuco (y,sgfcace) { S <- d(y,sgfcace) plo(s(s), plo.ype="sgle", ly=:3,ma = "Tes Durb", ylab = "desdad acumulada", xlab="frecueca") } ``` > res <- -F > d(res,3) s m max > gd(res,3) 5

107 Tes Durb desdad acumulada frecueca 7.4. DESESTACIONALIZACIÓN A TRAVÉS DE LA REGRESIÓN DEPENDIENTE DE LA FRECUENCIA La regresó e el domo de la frecueca puede ulzarse para descompoer ua sere emporal e sus compoees de edeca, esacoaldad e rregular, de ua sere emporal y de frecueca b, o co b daos por ervalo de empo. Por eemplo, ua sere de frecueca 7 sería ua sere de daos daros, y el ervalo emporal la semaa, las frecuecas 4 y dcaría seres rmesrales y mesuales, e el perodo de empo de u año equvales. S la observacó se oma a ervalos de empo, eoces la frecueca agular es. La frecueca equvalee expresada e cclos por udad de empo es f. Cuado solo hay ua observacó por año, radaes por año o f cclos por año (u cclo por cada dos años), varacoes co ua osclacó de u año ee ua frecueca de radaes por año o f cclos por año. Por eemplo e ua sere mesual de daos, el cclo esacoal o las osclacoes que ocurre al cabo del año, ee ua frecueca de f 8, 33 cclos por cada daos. Ua sere mesual que complea 8 cclos, al ser su meor frecueca esacoal cclo por año, edrá u oal de 96 observacoes (8 cclos), y los múlplos eeros que ambé desacara e 3 su perodograma correspoderá a las frecuecas f,,,...; las osclacoes de 6

108 edeca o de baa frecueca, las que ocurre co u cclo feror al año correspoderá a las frecuecas f. Puede ulzarse (7.6) para esmar los coefcees de Fourer de la sere emporal T T AI A AI N A u o T T AI A AI N A u E (6.9) T W A I A S queremos regresar sobre los cuaro prmeros coefcees, eoces: Las W A I A * T..... prmeras flas de la marz A so ulzadas para esmar los coefcees de Fourer que correspode a los cclos de baas frecuecas, los cclos de edeca, y las flas y perme regresar sobre los coefcees de Fourer que da lugar a osclacoes de u cclo e cada año, los múlplos eeros de dcha frecueca y, el...debe de ser ulzados para obeer la frecueca esacoal y : Eemplo 7.3 Se realza u eercco de descompoer e edeca, esacoaldad e rregulardad por regresó e domo de frecueca co coefcees depedees del empo el IPI base 9 de Caabra e R. Ese procedmeo requere cargar la lbrería descompoer. > lbrary (descompoer) El ídce de precos dusrales de Caabra se represea e la fgura sguee. >daa(p) 7

109 La fucó descompoer, requere dcar la sere, la frecueca de la sere emporal, el po de ause,, s se quere realzar u ause ulzado (6.9) o s se desea realzar u ause ulzado (6.), y el umero de daos a proyecar. La sere de edeca y esacoaldad se deoma TDST y se obee realzado ua regresó e el domo de la frecueca, ere la sere y y el ídce emporal, e el que se flra las baas frecuecas y las frecuecas esacoes y sus múlplos absoluos. TD se calcula realzado ua regresó e el domo de la frecueca ere la sere y y el ídce emporal pero deado pasar solo las baas frecuecas. La sere esacoal ST es TD meos TDST, y la sere rregular IR resula de resar TDST de y (fgure 8). El ídce emporal se obee a ravés de u MCO ere el IPI y la líea de edeca,,3,..., '. >desc <- descompoer(p,,) > summary(desc) > summary(desc) Legh Class Mode daos 5 daa.frame ls regresorestd 4 daa.frame ls regresoresst daa.frame ls coefceestd 4 -oe- umerc coefceesst -oe- umerc plo(s(desc$daos,frequecy=)) Para realzar ua represeacó gráfca del perodograma de los resduos se voca la fucó gperodograma. > gperodograma(desc$daos$ir) 8

110 Para realzar u es sobre la aleaoredad de la sere rregular (IR) basado e el perodograma acumulados puede ulzarse la fucó cpgram. > cpgram(s(desc$daos$ir,frequecy=)) o aleravamee: > gd(desc$daos$ir,3) 9

111

112 8. MÉTODOS DE CLASIFICACIÓN 8.. INTRODUCCIÓN La clasfcacó supervsada es ua de las ares que más frecueemee so llevadas a cabo por los deomados Ssemas Ielgees. Por lo ao, u gra úmero de paradgmas desarrollados be por la Esadísca (Regresó Logísca, Aálss Dscrmae) o be por la Ielgeca Arfcal (Redes Neuroales, Iduccó de Reglas, Árboles de Decsó, Redes Bayesaas) so capaces de realzar las areas propas de la clasfcacó. A lo largo del curso se raara los méodos desarrollados por la esadísca: Aálss Dscrmae y Regresó Logísca y los K vecos próxmos, los Arboles de Decsó y las Máquas Sopore Vecor desarrollados por la Ielgeca Arfcal. Paso prevo a aplcar u méodo de clasfcacó, es la parcó del couo de daos e dos couos de daos más pequeños que será ulzadas co los sguees fes: ereameo y es 9. El subcouo de daos de ereameo es ulzado para esmar los parámeros del modelo y el subcouo de daos de es se emplea para comprobar el comporameo del modelo esmado. Cada regsro de la base de daos debe de aparecer e uo de los dos subcouos, y para dvdr el couo de daos e ambos subcouos, se ulza u procedmeo de muesreo: muesreo aleaoro smple o muesreo esrafcado. Lo deal es erear el modelo co u couo de daos depedee de los daos co los que realzamos el es. Como resulado de aplcar u méodo de clasfcacó, se comeerá dos errores, e el caso de ua varable bara que oma valores y, habrá ceros que se clasfque correcamee como uos y uos que se clasfque correcamee como ceros. A parr de ese recueo se puede cosrur el sguee cuadro de clasfcacó: ˆ ˆ ˆ Valor real de P P P P Dode P y P correspoderá a predccoes correcas (valores be predchos e el prmer caso y valores be predchos e el segudo caso), meras que P y P correspoderá a predccoes erróeas (valores mal predchos e el prmer caso y valores mal predchos e el segudo caso). A parr de esos valores se puede defr los ídces que aparece e el sguee cuadro: 9 Puede cosderarse res couos de daos: ereameo, valdacó y es. El couo de daos de valdacó se ulzaría e esos casos para ausar y/o seleccoar el meor modelo.

113 U méodo para evaluar clasfcadores aleravo a la mérca expuesa es la curva ROC (Recever Operag Characersc). La curva ROC es ua represeacó gráfca del redmeo del clasfcador que muesra la dsrbucó de las fraccoes de verdaderos posvos y de falsos posvos. La fraccó de verdaderos posvos se cooce como sesbldad, sería la probabldad de clasfcar correcamee a u dvduo cuyo esado real sea defdo como posvo. La especfcdad es la probabldad de clasfcar correcamee a u dvduo cuyo esado real sea clasfcado como egavo. Eso es gual a resar uo de la fraccó de falsos posvos. La curva ROC ambé es coocda como la represeacó de sesbldad free a (- especfcdad). Cada resulado de predccó represea u puo e el espaco ROC. El meor méodo posble de predccó se suaría e u puo e la esqua superor zquerda, o coordeada (,) del espaco ROC, represeado u % de sesbldad (gú falso egavo) y u % ambé de especfcdad (gú falso posvo). Ua clasfcacó oalmee aleaora daría u puo a lo largo de la líea dagoal, que se llama ambé líea de o-dscrmacó. E defva, se cosdera u modelo úl, cuado la curva ROC recorre la dagoal posva del gráfco. E ao que e u es perfeco, la curva ROC recorre los bordes zquerdo y superor del gráfco. La curva ROC perme comparar modelos a ravés del área bao su curva (fgura 8.):

114 Fgura º 8.. E R exse ua lbrería que ayuda a la represeacó de la curva ROC: el R-package ROCR. 8.. ANÁLISIS DISCRIMINANTE El Aálss Dscrmae (AD), roducdo por Fsher (936), es ua écca que se ulza para predecr la pereeca a u grupo (varable depedee) a parr de u couo de predcores (varables depedees). El obevo del AD es eeder las dferecas de los grupos y predecr la verosmlud de que ua persoa o u obeo pereezca a ua clase o grupo basádose e los valores que oma e los predcores. Eemplos de aálss dscrmae so dsgur ere ovadores y o ovadores de acuerdo a sus perfles demográfcos y socales o el resgo de mpago de u présamo a ravés de predcores ecoómcos y socodemográfcos. El aálss dscrmae es cocepualmee muy smlar al aálss de varaza mulvarae de u facor. El AD raa de esablecer ua relacó ere ua varable depedee o mérca (dcoómca o muldcoómca) y u couo de varables depedees mércas:... p El propóso del AD cosse e aprovechar la formacó coeda e las varables depedees para crear ua fucó Z combacó leal de las p explcavas, capaz de dferecar lo más posble a los k grupos. La combacó leal para el aálss dscrmae, fucó dscrmae, se formula: Z k... k k p pk dode, Z k es la puuacó Z dscrmae para el obeo k 3

115 o érmo cosae poderacó dscrmae para la varable depedee k varable depedee para el obeo k Ua vez hallada la fucó dscrmae, el resulado es ua úca puuacó Z dscrmae compuesa para cada dvduo e el aálss. Promedado las puuacoes dscrmaes para odos los dvduos dero de u grupo parcular, obeemos la meda del grupo. Esa meda es coocda como cerode. Cuado el aálss se realza co dos grupos eemos dos cerodes, s es co res sería res los cerodes, co k obeos edremos k cerodes. E el caso de dos grupos y dos predcores o varables explcavas, la fucó dscrmae es de la forma: Z k k k Susuyedo e la fucó dscrmae el valor de las medas del grupo e las varables y, obeemos el cerode del grupo : Z De gual modo, susuyedo las medas del grupo, obeemos el cerode del grupo : Z La fucó Z debe ser al que la dsaca ere los dos cerodes sea máxma, cosguedo de esa forma que los grupos esé lo más dsaes posble. Podemos expresar esa dsaca de la sguee maera: h Z Z Es mporae señalar que los grupos debe dferecarse de aemao e las varables depedees. El aálss busca dferecar los dos grupos al máxmo combado las varables depedees pero s los grupos o dfere e las varables depedees, o podrá ecorar ua dmesó e la que los grupos dfera (fgura 8.). Dcho de oro modo, s el solapameo ere los casos de ambos grupos es excesvo, los cerodes se ecorará e la msma o parecda ubcacó e el espaco p-dmesoal y e esas codcoes, o será posble ecorar ua fucó dscrmae úl para la clasfcacó. Es decr, s los cerodes esá muy próxmos, las medas de los grupos e la fucó dscrmae será a parecdas que o será posble dsgur a los sueos de uo y oro grupo. 4

116 Fgura º 8.. La mayor uldad de ua fucó dscrmae radca e su capacdad para clasfcar uevos casos. Ahora be, la clasfcacó de casos es algo muy dso de la esmacó de la fucó dscrmae. De hecho, ua fucó perfecamee esmada puede eer ua pobre capacdad clasfcaora. Ua vez obeda la fucó dscrmae podemos ulzarla, e prmer lugar, para efecuar ua clasfcacó de los msmos casos ulzados para obeer la fucó: eso permrá comprobar el grado de efcaca la fucó desde el puo de vsa de la clasfcacó. S los resulados so sasfacoros, la fucó dscrmae podrá ulzarse, e segudo lugar, para clasfcar fuuros casos de los que, coocedo su puuacó e las varables depedees, se descoozca el grupo al que pereece. Ua maera de clasfcar los casos cosse e calcular la dsaca exsee ere los cerodes Z Z de ambos grupos y suar u puo de core z equdsae de ambos cerodes. A parr de ese momeo, los casos cuyas puuacoes dscrmaes sea mayores que el puo de core z será asgados al grupo superor y los casos cuyas puuacoes dscrmaes sea meores que el puo de core z será asgados al grupo feror. La regla de clasfcacó descra sólo perme dsgur ere dos grupos, co lo que es dfíclmee aplcable al caso de más de dos grupos e cluso a dos grupos co dso amaño, co amaños desguales es preferble ulzar ua regla de clasfcacó que desplace el puo de core haca el cerode del grupo de meor amaño buscado gualar los errores de clasfcacó. Para calcular ese puo de core se ulza ua dsaca poderada : Z Z z El AD solo adme varables cuaavas como regresores, por lo que s algua de las varables depedees es caegórca, hay que ulzar oros méodos aleravos de clasfcacó. Fukuaga y Kessell (973) ha propueso ua regla de clasfcacó basada e la eoría bayesaa. Esa ora regla perme corporar fáclmee la formacó relava al amaño de los grupos y, además, es exesble al caso de más de dos grupos. 5

117 Eemplo 8. Para realzar ua mería de daos co la clasfcacó de famlas co rea feror al 6% de la medaa a parr de las explcavas seleccoadas e el Eemplo 4., para ello se va a dvdr la ecuesa e dos muesras ua de ereameo co el 7% de los daos y ua muesra es co el 3% resae, a f de o eer problemas e los cálculos co los daos ausees se va a elaborar u daa frame e dode se omrá los NA s. La fucó R que realza el Aálss Dscrmae Leal es lda. Para los 5 prmeros daos, se da los resulados de la clasfcacó (class), las probabldades poserores de pereecer a la clase cero (poseror.) o de pereecer a la clase (poseror.), la probabldad poseror es la probabldad codcoal que es asgada después de que la evdeca es omada e cuea. Evaluaremos los resulados co ua mérca de porceae de aceros y la curva ROC. ```{r} daos<-a.om(daos) explcavas <- daa.frame(daos$memb,daos$mem,daos$mem,daos$umac,daos$umocu) #modelo x=explcavas y=daos$pobre # dvsó de la muesra e ereameo y valdaco ra=sample(seq(legh(y)),legh(y)*.7,replace=false) # Leal Dscrma Aalsys lda.r=lda(y[ra]~.,daa=x[ra,]) #predccó probs=predc(lda.r,ewdaa=x[-ra,],ype="prob") daa.frame(probs)[:5,] able(probs$class,y[-ra]) mea(probs$class==y[-ra]) #porceae de be clasfcados #gráfca curva ROC lbrary(rocr) predc.rocr <- predco (probs$poseror[,],y[-ra]) perf.rocr <- performace(predc.rocr,"pr","fpr") #True y False posve.rae auc <- as.umerc(performace(predc.rocr,"auc")@y.values) plo(perf.rocr,ype='o', ma = pase('area Bao la Curva =',roud(auc,))) able(a=, b= ) ``` ## class poseror. poseror. LD ## ## ## ## ## ## ## 6

118 ## ## ## [] REGRESIÓN LOGÍSTICA La Regresó Logísca es u méodo ause esadísco cuyo obevo es obeer ua relacó fucoal ere ua rasformacó -de ua varable cualava- llamada log y p varables predcoras que puede ser cuaavas o cualavas (aparado 4.). La caracerísca fudameal de esa regresó es que la varable depedee es dcoómca. S la varable dcoómca a predecr es y las p varables predcoras so,..., p, el obevo es deermar los coefcees,,..., p para sasfacer la fórmula de rasformacó de la varable log: L p z l l( e )... ( p ) p p La esmacó de los coefcees es realzada a ravés del méodo de máxma verosmlud. Esos coefcees so erpreados e érmos de odd-raos, y la seleccó de varables puede realzarse medae res méodos: forward, backward o sepwse. El méodo sepwse es el más comúmee ulzado (aparado.5). E el caso de ua varable explcava dcoómca, el modelo ee ua formulacó equvalee dada por: 7

119 p ( e ( o... p p ) De maera que el modelo se usa para clasfcar uevos dvduos a parr de reglas de la sguee forma: S p c el dvduo es clasfcado como, y e caso coraro es clasfcado como. Geeralmee, el valor que se asga a c para deermar s el valor de la predccó es gual a o a es de,5, pueso que parece lógco que la predccó sea cuado el modelo dce que es más probable obeer u que u. S embargo, la eleccó de u umbral gual a,5 o sempre es la meor alerava. E el caso e que la muesra presee desequlbros ere el úmero de uos y el de ceros la eleccó de u umbral gual a,5 podría coducr a o predecr gú uo o gú cero. El modo de resolver ese problema es omar u umbral más pequeño. Eemplo 8.. Paredo del modelo esmado e el Eemplo 4., vamos a realzar ua mería de daos, dvdedo la ecuesa e dos muesras ua de ereameo co el 7% de los daos y ua muesra es co el 3% resae, a f de o eer problemas de cálculo co los daos ausees se va a elaborar u daa frame e dode se omrá los NA s. Evaluaremos los resulados co ua mérca de porceae de aceros y la curva ROC. El chuk que se va a eecuar es el sguee: # Seleccó de varables daos=a.om(daos) explcavas <- daa.frame(daos$memb,daos$mem,daos$mem,daos$umac,daos$umocu,daos$phogar,daos$suocuhog) x=explcavas y=daos$pobre # dvsó de la muesra e ereameo y valdaco ra=sample(seq(legh(y)),legh(y)*.7,replace=false) # Esmacó de modelo prob glm.r=glm(y[ra]~.,daa=x[ra,],famly=bomal) #predccó probs=predc.glm(glm.r,ewdaa=x[-ra,],ype="respose") pred=felse(probs>.5,,) able(pred,y[-ra]) mea(pred==y[-ra]) #gráfca curva ROC lbrary(rocr) predc.rocr <- predco (probs,y[-ra]) perf.rocr <- performace(predc.rocr,"pr","fpr") #True y Tasa de falsos posvos 8

120 auc <- plo(perf.rocr,ype='o', ma = pase('area Bao la Curva =',roud(auc,))) able(a=, b= ) ``` Los resulados obedos: ## ## pred ## ## ## [] ALGORITMO K-VECINOS MÁS CERCANOS El méodo K- (K eares eghbors Fx y Hodges, 95) es u méodo de clasfcacó supervsada (Apredzae, esmacó basada e u couo de ereameo y proopos) que srve para esmar la fucó de desdad F ( x / C ) de las predcoras x por cada clase C. Ese es u méodo de clasfcacó o paramérco, que esma el valor de la fucó de desdad de probabldad o drecamee la probabldad a poseror de que u elemeo x pereezca a la clase C a parr de la formacó proporcoada por el couo de proopos o eemplos. E el proceso de apredzae o se hace gua suposcó acerca de la dsrbucó de las varables predcoras. 9

121 Fgura º 8.3 E la fgura º 8.3 se lusra el fucoameo de ese méodo de clasfcacó. E la fgura se ecuera represeadas muesras pereecees a dos clases dsas: la Clase esá formada por 6 cuadrados de color azul y la Clase formada por 6 círculos de color roo. E ese eemplo, se ha seleccoado res vecos, es decr, (k=3). De los 3 vecos más cercaos a la muesra x, represeada e la fgura por u aspa, uo de ellos pereece a la Clase y los oros dos a la Clase. Por ao, la regla 3- asgará la muesra x a la Clase. Es mporae señalar que s se hubese ulzado como regla de clasfcacó k=, la -, la muesra x sería asgada a la Clase, pues el veco más cercao de la muesra x pereece a la Clase. U eemplo de ereameo, x, es u vecor e u espaco caracerísco muldmesoal, que esá descro e érmos de p arbuos, y pereecerá a ua de las q clases de la clasfcacó. Los valores de los arbuos del -esmo eemplo se represea por el vecor p - dmesoal: x x x x,...,, p El espaco es parcoado e regoes por localzacoes y equeas de clases de los eemplos de ereameo. U puo e el espaco es asgado a la clase C s esa es la clase más frecuee ere los k eemplos de ereameo más cercao. Geeralmee se usa la dsaca eucldaa. d( x, x ) p xr xr r La fase de ereameo del algormo cosse e almacear los vecores caraceríscos y las equeas de las clases de los eemplos de ereameo. E la fase de es, la evaluacó del eemplo (del que o se cooce su clase) es represeada por u vecor e el espaco caracerísco. Se calcula la dsaca ere los vecores almaceados y el uevo vecor, y se seleccoa los k eemplos más cercaos. El uevo eemplo es clasfcado co la clase que más se repe e los vecores seleccoados. El méodo k- supoe que los vecos más cercaos os da la meor clasfcacó y eso se hace ulzado odos los arbuos; el problema de dcha suposcó es que es posble que se

122 ega muchos arbuos rrelevaes que dome sobre la clasfcacó, de maera que los arbuos relevaes perdería peso ere oros vee rrelevaes. La meor eleccó de k depede fudamealmee de los daos; geeralmee, valores grades de k reduce el efeco de rudo e la clasfcacó, pero crea límes ere clases parecdas. U bue k puede ser seleccoado medae u procedmeo de opmzacó. El caso especal e que la clase es predcha para ser la clase más cercaa al eemplo de ereameo (cuado k=) es llamada Neares Neghbor Algorhm, Algormo del veco más cercao. Eemplo 8. Paredo del modelo esmado e el Eemplo 4., vamos a realzar ua mería de daos, dvdedo la ecuesa e dos muesras ua de ereameo co el 7% de los daos y ua muesra es co el 3% resae, se va a realzar el proceso co el prmer veco próxmo k= (Neares Neghbor Algorhm), para ello hay que salar el package-r class, e vocar la fucó k, dero de esa lbrería la fucó k perme elegr el umero de vecos a aproxmar, e esá fucó odas las covarables ha de ser umércas por lo que las varables clasfcaoras de pos de hogares y suacó de ocupacó de hogares so rasformadas a umércas. Evaluaremos los resulados co ua mérca de porceae de aceros. ```{r} lbrary(class) # Seleccó de varables explcavas <- daa.frame(daos$memb,daos$mem,daos$mem,daos$umac,daos$umocu) x=explcavas y=daos$pobre # K-Neares Neghbors Pobre=as.facor(y) ra=sample(seq(legh(y)),legh(y)*.7,replace=false) k.prd=k(x[ra,:5],x[-ra,:5],pobre[ra]) able(k.prd,pobre[-ra]) ``` Los resulados obedos: k.prd ## ## ÁRBOLES DE CLASIFICACIÓN Los árboles de decsó o clasfcacó ampoco so modelos esadíscos basados e la esmacó de los parámeros de la ecuacó propuesa, por ao, o eemos que esmar u modelo esadísco formal, so algormos para clasfcar ulzado parcoes sucesvas. So apropados cuado hay u úmero elevado de daos, sedo ua de sus veaas su carácer descrpvo que perme eeder e erprear fáclmee las decsoes omadas por el modelo, revelado formas compleas e la esrucura de daos que o se puede deecar co los méodos covecoales de regresó. Los árboles de decsó o de clasfcacó so u modelo surgdo e el ámbo del apredzae auomáco (Mache Learg) y de la Ielgeca Arfcal que paredo de ua base de daos, crea dagramas de cosruccoes lógcas que os ayuda a resolver problemas. A esa

123 écca ambé se la deoma segmeacó erárquca. Es ua écca explcava y descomposcoal que ulza u proceso de dvsó secuecal, eravo y descedee que paredo de ua varable depedee, forma grupos homogéeos defdos específcamee medae combacoes de varables depedees e las que se cluye la oaldad de los casos recogdos e la muesra. Supoemos que se dspoe de ua muesra de ereameo que cluye la formacó del grupo al que pereece cada caso y que srve para cosrur el crero de clasfcacó. Se comeza co u odo cal y os preguamos cómo dvdr el couo de daos dspobles e dos pares más homogéeas ulzado ua de las varables. Esa varable se escoge de modo que la parcó de daos se haga e dos couos lo más homogéeos posbles. Se elge, por eemplo, la varable x y se deerma u puo de core, por eemplo c, de modo que se pueda separar los daos e dos couos: aquellos co x c y los que ee x c. De ese odo cal saldrá ahora dos: uo al que llega las observacoes co x c y oro al que llega las observacoes co x c. E cada uo de esos odos se vuelve a reper el proceso de seleccoar ua varable y u puo de core para dvdr la muesra e dos pares más homogéeas. El proceso erma cuado se haya clasfcado odas las observacoes correcamee e su grupo. E los árboles de decsó se ecuera los sguees compoees: odos, ramas y hoas. Los odos so las varables de erada, las ramas represea los posbles valores de las varables de erada y las hoas so los posbles valores de la varable de salda. Como prmer elemeo de u árbol de decsó eemos el odo raíz que va a represear la varable de mayor relevaca e el proceso de clasfcacó. Todos los algormos de apredzae de los árboles de decsó obee modelos más o meos compleos y cossees respeco a la evdeca, pero s los daos coee coherecas, el modelo se ausará a esas coherecas y perudcará su comporameo global e la predccó, es lo que se cooce como sobreause. Para solucoar ese problema hay que lmar el crecmeo del árbol modfcado los algormos de apredzae para cosegur modelos más geerales. Es lo que se cooce como poda e los árboles de decsó. Fgura 8.3 Arbol de decsó y eemplo de poda. Las reglas de parada raa de preguar s merece la pea segur o deeer el proceso de crecmeo del árbol por la rama acual, se deoma reglas de prepoda ya que reduce el crecmeo y compledad del árbol meras se esá cosruyedo:

124 Pureza de odo. S el odo solo coee eemplos o regsros de ua úca clase se decde que la cosruccó del árbol ya ha falzado. Coa de profuddad. Prevamee a la cosruccó se fa ua coa que os marque la profuddad del árbol, cuado se alcaza se deee el proceso. Umbral de sopore. Se especfca u úmero de eemplos mímo para los odos, y cuado se ecuere u odo co eemplos por debao del mímo se para el proceso, ya que o cosderamos fable ua clasfcacó abalada co meos de ese úmero mímo de eemplos. Exse dos formas de poda muy comues ulzadas e los dferees algormos: la poda por cose-compledad y la poda pesmsa. E la poda por cose-compledad se raa de equlbrar la precsó y el amaño del árbol. La compledad esá deermada por el úmero de hoas que posee el árbol (odos ermales). La poda pesmsa ulza los casos clasfcados correcamee y obee u error de susucó, elmado los subárboles que o meora sgfcavamee la precsó del clasfcador. Para cosrur u árbol hay que omar las sguees decsoes: Seleccoar las varables y sus puos de core para hacer las dvsoes. Cuádo se cosdera que u odo es ermal y cuádo se coúa dvdedo. La asgacó de las clases a los odos ermales. Eemplo 8.3 Paredo del modelo esmado e el Eemplo 4., vamos a realzar ua mería de daos, dvdedo la ecuesa e dos muesras ua de ereameo co el 7% de los daos y ua muesra es co el 3% resae, se va ha realzar la clasfcacó ulzado arboles de decsó, para ello hay que salar el package-r: ree, e vocar la fucó ree. Se realza ua poda por el procedmeo de cose-compledad, y medae u procedmeo de valdacó cruzada elegrá el meor resulado. Para ello hay que vocar la fucó cv.ree co la opcó FUN=prue.msclas. Evaluaremos los resulados co ua mérca de porceae de aceros. requre(ree) # Seleccó de varables explcavas <- daa.frame(daos$memb,daos$mem,daos$mem,daos$umac,daos$umocu,daos$phogar,daos$suocuhog) y=as.facor(daos$pobre) daos3 <- daa.frame(explcavas,y) # dvsó de la muesra e ereameo y valdaco ra=sample(seq(legh(y)),legh(y)*.7,replace=false) Pobreza.ree = ree(y~.,daos3,subse=ra) summary(pobreza.ree) plo(pobreza.ree);ex(pobreza.ree,prey=) Pobreza.ree ree.pred=predc(pobreza.ree,daos3[-ra,],ype="class") summary(ree.pred) wh(daos3[-ra,],able(ree.pred,y)) # Medae valdacó cruzada se busca el meor arbol de decso cv.pobreza=cv.ree(pobreza.ree,fun=prue.msclass) 3

125 cv.pobreza plo(cv.pobreza) prue.pobreza=prue.msclass(pobreza.ree,bes=5) plo(prue.pobreza);ex(pobreza.ree,prey=) ree.pred=predc(prue.pobreza,daos3[-ra,],ype="class") wh(daos3[-ra,],able(ree.pred,y)) ``` ## ## Classfcao ree: ## ree(formula = y ~., daa = daos3, subse = ra) ## Varables acually used ree cosruco: ## [] "daos.suocuhog" "daos.memb" ## Number of ermal odes: 5 ## Resdual mea devace:.8397 = 44 / 43 ## Msclassfcao error rae:.939 = 4 / 439 ## ode), spl,, devace, yval, (yprob) ## * deoes ermal ode ## ## ) roo ( ) ## ) daos.suocuhog: El suseador prcpal y el cóyugeocupados, al meos oro de los membros ambé ocupado,el suseador prcpal y el cóyuge ocupados, guo de los oros membros ocupados (s es que los hay),el suseador prcpal o el cóyugeocupado, al meos oros dos membros ocupados,n el suseador prcpal su cóyuge ocupados, al meos oros dos membros ocupados ( ) * ## 3) daos.suocuhog: El suseador prcpal o el cóyuge ocupado, oro de los membros ocupado,el suseador prcpal o el cóyugeocupado, guo de los oros membros ocupado (s es que los hay),n el suseador prcpal su cóyuge ocupado, oro membro ocupado,ngú ocupado e el hogar ( ) ## 6) daos.memb < ( ) * ## 7) daos.memb > ( ) ## 4) daos.suocuhog: El suseador prcpal o el cóyuge ocupado, oro de los membros ocupado,n el suseador prcpal su cóyuge ocupado, oro membro ocupado ( ) * ## 5) daos.suocuhog: El suseador prcpal o el cóyugeocupado, guo de los oros membros ocupado (s es que los hay),ngú ocupado e el hogar ( ) ## 3) daos.memb < ( ) * ## 3) daos.memb > ( ) * 4

126 Se ha elaborado u arbol co 5 odos ermales, que cosdera como pobres odos los hogares de más de 4,5 membros e dode: El suseador prcpal o el cóyuge esá ocupado, y guo de los oros membros ocupado (s es que los hay), y e los que o hay gú ocupado e el hogar. Ese clasfcador presea los sguees resulados e la muesra de es: ## ## 53 ## y ## ree.pred ## 44 6 ## Se realza u aálss de pos-poda, cuyos resulados o acosea reducr el úmero de odos ermales. ## $sze ## [] 5 ## ## $dev ## [] 4 58 ## ## $k ## [] If ## ## $mehod ## [] "msclass" ## ## ar(,"class") ## [] "prue" "ree.sequece" 5

127 8.6. MÁQUINAS DE SOPORTE VECTOR Las Máquas de Sopore Vecoral (Suppor Vecor Maches SVMs) so u couo de algormos de apredzae supervsados que desarrolla méodos relacoados co los problemas de clasfcacó y regresó. Como e la mayoría de los méodos de clasfcacó supervsada, los daos de erada (los puos) so vsos como u vecor p-dmesoal (ua lsa de p úmeros). Dado u couo de puos como u subcouo de u couo mayor (espaco), e el que cada uo de ellos pereece a ua de dos posbles caegorías, de maera que u algormo basado e SVM cosruye u modelo capaz de predecr s u puo uevo (cuya caegoría descoocemos) pereece a ua caegoría o a la ora. La SVM, uvamee, es u modelo que paredo de u couo de eemplos de ereameo, podemos equearlos e dferees clases y represear dchas muesras e 6

128 puos e el espaco para raar de separar las dferees clases medae u espaco lo más amplo posble, para que cuado las uevas muesras de los casos de es se poga e correspodeca co dcho modelo pueda ser clasfcadas correcamee e fucó de su proxmdad. E ese cocepo de "separacó ópma" es dode resde la caracerísca fudameal de las SVM: ese po de algormos busca el hperplao que ega la máxma dsaca (marge) co los puos que esé más cerca de él msmo. Por eso ambé a veces se les cooce a las SVM como clasfcadores de marge máxmo. De esa forma, los puos del vecor que so equeados co ua caegoría esará a u lado del hperplao y los casos que se ecuere e la ora caegoría esará al oro lado. Fgura 8.4 La maera más smple de realzar la separacó es medae ua líea reca, u plao reco o u hperplao N-dmesoal. Desaforuadamee los uversos a esudar o se suele presear e casos dílcos de dos dmesoes como e el eemplo aeror, so que u algormo SVM debe raar co más de dos varables predcoras, curvas o leales de separacó, casos dode los couos de daos o puede ser compleamee separados, clasfcacoes e más de dos caegorías. Debdo a las lmacoes compuacoales de las máquas de apredzae leal, ésas o puede ser ulzadas e la mayoría de las aplcacoes del mudo real. La represeacó por medo de fucoes úcleo ó Kerel ofrece ua solucó a ese problema, proyecado la formacó a u espaco de caraceríscas de mayor dmesó el cual aumea la capacdad compuacoal de la máquas de apredzae leal (ver aparado 6.). Eemplo 8.4. Paredo del modelo esmado e el Eemplo 4., vamos a realzar ua mería de daos, dvdedo la ecuesa e dos muesras ua de ereameo co el 7% de los daos y ua muesra es co el 3% resae, se va ha realzar la clasfcacó ulzado ua máqua de sopore vecor, para ello hay que salar el package-r: e7, e vocar la fucó svm. Se esma u modelo co u leal y u Kerel de base radal (la fucó perme además fucoes base polomales y sgmodes). Evaluaremos los resulados co ua mérca de porceae de aceros, y obeemos la curva ROC para la muesra es co la fucó radal. ```{r} lbrary(e7) # Seleccó de varables 7

129 explcavas <- daa.frame(daos$memb,daos$mem,daos$mem,daos$umac,daos$umocu) y=as.facor(daos$pobre) daos4 <- daa.frame(explcavas,y) # se esma u modelo svm leal para la muesra de ereameo ra=sample(seq(legh(y)),legh(y)*.7,replace=false) svmf=svm(daos4$y~.,daa=daos4,kerel="lear",scale=false,subse= ra) pr(svmf) plo(svmf,daos4,daos.memb~daos.umocu) able(daos4$y[ra],svmf$fed) # Predccó para la muesra es svm.pred=predc(svmf,daos4[-ra,]) summary(svm.pred) wh(daos4[-ra,],able(svm.pred,y)) # se esma u modelo svm leal para la muesra de ereameo y se predce la muesra de es svmf=svm(daos4$y~.,daa=daos4,kerel="radal",scale=false,subse= ra,probably=true) pr(svmf) svm.pred=predc(svmf,daos4[-ra,],probably=true) summary(svm.pred) wh(daos4[-ra,],able(svm.pred,y)) #gráfca curva ROC lbrary(rocr) svm.pred=predc(svmf,daos4[-ra,],probably =TRUE) prob=svm.pred=predc(svmf,daos4[-ra,],probably =TRUE) predc.rocr <- predco (ar(prob,"probables")[,],y[-ra]) perf.rocr <- performace(predc.rocr,"pr","fpr") #True y Tasa de falsos posvos auc <- as.umerc(performace(predc.rocr,"auc")@y.values) plo(perf.rocr,ype='o', ma = pase('area Bao la Curva =',roud(auc,))) able(a=, b= ) ``` E prmer lugar, se esma u Kerel leal: ## ## Call: ## svm(formula = daos4$y ~., daa = daos4, kerel = "lear", ## subse = ra, scale = FALSE) ## ## ## Parameers: ## SVM Type: C classfcao ## SVM Kerel: lear 8

130 ## cos: ## gamma:. ## ## Number of Suppor Vecors: 458 La mérca e la muesra de ereameo ofrece el sguee resulado: ## ## ## ## La mérca e la muesra de es ofrece el sguee resulado: ## y ## svm.pred ## 47 8 ## La esmacó de u Kerel radal da el sguee resulado: ## ## Call: ## svm(formula = daos4$y ~., daa = daos4, kerel = "radal", ## probably = TRUE, subse = ra, scale = FALSE) ## ## ## Parameers: ## SVM Type: C classfcao ## SVM Kerel: radal 9

131 ## cos: ## gamma:. ## ## Number of Suppor Vecors: 48 ## y ## svm.pred ## ## METODOLOGÍAS COMBINANDO CLASIFICADORES Receemee e el área de la Ielgeca Arfcal el cocepo de combacó de clasfcadores ha sdo propueso como ua ueva dreccó para meorar el redmeo de los clasfcadores dvduales. Esos clasfcadores puede esar basados e ua varedad de meodologías de clasfcacó, y puede alcazar dferees raos de dvduos be clasfcados. El obevo de la combacó de clasfcadores dvduales es el ser más cereros, precsos y exacos. Los méodos mulclasfcadores más coocdos so el Baggg (Brema, 966) y Boosg (Freud y Schapre, 996). El méodo propueso por Brea (966) ea auar las caraceríscas del Boosrappg y la agregacó corporado los beefcos de ambos (Boosrap AGGregaNG). La operava del méodo es la sguee: Se geera muesras aleaoras que será los couos de ereameo. Las muesras se geera a ravés de u muesreo aleaoro co reemplazameo. Cada subcouo de ereameo aprede u modelo. El boosrappg (o boosrap) es u méodo de remuesreo propueso por Bradley Efro e 979. Se ulza para aproxmar la dsrbucó e el muesreo de u esadísco. 3

132 Para clasfcar u eemplo se predce la clase de ese eemplo para cada clasfcador y se clasfca e la clase co mayor voo. El méodo propueso por Freud y Schapre (996), esá basado e la asgacó de u peso a cada couo de ereameo. Cada vez que se era se aprede u modelo que mmza la suma de los pesos de aquellos eemplos clasfcados erróeamee. Los errores de cada eracó srve para acualzar los pesos del couo de ereameo, cremeado el peso de los mal clasfcados y reducedo el peso de aquellos que ha sdo correcamee clasfcados. La decsó fal para u uevo paró de clasfcacó vee dada por la voacó mayorara poderada ere los dferees couos de ereameo. El package R: pred opera mulclasfcadores por los méodos baggg y boosg. 3

133 9. BIBLIOGRAFÍA Iroduccó a R: hps:// dce66f&ap_s= Achm Zeles, Torse Hohor (). Dagosc Checkg Regresso Relaoshps. R News (3), 7-. URL hp://cran.r-proec.org/doc/rews/ Albrgh,R., Lerma,S. y Mask,C. (977), Developme Of A Esmao Program For The M. Prob Model. Federal Hghway Admsrao Akake, H. (974), A ew look a he sascal model defcao, IEEE Trasacos o Auomac Corol AC-9, pp Amemya, T. (978), O A Two-Sep Esmao Of A Mulvarae Log Model, Joural Of Ecoomercs 8. Aderso, R. L. (94), Dsrbuo of he Seral Correlao Coeffce, Aals of Mahemacal Sascs, 94: -3. Ashley, Rchard A. (984), A Smple Tes for Regresso Parameer Isably, Ecoomc Iqury, No., Azar, A. y Trívez, F. J. (993), Méodos de Predccó e Ecoomía II: Aálss de Seres Temporales, Ed. Arel. Bassma, R. (957). A Geeralzed Classcal Mehod Of Lear Esmao Of Coeffces I A Srucural Equao. Ecoomerca 5, pp Belra, Maurco (5): Dseño e mplemeacó de u uevo clasfcador de présamos bacaros a ravés de mería de daos. Tess Docoral. Deparameo de Ecoomía Aplcada y Esadísca. UNED. Brema, Leo (996). "Baggg predcors". Mache Learg 4 (): 3 4. do:.7/bf CeSeer: hp://lk.sprger.com/arcle/.7%fbf58655 Box, G.E.P., Jeks, G.M. y Resel, G.C. (994), Tme Seres Aalyss - Forecasg ad Corol, 3rd Edo, Prece Hall. Cayuela L () Modelos leales geeralzados (GLM). EcoLab, Cero Adaluz de Medo Ambee, Uversdad de Graada. Juo. Chaeld, Crs (4). The Aalyss of Tme Seres: A Iroduco (6h ed.), 4. CRC Press Chow, G.C. (983), Ecoomercs, McGraw-Hll, New ork. Chrs (96). Smulaeus Equaos Esmao: Ay Veredc e?. Ecoomerca 8, pp

134 Cochrae, D. y Orcu, G. H. (949a), Applcao Of Leas Squares Regresso To Relaoshps Coag Auocorrelaed Error Terms, Joural of Amerca Sascal Assocao 44, pp Cochrae, D. y Orcu, G. H. (949b), A Samplg Sudy Of The Mers Of Auorregressve Ad Reduced Form Trasformaos I Regresso Aalyss Joural of Amerca Sascal Assocao 44, pp Dckey, D.A. y W.A. Fuller (979), Dsrbuo of he Esmaors for Auoregressve Tme Seres wh a U Roo, Joural of he Amerca Sascal Assocao, 74, p Durb, J. y Koopma, S. J. (), Tme Seres Aalyss by Sae Space Models (Oxford Sascal Scece Seres, º 4), Oxford Uversy Press. Durb, J. y Waso, G. S. (95), Tesg for Seral Correlao Leas Squares Regressos, Bomerka, vol 37. pp Egle, Rober F. (974), Bad Specrum Regresso,Ieraoal Ecoomc Revew 5,-. Bradley Efro, Elzabeh Hallora, ad Susa Holmes (996). "Boosrap cofdece levels for phylogeec rees". PNAS 93 (3): hp:// Fsher, R. A. (936). "The Use of Mulple Measuremes Taxoomc Problems". Aals of Eugecs 7 (): Fx, E.; J.L. Hodges (989) (95): A Impora Corbuo o Noparamerc Dscrma Aalyss ad Desy Esmao: Commeary o Fx ad Hodges (95). Ieraoal Sascal Revew / Revue Ieraoale de Sasque 57 (3): Freud, ; Schapre, R (997); A Decso-Theorec Geeralzao of O-Le Learg ad a Applcao o Boosg, Joural of Compuer ad Sysem Sceces, 55():9-39. hp://cseweb.ucsd.edu/~yfreud/papers/adaboos.pdf Fukuaga y Kessell (973): Noparamerc Bayes error esmao usg uclassfed samples. IEEE Trasacos o Iformao Theory (Volume:9, Issue: 4 ): Galla, A. R.(98) "O he Bas Flexble Fucoal Forms ad a Esseally Ubased Form." J. Ecoomercs 5(98):-45. Galla, A. R.(984) "The Fourer Flexble Form." Amer. J. Agr. Eco. 66(984):4-5 Goldfeld, S. M. y Quad, R. E. (965), Some es for Homocedascy, Joural of Amerca Sascal Assocao. Vol 37. pp Grager, C. W. J. (969), Ivesgag causal relaos by ecoomerc models ad crossspecral mehods, Ecoomerca 37, p Grager, C.W.J.(98), Some properes of me seres daa ad her use ecoomerc model specfcao, Joural of Ecoomercs 6, pp. -3. Grager, C.W.J., y Newbold, P. (974), Spurous regressos ecoomercs, Joural of Ecoomercs, pp. - 33

135 Greee, W. H. (), Aálss Ecoomérco, Ed. Prece Hall Guara, D. (997), Basc Ecoomercs, McGraw-Hll Guara, D. (3), Ecoomería, Ed. McGraw-Hll Haa, E.J. (963), Regresso for Tme Seres, Rosebla, M. (ed.), Tme Seres Aalyss, New ork, Joh Wley. Hase, T, Tbshra R. ad Fredma, J. (8), The Eleme of Sascal Learg. Daa Mg, Iferece ad Predco. Secod Edo. Sprge. Harvey, A.C. (978), Lear Regresso he Frequecy Doma, Ieraoal Ecoomc Revew, 9, Hausma, J.A. (974), Esmao ad Iferece Nolear Srucural Models, Aals of Ecoomc ad Socal Measureme, co Berd E., Hall R.E. y Hall, B.H. Ocober 974. Hausma, J.A. (974): Full Iformao Isrumeal Varables Esmaos of Smulaeas Equaos Sysems, Aals of Ecoomc ad Socal Measureme, Vol 3. º 4. pp Hausma, J.A. (978), Specfcao ess ecoomercs, Ecoomerca, 46, pp Hsao, C. (986), Aalyss of Pael Daa. Cambrdge Uversy Press. Johso, J. (997), Ecoomerc Mehods. McGraw-Hll. Johso, J. y Dardo, J. (), Méodos De Ecoomería, Ed. Vces-Vves 3ª Ed. Irlgaor, M. D. (978). Ecoomercs Models. Techques Ad Applcaos. Norh-Hollad. New ork. Kle, L. R. (96). Sgle Equao Vs. Equao Sysem Mehods Of Esmao I Ecoomercs. Ecoomerca 8, pp Kle, L. R. y Goldberger, A. (955), A Ecoomerc Model Of Ued Saes, Norh-Hollad, Amserdam. Koopmas, T.C., Rub, H. y Lepk, R.B. (95). Measurg The Equao Sysem Of Damc Ecoomcs, e Sascal Iferece I Damc Ecoomc Models, Cowles Commso Moografco º. Joh Wley. Nueva ork. Kuh, L.M. (959), The Valdy Of Cross-Secoally Esmaed Behavor Equaos Ecoomerca 7. Lu, T. (96), Uderdefcao, Srucural Esmao, Ad Forecasg Ecoomerca 8, pp McFadde, D. (974), Codoal Log Aalyss Of Qualave Choce Behavour, e Froers I Ecoomercs, Ed. P. Zarembka, Academc Press. Nueva ork. 34

136 McFadde, D. (976), Quaal Choce Aalyss: A Survey, Aals Of Ecoomc Ad Socal Measureme. Mood, A. M. (95), Iroduco o he Theory of Sascs, McGraw-Hll. Muh, J.F. (96), Raoal Expecaos Ad The Theory Of Prce Movemes, Ecoomerca 9, pp Muñoz A., Parra F. (7): Ecoomería Aplcada. Edcoes Académcas Nelder, Joh; Wedderbur, Rober (97). "Geeralzed Lear Models". Joural of he Royal Sascal Socey. Seres A (Geeral) (Blackwell Publshg) 35 (3): Novales, A. (993), Ecoomería, ª Edcó, McGraw-Hll. Parra, F.(6): Ecoomera Aplcada I. hps://ecoomera.fles.wordpress.com/4//parra-ecoomera-aplcada-.pdf Parra, F.(6): Ecoomera Aplcada II. hps://ecoomera.fles.wordpress.com/5//parra-ecoomera-aplcada-5.pdf. Pdyck, R. S. y Rubfeld, D. L. (976), Ecoomerc Models ad Ecoomc Forecas, McGraw-Hll. Pdyck, R. S. y Rubfeld, D. L. (98), Modelos Ecoomércos, Ed. Labor. Puldo, A. (983), Modelos Ecoomércos, Ed. Prámde Roseberg, B. (973), A Survey Of Sochasc Parameer Regresso, Aals Of Ecoomc Ad Socal Measureme. Samuelso, P. A., Koopmas, T. C. y Soe, J. (954), Repor Of The Evaluave Comme For Ecoomerca, Ecoomerca, pp Sarga, J. D. (958), The Esmao Of Ecoomc Relaoshps Usg Isrumeal Varables, Ecoomerca 6, pp Sarge, T.J. (984), Vecor auoregressos, expecaos ad advce, Amerca Ecoomc Revew 74, pp Sewar, M. y Walls, K. (984), Iroduccó a la Ecoomería, Alaza Edoral. Swamy, P. A. y Meha, J. S. (977), Esmao Of Lear Models Wh Tme Ad Cross- Secoaly Varyg Coeffces, Joural Of The Amerca Sascal Assocao 7. Ta, Hu Boo & Ashley, Rchard, 999. "Deeco Ad Modelg Of Regresso Parameer Varao Across Frequeces," Macroecoomc Dyamcs, Cambrdge Uversy Press, vol. 3(), pages 69-83, March. 35

137 Thel, H. (954), Esmao Of Parameers Of Ecoomercs Models, Bulle Of Ieraoal Sascs Isue 34, pp.-8. Tberge, J. (93), Besmmug Ud Deuug Vo Agebokurve, Zeschrf Für Naoalökoome. Veables, W. N. y Rpley, B. D. (), Moder Appled Sascs wh S. 4ª Ed., Sprger. Whe, H. (98), A Heeroskedasc-Cosse Regresso wh Idepede Observao, Ecoomerca 48, pp Workg, E.J. (97), Wha Do Sascal Demad Curves Show?, Quarerly Joural Of Ecoomcs 4. Wrgh, P.G. (95), Revew Of Ecoomc Cycles By Hery Moore, Quarerly Joural Of Ecoomcs 9. Wrgh, P.G. (98), The Tarff O Amal Ad Vegeable Ols, New ork, The Mcmlla Compay 36

138 . ANEO I 37

PLAN DE TRABAJO 11 Período 23/10/06 al 3/11/06. Durante estas dos semanas estudiarás los modelos de regresiones lineales.

PLAN DE TRABAJO 11 Período 23/10/06 al 3/11/06. Durante estas dos semanas estudiarás los modelos de regresiones lineales. Pla de Trabajo 0- Año 006 Curso Lbre Assdo de Esadísca II Docees resposables: Lercy Barros - María Sague PLAN DE TRABAJO Período 3/0/06 al 3//06 TEMAS A ESTUDIAR Durae esas dos semaas esudarás los modelos

Más detalles

CURSO DE ECONOMETRIA BÁSICA

CURSO DE ECONOMETRIA BÁSICA CURSO DE ECONOMETRIA BÁSICA D. Fracsco Parra Rodríguez. Jefe de Servco de Esadíscas Ecoómcas y Socodemografcas. Isuo Caabro de Esadísca. ICANE, ÍNDICE Tema. Regresó y correlacó leal smple Tema. Regresó

Más detalles

UNIDAD 7.- Matrices (tema 1 del libro) = MATRICES

UNIDAD 7.- Matrices (tema 1 del libro) = MATRICES UNIDD.- Marces (ema del lbro). MTRICES Ua mar se puede eeder como ua abla de úmeros ordeados e flas columas Defcó.- Se llama mar de dmesó m a u cojuo de úmeros reales dspuesos e m flas columas de la sguee

Más detalles

Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión

Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión Modelos de Regresó E muchos problemas este ua relacó herete etre dos o más varables, resulta ecesaro eplorar la aturaleza de esta relacó. El aálss de regresó es ua técca estadístca para el modelado la

Más detalles

Para el caso τ = 20 [min], la función se puede representar de las siguientes formas: a) Función Matemática: b) Tabla de Valores

Para el caso τ = 20 [min], la función se puede representar de las siguientes formas: a) Función Matemática: b) Tabla de Valores 1 RAPIDEZ DE CAMBIO Semaa 05 1 Varables depedees y o depedees Defr los cocepos: varable, cosae, cremeo, varacó. Defr los cocepos: varable depedee, varable depedee. Recoocer varables depedees e depedees.

Más detalles

En esta sección estudiaremos el caso en que se usa un solo "Predictor" para predecir la variable de interés ( Y )

En esta sección estudiaremos el caso en que se usa un solo Predictor para predecir la variable de interés ( Y ) Regresó Leal mple. REGREIÓN IMPLE El aálss de regresó es ua herrameta estadístca la cual utlza la relacó, etre dos o más varables de modo que ua varable pueda ser predcha desde la (s) otra (s). Por ejemplo

Más detalles

1.1.- Concepto Definición de cono Definición de función homogénea Interpretación económica de la función homogénea

1.1.- Concepto Definición de cono Definición de función homogénea Interpretación económica de la función homogénea Fucoes homogéeas FUNCIONES HOMOGÉNEAS (ESQUEMA).- Cocepo y propedades...- Cocepo Defcó de coo Defcó de fucó homogéea Ierpreacó ecoómca de la fucó homogéea..- Propedades (Operacoes co fucoes homogéeas)

Más detalles

Figura 1. Figura 2. Para realizar este análisis asumiremos las siguientes condiciones:

Figura 1. Figura 2. Para realizar este análisis asumiremos las siguientes condiciones: Coverdor PUH PU El coverdor Push Pull es u coverdor que hace uso de u rasformador para eer aslameo ere la esó de erada y la esó de salda. Posee además ua ducaca magezae propa del rasformador que como al

Más detalles

1. Introducción 1.1. Análisis de la Relación

1. Introducción 1.1. Análisis de la Relación . Itroduccó.. Aálss de la Relacó Ejemplos: Relacoes fucoales de terés Redmeto Doss de fertlzate Redmeto hortícola Desdad de platacó Volume de madera a cortar Desdad de platacó Catdad de suplemeto dado

Más detalles

TEMA 5: CAPITALIZACIÓN COMPUESTA ÍNDICE

TEMA 5: CAPITALIZACIÓN COMPUESTA ÍNDICE Maemácas Faceras Prof. Mª Mercedes Rojas de Graca TEMA 5: APITALIZAIÓN OMPUESTA ÍNDIE. APITALIZAIÓN OMPUESTA..... ONEPTO..... DESRIPIÓN DE LA OPERAIÓN....3. ARATERÍSTIAS DE LA OPERAIÓN....4. DESARROLLO

Más detalles

VOLUMEN IV CAPITULO 3 METODOLOGÍA PARA LA ACTULIZACIÓN DE LAS CURVA DE COSTOS ÓPTIMOS DE RACIONAMIENTO DE ELECTRICIDAD Y GAS NATURAL

VOLUMEN IV CAPITULO 3 METODOLOGÍA PARA LA ACTULIZACIÓN DE LAS CURVA DE COSTOS ÓPTIMOS DE RACIONAMIENTO DE ELECTRICIDAD Y GAS NATURAL ESTUDO DE OSTOS DE RAONAMENTO DE ELETRDAD Y GAS NATURAL Volume V apulo 3 forme Fal Revsó. VOLUMEN V APTULO 3 METODOLOGÍA PARA LA ATULZAÓN DE LAS URVA DE OSTOS ÓPTMOS DE RAONAMENTO DE ELETRDAD Y GAS NATURAL

Más detalles

Introducción a la Estadística Descriptiva

Introducción a la Estadística Descriptiva Iroduccó a la Esadísca Descrpva ª Edcó Carla Re Graña María Raml Díaz ITRODUCCIÓ A LA ESTADÍSTICA DESCRIPTIVA. ª Edcó o esá permda la reproduccó oal o parcal de ese lbro, su raameo formáco, la rasmsódeguaformaoporcualquermedo,aseaelecróco,mecáco,porfoocopa,por

Más detalles

REGRESIÓN LINEAL SIMPLE

REGRESIÓN LINEAL SIMPLE RGRIÓN LINAL IMPL l aálss de regresó es ua técca estadístca para vestgar la relacó fucoal etre dos o más varables, ajustado algú modelo matemátco. La regresó leal smple utlza ua sola varable de regresó

Más detalles

INGENIERÍA DE CONFIABILIDAD.. PORQUE UNA DE LAS FORMAS MÁS IMPORTANTES DE AGREGAR VALOR, ES EVITAR QUE SE DESTRUYA

INGENIERÍA DE CONFIABILIDAD.. PORQUE UNA DE LAS FORMAS MÁS IMPORTANTES DE AGREGAR VALOR, ES EVITAR QUE SE DESTRUYA Lecura 6 PRONÓSTICOS EN ACTIVOS REPARABLES INGENIERÍA DE CONFIABILIDAD.. PORQUE UNA DE LAS FORMAS MÁS IMPORTANTES DE AGREGAR VALOR, ES EVITAR QUE SE DESTRUYA Medardo Yañez Yañez Meda, Medardo - Gómez de

Más detalles

Una Estrategia de Acumulación de Reservas Mediante Opciones de Venta de Dólares. El Caso de Banco de México

Una Estrategia de Acumulación de Reservas Mediante Opciones de Venta de Dólares. El Caso de Banco de México Ua Esraega de Acumulacó de Reservas Medae Opcoes de Vea de Dólares. El Caso de Baco de Méxco INDICE I. REUMEN... II. INTRODUCCIÓN...3 III. IV. OPCIONE DE VENTA DE DÓLARE...4 III.. PRINCIPALE CARACTERÍTICA...4

Más detalles

TEMA 3: EQUIVALENCIA FINANCIERA DE CAPITALES

TEMA 3: EQUIVALENCIA FINANCIERA DE CAPITALES Maemácas Faceras Prof. Mª Mercees Rojas e Graca TEMA 3: EQUIVALENIA FINANIERA DE APITALE ÍNDIE. PRINIPIO DE EQUIVALENIA DE APITALE: ONEPTO. APLIAIONE DEL PRINIPIO DE EQUIVALENIA: UTITUIÓN DE APITALE....

Más detalles

Aplicación de Boostrapping en Regresión I

Aplicación de Boostrapping en Regresión I Aplcacó de Boostrappg e Regresó I U modelo de regresó leal basado e observacoes (x,y ) es de la forma y =x β+e (=,,..) dode y so los valores observados de la varable de respuesta y, y los x so vectores

Más detalles

Ensayos Limitaciones del modelo lineal de probabilidad y alternativas de modelación microeconométrica

Ensayos Limitaciones del modelo lineal de probabilidad y alternativas de modelación microeconométrica Esayos Lmacoes del modelo leal de probabldad y aleravas de modelacó mcroecoomérca Resume Absrac Résumé E ese arículo se eama res méodos para desarrollar modelos de probabldad para ua varable de respuesa

Más detalles

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx TEMA 3 Meddas de varabldad y asmetría 1. MEDIDAS DE VARIABILIDAD La varabldad o dspersó hace refereca al grado de varacó que hay e u cojuto de putuacoes. Por ejemplo: etre dos dstrbucoes que preseta la

Más detalles

V II Muestreo por Conglomerados

V II Muestreo por Conglomerados V II Muestreo por Coglomerados Dr. Jesús Mellado 31 Por alguas razoes aturales, los elemetos muestrales se ecuetra formado grupos, como por ejemlo, las persoas que vve e coloas de ua cudad, lo elemetos

Más detalles

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo Estadístca Tema : Meddas de Tedeca Cetral. Estadístca. UNITEC Tema : Meddas de Tedeca Cetral 1 Parámetros y Estadístcos Parámetro: Es ua catdad umérca calculada sobre ua poblacó La altura meda de los dvduos

Más detalles

Años I0 t (base 1992 = 100)

Años I0 t (base 1992 = 100) Esadísca y Meodología de la vesgacó Dada cualquer varable de la que coocemos los valores referdos a dsos perodos emporales, eedemos por úmero ídce de esa varable e dchos perodos el resulado de dvdr los

Más detalles

REVISTA INVESTIGACION OPERACIONAL Vol. 22, No. 2, 2001

REVISTA INVESTIGACION OPERACIONAL Vol. 22, No. 2, 2001 REVISA INVESIGACION OPERACIONAL Vol., No., SOLUCIONES A DIFERENES PROBLEMAS DENRO DEL CAMPO DE LA COMUNICACION ESADISICA J. Navarro Moreo, J.C. Ruz Mola y R.M. Ferádez Alcalá, Deparameo de Esadísca e Ivesgacó

Más detalles

Curvas Sistemas Gráficos Ing. Horacio Abbate 1

Curvas Sistemas Gráficos Ing. Horacio Abbate 1 Crvas Ssemas Gráfcos Ig. Horaco Abbae Polomos de erse Para y cosderar Para y cosderar - - Forma a base ara los olomos de grado. Calqer olomo de grado se ede descrbr como a combacó leal de olomos de erse

Más detalles

Tema 2: Distribuciones bidimensionales

Tema 2: Distribuciones bidimensionales Tema : Dstrbucoes bdmesoales Varable Bdmesoal (X,Y) Sobre ua poblacó se observa smultáeamete dos varables X e Y. La dstrbucó de frecuecas bdmesoal de (X,Y) es el cojuto de valores {(x, y j ); j } 1,, p;

Más detalles

LOS NÚMEROS COMPLEJOS

LOS NÚMEROS COMPLEJOS LOS NÚMEROS COMPLEJOS por Jorge José Osés Reco Departameto de Matemátcas - Uversdad de los Ades Bogotá Colomba - 00 Cuado se estudó la solucó de la ecuacó de segudo grado ax bx c 0 se aaló el sgo del dscrmate

Más detalles

MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU

MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU APLICACIÓN EN PROBLEMAS DE INGENIERÍA Clauda Maard Facultad de Igeería. Uversdad Nacoal de Lomas de Zamora Uversdad CAECE Bueos Ares. Argeta. maard@uolsects.com.ar

Más detalles

MUESTREO EN POBLACIONES FINITAS (1) Dos aspectos básicos de la inferencia estadística, no vistos aún:

MUESTREO EN POBLACIONES FINITAS (1) Dos aspectos básicos de la inferencia estadística, no vistos aún: A. Morllas - p. - MUESTREO E POBLACIOES FIITAS () Dos aspectos báscos de la fereca estadístca, o vstos aú: Proceso de seleccó de la muestra Métodos de muestreo Tamaño adecuado e poblacoes ftas Fabldad

Más detalles

Manual del usuario. Software de Matemáticas Herramientas de Estadística y Probabilidad. HEST Versión 1.9.7

Manual del usuario. Software de Matemáticas Herramientas de Estadística y Probabilidad. HEST Versión 1.9.7 Maual del usuaro HET Versó.9.7 ofware de Maemácas Herrameas de Esadísca y robabldad Wdows X - Wdows Vsa - Wdows 7 - Wdows 8 - Wdows O F T W R E Refereca: HET www.vaasofware.com EÑOL ÍDICE Iroduccó...3

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL Probabldad y Estadístca Meddas de tedeca Cetral MEDIDAS DE TENDENCIA CENTRAL E la udad ateror se ha agrupado la ormacó y además se ha dado ua descrpcó de la terpretacó de la ormacó, s embargo e ocasoes

Más detalles

Taller de Preparación para el examen Models Life Contingencies (MLC) de la SOA.

Taller de Preparación para el examen Models Life Contingencies (MLC) de la SOA. Taller de Preparacó para el eame Models Lfe Cogeces MLC de la SO. Trdad Gozález Bolla El presee es u forme del rabajo desarrollado durae el aller de preparacó para el eame MLC de SO ue uo lugar e la Faculad

Más detalles

VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN

VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN - INTRODUCCIÓN E este tema se tratará de formalzar umércamete los resultados de u feómeo aleatoro Por tato, ua varable aleatora es u valor umérco que correspode

Más detalles

ELABORACIÓN DE UN ÍNDICE COMPUESTO CAPÍTULO = X

ELABORACIÓN DE UN ÍNDICE COMPUESTO CAPÍTULO = X 5 CAPÍTULO ELABORACIÓN DE UN ÍNDICE COMPUESTO Ls Ídces Cmpuess, expresa de maera resumda la varacó prmed de u cju de varables respec de u períd base. Csderems u Agregad Cmplej "X", csud pr las varables

Más detalles

Duración y Convexidad I

Duración y Convexidad I Marí Herádez errao Modelo Aleravo Duracó y Covexdad I E ese maeral se presea de forma accesble, mas co u grado resposable de rgor maemáco, los cocepos de duracó y covexdad. e asume que el lecor cuea co

Más detalles

1. Una empresa estudia la evolución de los precios en euros de tres componentes (A, B, C) para una pieza en los últimos 5 años.

1. Una empresa estudia la evolución de los precios en euros de tres componentes (A, B, C) para una pieza en los últimos 5 años. Ejerccos Resuelos Números Ídces Faculad Cecas Ecoómcas y Emresarales Dearameo de Ecoomía Alcada Profesor: Saago de la Fuee Ferádez 1. Ua emresa esuda la evolucó de los recos e euros de res comoees (A,

Más detalles

Estadística. Tema 6: Análisis de Regresión.. Estadística. UNITEC Tema 6: Análisis de Regresión Prof. L. Lugo

Estadística. Tema 6: Análisis de Regresión.. Estadística. UNITEC Tema 6: Análisis de Regresión Prof. L. Lugo Estadístca Tema 6: Aálss de Regresó. Estadístca. UNITEC Tema 6: Aálss de Regresó Modelos de Regresó E muchos problemas este ua relacó herete etre dos o mas varables, resulta ecesaro eplorar la aturaleza

Más detalles

3 = =. Pero si queremos calcular P (B) 2, ya que si A ocurrió, entonces en la urna

3 = =. Pero si queremos calcular P (B) 2, ya que si A ocurrió, entonces en la urna arte robabldad codcoal rof. María. tarell - robabldad codcoal.- Defcó Supogamos el expermeto aleatoro de extraer al azar s reemplazo dos bolllas de ua ura que cotee 7 bolllas rojas y blacas. summos que

Más detalles

RENTABILIDAD Y RIESGO DE CARTERAS Y ACTIVOS TEMA 3- I FUNTAMENTOS DE DIRECCIÓN FINANCIERA. Fundamentos de Dirección Financiera Tema 3- Parte I 1

RENTABILIDAD Y RIESGO DE CARTERAS Y ACTIVOS TEMA 3- I FUNTAMENTOS DE DIRECCIÓN FINANCIERA. Fundamentos de Dirección Financiera Tema 3- Parte I 1 RENTILIDD Y RIESGO DE CRTERS Y CTIVOS TEM 3- I FUNTMENTOS DE DIRECCIÓN FINNCIER Fudametos de Dreccó Facera Tema 3- arte I RIESGO y RENTILIDD ( decsoes de versó productvas) EXISTENCI DE RIESGO ( los FNC

Más detalles

ANÁLISIS DE REGRESIÓN. Departamento de Matemáticas Universidad de Puerto Rico Recinto Universitario de Mayagüez

ANÁLISIS DE REGRESIÓN. Departamento de Matemáticas Universidad de Puerto Rico Recinto Universitario de Mayagüez ANÁLISIS DE REGRESIÓN Feradez Departameto de Matemátcas Uversdad de Puerto Rco Recto Uverstaro de Mayagüez REGRESIÓN LINEAL SIMPLE Regresó: cojuto de téccas que so usadas para establecer ua relacó etre

Más detalles

RESUMEN. Códigos de campo JEL: F0 C6 SUMMARY

RESUMEN. Códigos de campo JEL: F0 C6 SUMMARY RESUMEN El ema raado e ese rabao se emarca dero del esquema de Cueas Saéle del Tursmo. Maemácamee se desarrolla u ssema de ecuacoes e dferecas. Se pare de la ecuacó macroecoómca fudameal e equlbro para

Más detalles

por SANTIAGO RODRÍGUEZ FEIJOÓ Universidad de Las Palmas de Gran Canaria CARLOS GONZÁLEZ CORREA Consejería de E. y H. del Gobierno de Canarias

por SANTIAGO RODRÍGUEZ FEIJOÓ Universidad de Las Palmas de Gran Canaria CARLOS GONZÁLEZ CORREA Consejería de E. y H. del Gobierno de Canarias ESTADÍSTICA ESAÑOLA Vol. 44, Núm. 50, 2002, págs. 229 a 255 La eoría de la ardad Relava del oder de Compra ere erroros ecoómcos que ee ua msma moeda: ua aplcacó a las comudades auóomas españolas por SANTIAO

Más detalles

Intensificación en Estadística

Intensificación en Estadística GRADO EN VETERINARIA DEPARTAMENTO DE ESTADÍSTICA E IO 0-0 IV Curso Cero Itesfcacó e Estadístca Itroduccó a la fucó Sumatoro Itroduccó Cocepto de fucó sumatoro Aplcacoes Itroduccó Cocepto de fucó sumatoro

Más detalles

Análisis estadístico básico (II) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears

Análisis estadístico básico (II) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears Aál etadítco báco (II) Magdalea Cladera Muar mcladera@ub.e Departamet d Ecooma Aplcada Uvertat de le Ille Balear CONTENIDOS Covaraza y correlacó. Regreó leal mple. REFERENCIAS Alegre, J. y Cladera, M.

Más detalles

Análisis de la Varianza

Análisis de la Varianza Descrpcó breve del tema Aálss de la Varaza Tema. troduccó al dseño de expermetos. El modelo. Estmacó de los parámetros. Propedades de los estmadores 5. Descomposcó de la varabldad 6. Estmacó de la dfereca

Más detalles

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS Estadístca Tema. Seres Estadístcas. Dstrbucoes de frecuecas. Pág. I. ANÁLISIS DESCIPTIVO DE UN CONJUNTO DE DATOS Seres Estadístcas. Dstrbucoes de frecuecas.. Defcó de Estadístca... Coceptos geerales...2

Más detalles

1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL

1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL Estadístca y probabldad 1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL 1.1 DISTRIBUCIONES ESTADÍSTICAS Se usa dagramas de barras, dode la altura de éstas represeta la recueca de cada

Más detalles

ANÁLISIS DE CIRCUITOS EN RÉGIMEN POLIARMÓNICO

ANÁLISIS DE CIRCUITOS EN RÉGIMEN POLIARMÓNICO A.4. EORÍA DE CRCUOS CAPÍULO 3 ANÁLSS DE CRCUOS EN RÉGEN POLARÓNCO Cáedra de eoría de Crcuos Edcó 3 ANÁLSS DE CRCUOS EN RÉGEN POLARÓNCO 3. roduccó El desarrollo de las éccas de aálss de Fourer posee ua

Más detalles

Reglas para el manejo de los índices de deuda de la BNV. Bolsa Nacional de Valores Version 4.4 13/07/2005

Reglas para el manejo de los índices de deuda de la BNV. Bolsa Nacional de Valores Version 4.4 13/07/2005 Reglas para el maejo de los ídces de deuda de la BV Bolsa acoal de Valores Verso 4.4 3/07/005 ága de 6 COTEIDO ITRODUCCIÓ... 4. erspecva geeral... 4 MAEJO DE LOS ÍDICES... 6. Comé de Ídces de íulos de

Más detalles

Sistemas Productivos

Sistemas Productivos Ssemas Producvos º Elemeos de dseño del proceso producvo A la hora de dseñar ua udad producva, hay que realzar ua sere de decsoes esraégcas que cluye ecesaramee:. Localzacó de la plaa: lugar dode físcamee

Más detalles

Tema 5: Chequeo, Validación y Grabación de Datos

Tema 5: Chequeo, Validación y Grabación de Datos Tema 5: Chequeo, Valdacó y Grabacó de Daos Ua vez recogda la ormacó e campo se ca la eapa de raameo de esa ormacó. sa eapa cosa a su vez de varas ases como so: depuracó, codcacó, grabacó, valdacó y evaluacó

Más detalles

LA MEDIANA ROBUSTA SOBRE UN ÁRBOL CUANDO LA DEMANDA ES INCIERTA

LA MEDIANA ROBUSTA SOBRE UN ÁRBOL CUANDO LA DEMANDA ES INCIERTA LA MEDIANA ROBUSTA SOBRE UN ÁRBOL CUANDO LA DEMANDA ES INCIERTA M.J. Caós M. Maríez 2 M. Mocholí V. Navarro 3 U. de Valeca Florda Uversara U. de Valeca U. de Valeca mara..caos@uv.es marsam@florda-u.es

Más detalles

ESTADÍSTICA poblaciones

ESTADÍSTICA poblaciones ESTADÍSTICA Es la parte de las Matemátcas que estuda el comportameto de las poblacoes utlzado datos umércos obtedos medate epermetos o ecuestas. ESTADÍSTICA La Estadístca tee dos ramas: La Estadístca descrptva:

Más detalles

Facultad de Ciencias Económicas y Administrativas. Departamento de Economía. Análisis Espectral. Alvaro Montenegro. Bogotá, Marzo de 2009

Facultad de Ciencias Económicas y Administrativas. Departamento de Economía. Análisis Espectral. Alvaro Montenegro. Bogotá, Marzo de 2009 Faculad de Cecas Ecoómcas y Admsravas Deparameo de Ecoomía Aálss Especral Alvaro Moeegro Bogoá, Marzo de 009 Esa vesgacó fue facada por la Pofca Uversdad Javeraa y correspode a desarrollos del proyeco

Más detalles

VARIABLES ESTADÍSTICAS UNIDIMENSIONALES.

VARIABLES ESTADÍSTICAS UNIDIMENSIONALES. CONTENIDOS. VARIABLES ESTADÍSTICAS UNIDIMENSIONALES. Itroduccó a la Estadístca descrptva. Termología básca: poblacó, muestra, dvduo, carácter. Varable estadístca: dscretas y cotuas. Orgazacó de datos.

Más detalles

Modelación hidrológica empleando isoyetas de relieve, una aproximación geoestadística

Modelación hidrológica empleando isoyetas de relieve, una aproximación geoestadística lmae Varably ad hage Hydrologcal Impacs Proceedgs of he Ffh FRIND World oferece held a Havaa uba November 006 IAHS Publ. 308 006. 6 odelacó hdrológca empleado soyeas de releve ua aproxmacó geoesadísca

Más detalles

DISTRIBUCIÓN DE LA MEDIA Y EL TEOREMA DEL LÍMITE CENTRAL

DISTRIBUCIÓN DE LA MEDIA Y EL TEOREMA DEL LÍMITE CENTRAL Smposo de Metrología 4 al 7 de Octubre DISTRIBUCIÓ DE LA MEDIA Y EL TEOREMA DEL LÍMITE CETRAL Wolfgag A. Schmd Cetro acoal de Metrología Tel.: (44) 4, e-mal: wschmd@ceam.mx Resume: De acuerdo al Teorema

Más detalles

INCERTIDUMBRE EN LA MEDICIÓN DE LA VELOCIDAD PARA LA SIMULACION DE OBJETOS EN MOVIMIENTO.

INCERTIDUMBRE EN LA MEDICIÓN DE LA VELOCIDAD PARA LA SIMULACION DE OBJETOS EN MOVIMIENTO. Scea e Tecca Año XV, No, Dcembre 009. versdad Tecológca Perera. ISSN 0-70 5 INCERTIDMBRE EN LA MEDICIÓN DE LA VELOCIDAD PARA LA SIMLACION DE OBJETOS EN MOVIMIENTO. Measureme uceray of e velocy for e smulao

Más detalles

ANÁLISIS DE LA VARIANZA ANOVA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES

ANÁLISIS DE LA VARIANZA ANOVA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES ANÁLISIS DE LA VARIANZA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES ANOVA Marta Alper Profesora Adjuta de Estadístca alper@fcym.ulp.edu.ar http://www.fcym.ulp.edu.ar/catedras/estadstca INTRODUCCION

Más detalles

-Métodos Estadísticos en Ciencias de la Vida

-Métodos Estadísticos en Ciencias de la Vida -Métodos Estadístcos e Cecas de la Vda Regresó Leal mple Regresó leal smple El aálss de regresó srve para predecr ua medda e fucó de otra medda (o varas). Y = Varable depedete predcha explcada X = Varable

Más detalles

CURSO CONVOCATORIA:

CURSO CONVOCATORIA: PRUEBAS DE ACCESO A LA UNIVERSIDAD CURSO 6-7 - CONVOCATORIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES - Cada alumo debe elegir sólo ua de las pruebas (A o B) y, dero de ella, sólo debe respoder (como

Más detalles

3 Metodología de determinación del valor del agua cruda

3 Metodología de determinación del valor del agua cruda 3 Metodología de determacó del valor del agua cruda Este aexo de la metodología del valor de agua cruda (VAC), cotee el método de detfcacó de la relacó etre reco y caudal, el cálculo de los estadígrafos

Más detalles

Un indicador mensual adelantado del sector de construcción: IMACO

Un indicador mensual adelantado del sector de construcción: IMACO U dcador mesual adelaado del secor de cosruccó: IMACO Sere Documeos de Trabajo [No. 34] Abrl Al Acosa Dael Barráez Elsy Paracare Baco Ceral de Veezuela Caracas Gereca de Ivesgacoes Ecoómcas Produccó edoral

Más detalles

CAPÍTULO III TÉCNICAS DE SIMULACIÓN ESTADÍSTICA. Los datos sintéticos son elementos de suma importancia en los sistemas de diseño en

CAPÍTULO III TÉCNICAS DE SIMULACIÓN ESTADÍSTICA. Los datos sintéticos son elementos de suma importancia en los sistemas de diseño en CAPÍTULO III TÉCNICAS DE SIMULACIÓN ESTADÍSTICA 3. Itroduccó Los datos stétcos so elemetos de suma mportaca e los sstemas de dseño e presas de almaceameto, ya que se evalúa el propósto del sstema co sumo

Más detalles

estimación de la estructura de Tasas nominales de chile: aplicación del modelo dinámico nelson-siegel

estimación de la estructura de Tasas nominales de chile: aplicación del modelo dinámico nelson-siegel Volume 4 - º / dcembre 0 estmacó de la estructura de Tasas omales de chle: aplcacó del modelo dámco elso-segel Rodrgo Alaro A. * Sebasá Becerra C. ** Adrés Sager T. *** I. IroduccIó La esmacó de la esrucura

Más detalles

FEM-OF: EDP Elíptica de 2 Orden

FEM-OF: EDP Elíptica de 2 Orden 9/02/2008 Capítulo 5: FM-OF: D líptca de 2 Orde Idce: 5..- Operador Dferecal líptco 5.2.- roblema Básco 5.3.- Fucoes Óptmas 5.4.- FM-OF Steklov-ocaré 5.5.- FM-OF Trefftz-Herrera 5.6.- FM-OF etrov-galerk

Más detalles

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 12.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 12.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS Tema 1 Ifereca estadístca. Estmacó de la meda Matemátcas CCSSII º Bachllerato 1 TEMA 1 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 1.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS UTILIZACIÓN DE

Más detalles

División de Estadísticas y Proyecciones Económicas (DEPE) Centro de Proyecciones Económicas (CPE)

División de Estadísticas y Proyecciones Económicas (DEPE) Centro de Proyecciones Económicas (CPE) Comsó Ecoómca para Amérca Lata y el Carbe (CEPAL Dvsó de Estadístcas y Proyeccoes Ecoómcas (DEPE Cetro de Proyeccoes Ecoómcas (CPE Estmacó Putual de Parámetros Chrsta A. Hurtado Navarro Mayo, 006 Estmacó

Más detalles

Influencia de distribución del tiempo de ocurrencia entre siniestros en la solvencia de las carteras de seguros no vida (*)

Influencia de distribución del tiempo de ocurrencia entre siniestros en la solvencia de las carteras de seguros no vida (*) ESTADÍSTICA ESPAÑOLA Vol. 50, úm. 69, 008, págs. 455 a 478 Iflueca de dsrbucó del empo de ocurreca ere sesros e la solveca de las careras de seguros o vda (*) por MAITE MÁRMOL JIMÉNEZ y M. MERCE CLARAMUNT

Más detalles

METODOLOGÍA DE CÁLCULO DEL INDICADOR DE FLOTA EN OPERACIÓN (IFO)

METODOLOGÍA DE CÁLCULO DEL INDICADOR DE FLOTA EN OPERACIÓN (IFO) METODOLOGÍA DE CÁLCULO DEL INDICADOR DE FLOTA EN OPERACIÓN (IFO) I. Descrpcó del cálculo de los dcadores IFO CIFO La flota e operacó se medrá a través de los mecasmos IFO y CIFO, de acuerdo a lo establecdo

Más detalles

Aproximación a la distribución normal: el Teorema del Límite Central

Aproximación a la distribución normal: el Teorema del Límite Central Aproxmacó a la dstrbucó ormal: el Teorema del Límte Cetral El teorema del límte cetral establece que s se tee varables aleatoras, X, X,..., X, depedetes y co détca dstrbucó de meda µ y varaza σ, a medda

Más detalles

La ecuación general de capitalización y los factores de capitalización unitarios: una aplicación del análisis de datos funcionales

La ecuación general de capitalización y los factores de capitalización unitarios: una aplicación del análisis de datos funcionales Moográco Número Marzo www.eweb.org/od La ecuacó geeral de capalzacó y los acores de capalzacó uaros: ua aplcacó del aálss de daos ucoales Cèsar Vllazó La Saou Resume La órmula geeral de capalzacó sólo

Más detalles

Análisis amortizado. Técnicas Avanzadas de Programación - Javier Campos 205

Análisis amortizado. Técnicas Avanzadas de Programación - Javier Campos 205 Aálss amortzado Téccas Avazadas de Programacó - Javer Campos 205 Aálss amortzado El pla: Coceptos báscos: Método agregado Método cotable Método potecal Prmer ejemplo: aálss de tablas hash dámcas Motículos

Más detalles

ESTADÍSTICA II SOLUCIÓN-PRÁCTICA 7: SERIES DE TIEMPO EJERCICIO 1 (NOVALES 2.1)

ESTADÍSTICA II SOLUCIÓN-PRÁCTICA 7: SERIES DE TIEMPO EJERCICIO 1 (NOVALES 2.1) ESTADÍSTICA II SOLUCIÓN-PRÁCTICA 7: SERIES DE TIEMPO EJERCICIO (NOVALES.) Cosideremos P P e g. Dado que dicha fució es coiua y que exise y so coiuas las derivadas de odos los órdees, podemos aplicar Taylor

Más detalles

Dada una sucesión x1, x2, x3,... x n dos a dos independientes, con una misma distribución de probabilidad y con esperanza µ y varianza σ

Dada una sucesión x1, x2, x3,... x n dos a dos independientes, con una misma distribución de probabilidad y con esperanza µ y varianza σ TEOREMA DE BERNOULLI GENERALIZADO > 0 Dada ua sucesó x1, x, x3,... x dos a dos depedetes, co ua msma dstrbucó de probabldad y co esperaza µ y varaza lím Se verfca que P x µ = 1 ó lím P x µ > = 0 El límte,

Más detalles

Gráfica de los resultados experimentales: Variable Independiente: Variable Dependiente: Variable asociada:

Gráfica de los resultados experimentales: Variable Independiente: Variable Dependiente: Variable asociada: :: OBJETIVOS [3.] o Apreder a presetar los datos epermetales como grafcas -. o Apreder a usar las hojas de papel logarítmco Semlogarítmco o Determar la relacó matemátca de ua grafca leal de datos epermetales

Más detalles

Estadística Espacial. José Antonio Rivera Colmenero

Estadística Espacial. José Antonio Rivera Colmenero Estadístca Espacal José Atoo Rvera Colmeero 1 Descrptores del patró putual Tedeca cetral 1. Meda cetral (Meda espacal). Meda cetral poderada 3. Medaa cetral (medaa espacal) o se utlza amplamete por su

Más detalles

Tema 1: Introducción: Generalización y Extensión del Modelo de Regresión

Tema 1: Introducción: Generalización y Extensión del Modelo de Regresión Tema : Itroduccó: Geeralzacó y Etesó del Modelo de Regresó Tema : Itroduccó: Geeralzacó y Etesó del Modelo de Regresó Itroduccó Especfcacó del Modelo de Regresó Leal 3 Supuestos del Modelo Clásco de Regresó

Más detalles

2 - TEORIA DE ERRORES : Calibraciones

2 - TEORIA DE ERRORES : Calibraciones - TEORIA DE ERRORES : Calbracoes CONTENIDOS Errores sstemátcos.. Modelo de Studet. Curvas de Calbracó. Métodos de los Mímos Cuadrados. Recta de Regresó. Calbracó de Istrumetos OBJETIVOS Explcar el cocepto

Más detalles

EJERCICIOS RESUELTOS TEMA 3.

EJERCICIOS RESUELTOS TEMA 3. INTRODUCCIÓN AL ANÁLII DE DATO EJERCICIO REUELTO TEMA 3. 3.1. La ampltud total de la dstrbucó de frecuecas de la tabla 1. es: A) 11; B) 1; C). Tabla 1. Estatura e cetímetros de ños de 1 meses de edad.

Más detalles

Práctica 11. Calcula de manera simbólica la integral indefinida de una función. Ejemplo:

Práctica 11. Calcula de manera simbólica la integral indefinida de una función. Ejemplo: PRÁCTICA SUMAS DE RIEMAN Práctcas Matlab Práctca Objetvos Calcular tegrales defdas de forma aproxmada, utlzado sumas de Rema. Profudzar e la compresó del cocepto de tegracó. Comados de Matlab t Calcula

Más detalles

VALOR EN RIESGO PARA UN PORTAFOLIO CON OPCIONES FINANCIERAS *

VALOR EN RIESGO PARA UN PORTAFOLIO CON OPCIONES FINANCIERAS * Revsa Igeerías Uversdad de Medellí VALOR EN RIESGO PARA UN PORTAFOLIO CON OPCIONES FINANCIERAS * Carlos Alexáder Grajales Correa ** Fredy Ocars Pérez Ramírez *** Recbdo: 6//009 Acepado: 08/0/00 RESUMEN

Más detalles

Transformada Z. Definición y Propiedades Transformada Inversa Función de Transferencia Discreta Análisis de Sistemas

Transformada Z. Definición y Propiedades Transformada Inversa Función de Transferencia Discreta Análisis de Sistemas 5º Curso-Tratameto Dgtal de Señal Trasformada Z Defcó y Propedades Trasformada Iversa Fucó de Trasfereca Dscreta Aálss de Sstemas 7//99 Capítulo 7: Trasformada Z Defcó y Propedades 5º Curso-Tratameto Dgtal

Más detalles

PARTE 2 - ESTADISTICA. Parte 2 Estadística Descriptiva. 7. 1 Introducción

PARTE 2 - ESTADISTICA. Parte 2 Estadística Descriptiva. 7. 1 Introducción Parte Estadístca Descrptva Prof. María B. Ptarell PARTE - ESTADISTICA 7- Estadístca Descrptva 7. Itroduccó El campo de la estadístca tee que ver co la recoplacó, orgazacó, aálss y uso de datos para tomar

Más detalles

El valor en el que se estabilizan las proporciones se le conceptualiza como la probabilidad

El valor en el que se estabilizan las proporciones se le conceptualiza como la probabilidad Regulardad estadístca. E vrtud de la gra varabldad de muchos procesos, se recurre al estudo del comportameto e grades cojutos de elemetos. Se busca captar los aspectos sstemátcos o los aleatoros. Se pretede

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadístca Descrptva Poblacó: Es u cojuto de elemetos co ua determada característca. Muestra: Es u subcojuto de la poblacó. Muestreo: Es el proceso para elegr ua muestra que sea represetatva de la poblacó.

Más detalles

Incertidumbre en las mediciones directas e indirectas

Incertidumbre en las mediciones directas e indirectas Icertdumbre e las medcoes drectas e drectas Comezaremos por dstgur dos dferetes tpos de medcoes: Medcoes drectas: La medda de la cota se obtee e ua úca medcó co u strumeto de lectura drecta. Medcoes drectas:

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA A. MEDIDAS DE TENDENCIA CENTRAL B. MEDIDAS DE VARIABILIDAD C. MEDIDAS DE FORMA RESUMEN: A. MEDIDAS DE TENDENCIA CENTRAL So estadígrafos de poscó que so terpretados como valores

Más detalles

ANALISIS BAYESIANO APLICADO A LA PROYECCION DE SINIESTRALIDAD DEL SEGURO OBLIGATORIO DE ACCIDENTES DE TRANSITO (SOAT).

ANALISIS BAYESIANO APLICADO A LA PROYECCION DE SINIESTRALIDAD DEL SEGURO OBLIGATORIO DE ACCIDENTES DE TRANSITO (SOAT). AALISIS BAYSIAO APLICADO A LA PROYCCIO D SIISTRALIDAD DL SGURO OBLIGATORIO D ACCIDTS D TRASITO (SOAT). JISSO JAVIR BOHORQUZ BOHORQUZ Trabao de Grado ara Oar el Tulo de Maemáco Asesor Cosaza Quero Guzmá

Más detalles

de los vectores libres del plano. Recordemos que la operación de sumar vectores verificaba las siguientes propiedades: se cumple que u + v = v + u

de los vectores libres del plano. Recordemos que la operación de sumar vectores verificaba las siguientes propiedades: se cumple que u + v = v + u FUNDAMENTOS DE LOS ESPACIOS VECTORIALES ABSTRACTOS Prmeros ejemplos. Cosderemos el cojuto V de los vectores lbres del plao. Recordemos que la operacó de sumar vectores verfcaba las sguetes propedades:

Más detalles

Estimación de Parámetros de Sistemas Lineales vía Matrices Operacionales

Estimación de Parámetros de Sistemas Lineales vía Matrices Operacionales Esmacó de Parámeros de Ssemas Leales vía Marces Operacoales Isdro I. Lázaro, Salvador Ramírez lazaro@zeus.umch.mx szavala@zeus.umch.mx Faculad de Igeería Elécrca-Uversdad Mchoacaa de Sa Ncolás de Hdalgo

Más detalles

Tabla de Contenidos. 1 Conceptos básicos sobre regresión y correlación... 1. 2 Caracterización de rodales... 22

Tabla de Contenidos. 1 Conceptos básicos sobre regresión y correlación... 1. 2 Caracterización de rodales... 22 Tala de Coedo Preeacó... Cocepo áco ore regreó correlacó.... Supueo áco de regreó.... Lo upueo de regreó e Dedromería... 6. Emacó de lo parámero del modelo de regreó leal mple... 7.. El méodo de mímo cuadrado

Más detalles

6 Relajación de los supuestos en el modelo lineal clásico

6 Relajación de los supuestos en el modelo lineal clásico 6 Relajacó de los supuesos e el modelo leal clásco Ezequel Urel Uversdad de Valeca Versó: 09-013 6 Relajacó de los supuesos e el modelo leal clásco 1 6.1 Relajacó de los supuesos del MLC: ua paorámca 1

Más detalles

Ensayos de control de calidad

Ensayos de control de calidad Esayos de cotrol de caldad Fecha: 0170619 1. lcace. Este procedmeto es aplcable e la evaluacó del desempeño del persoal que ejecuta pruebas e la Dvsó de Laboratoros de Ifraestructura de la Coordacó de

Más detalles

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula:

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula: CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS I Meddas de localzacó Auque ua dstrbucó de frecuecas es certamete muy útl para teer ua dea global del comportameto de los datos, es geeralmete ecesaro

Más detalles

Metodología Índice de Precios de Edificaciones Nuevas

Metodología Índice de Precios de Edificaciones Nuevas Meodología Ídce de recos de Edfcacoes Nuevas COLECCIÓN DOCUMENTOS - ACTUALIZACIÓN 29 Núm. 66 DEARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADÍSTICA HÉCTOR MALDONADO GÓMEZ Drecor CARLOS EDUARDO SEÚLVEDA RICO

Más detalles

Tema 2: Errores de Especificación y Problemas con la Muestra

Tema 2: Errores de Especificación y Problemas con la Muestra Tema : Errores de Especfcacó y Problemas co la Muestra TEMA : ERRORES DE ESPECIFICACIÓN ) Itroduccó ) Omsó de Varables Relevates 3) Iclusó de Varables Superfluas 4) Mala Especfcacó de la Forma Fucoal 5)

Más detalles

6. ESTIMACIÓN PUNTUAL

6. ESTIMACIÓN PUNTUAL Defcoes 6 ESTIMACIÓN PUNTUAL E la práctca, los parámetros de ua dstrbucó de probabldad se estma a partr de la muestra La fereca estadístca cosste e estmar los parámetros de ua dstrbucó; y e evaluar ua

Más detalles

Capítulo 3: Integral definida. Módulos 12 al 17. I. Notación sigma. En los ejercicios 1 a 5 escriba en forma de sumatoria la suma dada.

Capítulo 3: Integral definida. Módulos 12 al 17. I. Notación sigma. En los ejercicios 1 a 5 escriba en forma de sumatoria la suma dada. Módulos l 7 I Nocó sgm E los ejerccos escr e form de sumor l sum dd + + + + + + + + 9 + + 7 6 7 8 l + l 6 + l 8 + l 6 6 Supog que f ( ) 8, g( ) y h( ) Clcule el vlor de l epresó dcd e los ejerccos -e c

Más detalles

I EJERCICIOS RESUELTOS II EXÁMENES DE ECONOMETRÍA III EXÁMENES DE ECONOMETRÍA EMPRESARIAL IV EXÁMENES DE PRINCIPIOS DE ECONOMETRÍA

I EJERCICIOS RESUELTOS II EXÁMENES DE ECONOMETRÍA III EXÁMENES DE ECONOMETRÍA EMPRESARIAL IV EXÁMENES DE PRINCIPIOS DE ECONOMETRÍA I EJERCICIOS RESUELOS II EXÁMENES DE ECONOMERÍA III EXÁMENES DE ECONOMERÍA EMPRESARIAL IV EXÁMENES DE PRINCIPIOS DE ECONOMERÍA Noa: Los ejerccos con asersco no corresponden al programa acual de Prncpos

Más detalles

4º MEDIO: MEDIDAS DE POSICIÓN

4º MEDIO: MEDIDAS DE POSICIÓN 4º MEDIO: MEDIDAS DE POSICIÓN També llamadas de cetralzacó o de tedeca cetral. Srve para estudar las característcas de los valores cetrales de la dstrbucó atededo a dsttos crteros. Veamos su sgfcado co

Más detalles