UNIVERSIDAD POLITÉCNICA DE MADRID

Tamaño: px
Comenzar la demostración a partir de la página:

Download "UNIVERSIDAD POLITÉCNICA DE MADRID"

Transcripción

1 UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN TESIS DOCTORAL REPRESENTACIÓN NO-LINEAL DE IMÁGENES BASADA EN EL SISTEMA VISUAL HUMANO Y ADAPTADA A LA ESTADÍSTICA DE IMÁGENES NATURALES ROBERTO VALERIO CASCAJO Ingenero de Teleomunaón 004

2

3 DEPARTAMENTO DE IMÁGENES Y VISIÓN INSTITUTO DE ÓPTICA DAZA DE VALDÉS C.S.I.C. TESIS DOCTORAL REPRESENTACIÓN NO-LINEAL DE IMÁGENES BASADA EN EL SISTEMA VISUAL HUMANO Y ADAPTADA A LA ESTADÍSTICA DE IMÁGENES NATURALES Autor: Roberto Valero Casajo Ingenero de Teleomunaón Dretor: Rafael Navarro Belsué Dotor en Cenas Físas Septembre de 004

4

5 Trbunal nombrado por el Mgfo. y Exmo. Sr. Retor de la Unversdad Polténa de Madrd, el día... de... de 00 : Presdente D.... Voal D.... Voal D.... Voal D.... Seretaro D.... Realzado el ato de defensa y letura de la Tess en... el día... de... de 00. Calfaón:... EL PRESIDENTE LOS VOCALES EL SECRETARIO

6

7 Resumen En esta Tess desarrollamos un esquema de representaón de mágenes multpropósto nsprado en el tratamento no-lneal de nformaón en el sstema vsual humano. Para ello partmos de los trabajos de Smonell y olaboradores que mostraron que las etapas prmaras de este proeso, onsstentes en una etapa de fltrado lneal multesala (Gabor, wavelet, et.) seguda por una normalzaón dvsva no-lneal, podrían dar lugar a respuestas neuronales estadístamente ndependentes, lo ual es una propedad muy deseable en una representaón de magen. El trabajo realzado ha onsstdo en prmer lugar en un análss sstemáto del modelo propuesto por estos autores, y una formulaón rgurosa utlzando la nformaón mutua (IM) omo métra de la dependena estadísta. Como resultado, hemos demostrado que las respuestas predhas por dho modelo no son totalmente estadístamente ndependentes entre sí, sno que, sorprendentemente, las saldas resultan ser ndependentes de as todas las entradas. Aunque hemos vsto que no es posble onsegur una ndependzaón ompleta entre respuestas venas, hemos enontrado que en la práta la ondón de mínmo de la IM resulta ser muy próxma a ero. Tras este análss, hemos resuelto de forma aproxmada el problema de optmzar los parámetros lbres del modelo, esto es, alular los valores que mnmzan la dependena estadísta (IM) entre respuestas venas. Para ello se ha partularzando la expresón general para un modelo gaussano, que hemos verfado prevamente de forma empíra on un onjunto de mágenes naturales. El esquema de representaón de mágenes resultante es extraordnaramente robusto y flexble, por lo que admte dversas modfaones subóptmas que mejoran alguna de sus araterístas para aplaones que lo requeran. Todo ello ha quedado patente de forma empíra a través de las orrespondentes mplementaones y resultados numéros. Una vez estudada e mplementada la normalzaón dvsva, una de las aportaones lave ha sdo resolver el problema de la nversón de la transformaón no-lneal. Para ello se ha propuesto e mplementado un esquema dretamente nvertble, que puede obtenerse relajando lgeramente la ondón de ndependena estadísta mpuesta nalmente. Al quedar resuelta la nvertbldad, el esquema de representaón ya puede onsderarse multpropósto, on laras ventajas dadas su mayor relevana y ompatbldad pereptual y la ndependena estadísta entre muestras venas. Nosotros nos hemos entrado en dos aplaones onretas: () desarrollo de una métra pereptual de la aldad de magen y () nlusón de la etapa no-lneal en un ode JPEG 000 para mejorar la aldad vsual de la reonstruón.

8

9 Abstrat In ths Thess we develop a multpurpose mage representaton sheme nspred n the nonlnear nformaton proessng n the human vsual system. For ths purpose, we start from the work by Smonell and o-workers, who showed that the early stages of ths proessng, onsstng of a multsale lnear flterng stage (Gabor, wavelet, et.) followed by a nonlnear dvsve normalzaton, ould yeld statstally ndependent neural responses, whh s a very desrable property for mage representaton. The arred out work has onssted of, frst, a systemat analyss of the model proposed by these authors, and a rgorous formulaton usng the mutual nformaton (MI) as a measure of statstal dependene. As a result, we have proved that the responses predted by ths model are not ompletely statstally ndependent, but, surprsngly, eah output response s statstally ndependent from almost all the lnear nputs. Although we have seen that t s not possble to aheve omplete statstal ndependene between neghborng responses, we have found that the mnmum ondton of the MI s n prate very lose to zero. After ths analyss, we have approxmately solved the problem of optmzng the free parameters of the model, that s, to obtan the values that mnmze the statstal dependene (MI) between neghborng responses. For ths, we have partularzed the general expresson assumng a Gaussan model that we have emprally tested wth a set of natural mages. The resultng mage representaton sheme s extraordnary robust and flexble, and thus allows suboptmal modfatons that mprove some of ts haratersts for applatons that requre that. All ths has been emprally demonstrated by the orrespondng mplementatons and numeral results. In addton to study and mplement the dvsve normalzaton, another key ontrbuton has been to solve the problem of nvertng the nonlnear transform. For ths, we have proposed and mplemented a dretly nvertble sheme, whh an be obtaned by relaxng the ntally mposed ondton of statstal ndependene. One aheved nvertblty, the representaton sheme an be onsdered multpurpose, wth lear advantages due to ts greater pereptual relevane and ompatblty, and ts statstal ndependene between neghborng samples. We have foused on two partular applatons: () development of a pereptual mage qualty metr and () nluson of the nonlnear stage n a JPEG 000 ode to mprove vsual qualty of reonstruted mages.

10

11 Agradementos En prmer lugar, me gustaría expresar m agrademento a m dretor de Tess, Rafael Navarro, sn uyas deas y apoyo onstante esta Tess no hubera vsto la luz. Sempre estaré en deuda on él. A Narso Garía, dretor del GTI de la ETSIT, tengo que agradeerle que haya sdo m tutor en la Esuela, faltando enormemente todos los trámtes relaonados on m dotorado. Juntos hemos tendo que bregar no poas vees on el papeleo. Tambén quero agradeer a Bruno Olshausen, Bart M. ter Haar Romeny, Eero Smonell y Chrstof Koh, que me aogeran en sus respetvos laboratoros durante ms estanas predotorales. Como personas y omo entífos son exeponales, por lo que me onsdero muy afortunado de poder haber trabajado on ellos. Menón espeal mereen todos ms amgos y ompañeros del Insttuto de Ópta, los que están y los que estuveron. Estos años en el Insttuto no huberan sdo lo msmo sn vosotros. Sos genales. Y ya dejando el trabajo a un lado, quero envar un fuerte abrazo a Ala y Pepe, y al resto de los Resdentes. En espeal a los bearos de la Resdena, m auténta famla madrleña los últmos tres años. Graas por este dotorado en lo humano. Graas tambén a los muhos otros amgos que han heho este período más llevadero. Sobre todo a Carlos, el mejor amgo donde los haya, y más aún a Laura, nfntamente más que una amga y que ha sdo la que más ha tendo que sufrr esta Tess. Fnalmente, no puedo termnar estos agradementos sn menonar a ms padres, m hermana, ms abuelos, y al resto de m famla. Ellos me han apoyado sempre en todo y me han enseñado que esforzándose ualquer osa es posble. Todo lo que soy y lo que he logrado se lo debo a ellos, por lo que no hay palabras que puedan expresar m grattud. Este trabajo ha sdo desarrollado en el Insttuto de Ópta Daza de Valdés (CSIC). Agradezo a la Fundaón Benéfa Fasa Renault, a la Consejería de Eduaón de la Comundad de Madrd y el Fondo Soal Europeo, y al Ayutamento de Madrd y la Resdena de Estudantes, la onesón de sendas beas que me han permtdo la realzaón del msmo.

12

13 Índe General Introduón y objetvos.... Objetvos Estrutura de la memora... 6 Parte I: Revsón del estado del arte... 9 Representaón de mágenes.... Coneptos generales..... Transformaones lneales..... Análss multesala Prámdes multrresoluón Representaones lneales de mágenes Transformada dsreta del oseno (DCT) Prámde laplaana Desomposones en subbandas Transformadas wavelet Representaones no-lneales de mágenes Representaón de mágenes en el sstema vsual humano El sstema vsual humano El órtex vsual prmaro (V) Células smples y omplejas Prnpos de representaón de mágenes en el órtex vsual Estadísta de mágenes naturales Hpótess de Codfaón Efente Representaón dspersa y sobreompleta Modelos funonales de V Modelos del SVH para tratamento de mágenes... 65

14 ÍNDICE GENERAL Parte II: Desarrollo teóro e mplementaón Normalzaón dvsva Informaón mutua y urtoss Modelos de la estadísta ondonal de oefentes lneales de mágenes naturales Adaptaón de la normalzaón dvsva Esquema smple Estudo teóro Implementaón Resultados Esquema uas-óptmo Estudo teóro Condón general de óptmo Soluón aproxmada Condón de uas-óptmo Implementaón Resultados Esquema aproxmado on vendaro extenso Implementaón Resultados... 0 Parte III: Inversón de la transformaón y aplaones Esquema dretamente nvertble Problemas de la nversón en los esquemas generales Esquema dretamente nvertble Implementaón Resultados Métra pereptual Introduón: defnones y estado del arte Formulaón e mplementaón Etapa lneal... 50

15 ÍNDICE GENERAL 9.. Etapa no-lneal Suma de errores Resultados Inorporaón de la normalzaón dvsva al JPEG Introduón: el estándar JPEG El ode JPEG Optmzaón vsual en el estándar JPEG Esquema no-lneal ompatble on JPEG Etapa lneal Etapa no-lneal Implementaón del esquema de ompresón Estudo omparatvo Estudo monoanal Estudo multanal: análss teóro Conlusones... 9 Bblografía... 95

16

17 Índe de Fguras Fgura.: Funones base de una transformaón de 4 nveles basada en un fltro QMF de 9 oefentes. Las funones base se muestran a la zquerda y sus transformadas de Fourer a la dereha. Las transformadas de Fourer están dbujadas entre 0 y π sobre ejes lneales. (Smonell y Adelson, 990) Fgura.: Hstograma ondonal de dos oefentes venos ( j es veno nferor de ) en la subbanda vertal de la esala más baja, de la prámde dreonable de la magen estándar Ensten Fgura.3: Ejemplos de wavelets de Daubehes. ψ es la funón madre y ϕ es la funón de esalado. Los subíndes representan el orden del fltro wavelet orrespondente (en el aso de wavelets ortogonales es sempre un número par)... 9 Fgura.4: Ejemplos de wavelets bortogonales. ψ y ψ ~ son las funones madre de análss y síntess respetvamente, y ϕ y ϕ ~ las funones de esalado. Los subíndes apareen por parejas, representando el prmero, el orden del fltro paso bajo de análss y el segundo, el orden del fltro paso bajo de síntess (a dferena del aso ortogonal, el orden de los fltros puede ser par o mpar, sendo la úna restrón que la dferena sea par) Fgura 3.: El sstema vsual humano Fgura 3.: Vías Qué y Dónde del sstema vsual. Éstas nluyen regones espealzadas en el tratamento de nformaón de profunddad (representado por unas gafas), forma (ángulo), olor y dreón (señal de urva pelgrosa). La vía Qué se enarga del reonomento de objetos, mentras que la vía Dónde permte la loalzaón de los msmos Fgura 3.3: Campos reeptvos de las élulas smples y omplejas de V. El ampo reeptvo de las élulas smples presenta dos subregones alargadas que responden a estímulos brllantes (+) u osuros (-). Las élulas omplejas, sn embargo, responden tanto a estímulos brllantes omo a osuros en ualquer posón de su ampo reeptvo. (DeAngels et al., 995) v

18 v ÍNDICE DE FIGURAS Fgura 3.4: Retfaón en (A) élulas omplejas y (B) élulas smples. (Adaptado de De Valos et al., 98) Fgura 3.5: Funón de respuesta al ontraste de una neurona ortal para no freuenas espaales dferentes. (Observaones sn publar de Albreht y Gesler) Fgura 3.6: (a) Valores de ntensdad de pares de píxeles separados una dstana dada. (b) Funón de autoorrelaón. (Smonell y Olshausen, 00) Fgura 3.7: (a) Hstograma onjunto de las respuestas de dos ampos reeptvos que no se solapan. (b) Hstograma ondonal de los msmos datos. El nvel de grs representa la probabldad, salvo por el heho de que ada olumna se ha normalzado ndependentemente para abarar todo el rango de nveles de grs posbles. (Smonell y Olshausen, 00) Fgura 3.8: Potena espetral, promedada sobre todas las orentaones, de una magen natural (línea ontnua), omparada on /f (línea dsontnua). (Smonell y Olshausen, 00) Fgura 3.9: Hstograma de las respuestas de un fltro de Gabor aplado sobre una magen natural (línea ontnua), omparado on una fdp gaussana on la msma varanza (línea dsontnua). (Smonell y Olshausen, 00) Fgura 3.0: Ejemplos de funones base obtendas maxmzando el aráter dsperso. (Smonell y Olshausen, 00) Fgura 3.: Dagrama de bloques de un modelo típo del SVH para tratamento de mágenes Fgura 4.: fdp on una urtoss postva elevada (línea ontnua). En línea dsontnua se muestra una fdp gaussana on la msma varanza Fgura 4.: Imágenes estándar de prueba. De arrba abajo y de zquerda a dereha: Boats, Elane, Goldhll, Lena, Peppers, y Salboat Fgura 4.3: Hstogramas ondonales de dos oefentes venos ( j es el veno nferor de ) en la subbanda vertal de la esala más baja de (a) una desomposón ortogonal y (b) no-ortogonal Fgura 4.4: (a) Hstograma ondonal de un oefente wavelet de la subbanda vertal de la esala más baja y su veno nferor dereho j, dos seones vertales de este hstograma y una muestra de fdp gaussanas y lognormales. (b) Lo msmo pero usando varables logarítmas Fgura 4.5: IM en funón de la dstana de dos oefentes wavelet venos (uno sempre está en la subbanda vertal de la esala más baja) (a) en espao (la

19 ÍNDICE DE FIGURAS v urva x es para la dreón horzontal y o para la vertal) y (b) en esala ( x ) y orentaón ( o ), de la magen Lena Fgura 4.6: Hstograma ondonal de un oefente wavelet de la subbanda vertal de la esala más baja de la magen Lena, onoda la orrespondente ombnaón lneal s de oefentes wavelet adyaentes, onsderando el modelo (a) gaussano y (b) lognormal (ambos en línea ontnua)... 8 Fgura 5.: Valores de los parámetros del modelo estadísto gaussano para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 8 parámetros espaales. Los parámetros en freuena están dspuestos vertalmente, y horzontalmente los dos parámetros en orentaón. El valor de a se muestra debajo, dentro de la elpse punteada... 9 Fgura 5.: Valores de los parámetros del modelo estadísto gaussano para las subbandas vertales de las dferentes esalas... 9 Fgura 5.3: Valores de los parámetros del modelo estadísto gaussano para las subbandas dagonales de las dferentes esalas Fgura 5.4: (b) Desomposón de Daubehes y () no-lneal, de la magen Ensten (a) Fgura 5.5: Hstogramas ondonales de (a) dos píxeles venos p y p j (p j es el veno nferor dereho de p ), (b) dos oefentes wavelet y j, () dos respuestas no-lneales r y r j, y (d) una respuesta no-lneal r y la orrespondente ombnaón lneal s de oefentes wavelet al uadrado adyaentes a, de la magen Ensten, usando el modelo lognormal. La subbanda onsderada es sempre la subbanda dagonal de la esala más baja Fgura 6.: Valores de los parámetros de la normalzaón dvsva para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 8 parámetros espaales. Los parámetros en freuena están dspuestos vertalmente, y horzontalmente los dos parámetros en orentaón. El valor de d se muestra debajo, dentro de la elpse punteada Fgura 6.: Valores de los parámetros de la normalzaón dvsva para las subbandas vertales de las dferentes esalas Fgura 6.3: Valores de los parámetros de la normalzaón dvsva para las subbandas dagonales de las dferentes esalas

20 v ÍNDICE DE FIGURAS Fgura 6.4: (a) Desomposón de Daubehes y (b) no-lneal basada en la normalzaón dvsva, de la magen Lena... 0 Fgura 6.5: Hstogramas ondonales de (a) dos píxeles venos p y p j (p j es el veno nferor dereho de p ), (b) dos oefentes wavelet y j, y dos respuestas no-lneales r y r j, en el aso () aproxmado y (d) uas-óptmo on e = 0, de la magen Lena. La subbanda onsderada es sempre la subbanda vertal de la esala más baja... Fgura 6.6: fdp margnal de los oefentes wavelet y de las respuestas nolneales r, en la subbanda vertal de la esala más baja de la magen Lena. Con x s está representada la aproxmaón onsderada para la fdp margnal de las respuestas no-lneales: r p( r ) exp. πr H es la entropía H relatva H (dstana KL) entre el hstograma de las respuestas no-lneales y la aproxmaón, dvdda entre la entropía del hstograma H... 3 Fgura 7.: Parámetros {b j } ( j) para la subbanda vertal de la esala más baja de la magen Lena. Las 4 esalas están dspuestas vertalmente (la esala más fna arrba), y horzontalmente las 3 orentaones (horzontal, vertal y dagonal, de zquerda a dereha) Fgura 7.: Subbanda vertal de la esala más baja de la desomposón (b) de Daubehes y () no-lneal basada en la normalzaón dvsva, de la magen Lena (a).... Fgura 7.3: Hstogramas ondonales y valores de IM de (a) dos píxeles venos p y p j (p j es el veno nferor dereho de p ), (b) los oefentes wavelet y j, y () las respuestas no-lneales r y r j, de la magen Lena. La subbanda onsderada es la subanda vertal de la esala más baja.... Fgura 7.4: (a) fdp margnal de los oefentes wavelet y de las respuestas nolneales r, en la subbanda vertal de la esala más baja de la magen Lena. (b) fdp margnal de las respuestas no-lneales r tras multplarlas por una erta onstante k. Con x s está representada la fdp r = p( r ) exp... 4 πr Fgura 8.: Hstogramas ondonales de dos oefentes venos ( j es el veno nferor de ) en la subbanda vertal de la esala más baja (la más fna) de la prámde (a) QMF y (b) de Gabor, de la magen estándar Ensten... 3

21 ÍNDICE DE FIGURAS x Fgura 8.: Desomposón QMF de la magen Lena y vendaro onsderado en la etapa no-lneal del esquema dretamente nvertble de representaón de mágenes... 3 Fgura 8.3: Valores de los parámetros del modelo estadísto gaussano para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 9 parámetros espaales. Los parámetros en orentaón están dspuestos horzontalmente, y vertalmente el parámetro en esala. El valor de a se muestra debajo, dentro de la elpse punteada Fgura 8.4: Valores de los parámetros del modelo estadísto gaussano para las subbandas vertales de las dferentes esalas Fgura 8.5: Valores de los parámetros del modelo estadísto gaussano para las subbandas dagonales de las dferentes esalas Fgura 8.6: Desomposón no-lneal basada en la normalzaón dvsva de la magen Lena Fgura 8.7: Hstogramas ondonales de (a) dos oefentes QMF y j ( j es el veno nferor dereho de ) y (b) dos respuestas no-lneales r y r j, de la magen Salboat. La subbanda onsderada es la subbanda vertal de la esala más baja Fgura 9.: Sstema genéro de determnaón de la aldad de magen basado en la sensbldad al error. Nótese que el fltrado CSF puede mplementarse en una etapa aparte (omo se muestra) o ben dentro de la etapa de normalzaón del error. (Wang et al., 004) Fgura 9.: Esquema general de la métra pereptual. Los parámetros lbres están señalados on runferenas de línea dsontnua Fgura 9.3: fdp ondonal (a) p ( { j }) y (b) p( { j }). p( { j }) es una gaussana de meda nula y varanza σ. { j }) se obtene a partr de p( p( { j }) utlzando el teorema del ambo de varable Fgura 9.4: Representaón gráfa del modelo para la dstorsón mínma pereptble, fjado p = 0, Fgura 9.5: Expermentos de enmasaramento de ontraste utlzados para ajustar las gananas k de la etapa de suma de errores y valdar la métra pereptual Fgura 9.6: Resultados de nuestra métra pereptual, la métra de Teo y Heeger (994) y la métra SFUM (Ahumada, 996), para una señal enmasarante

22 x ÍNDICE DE FIGURAS vertal. Las urvas en línea ontnua representan el ontraste umbral de la señal enmasarada predho por la métra orrespondente. Los datos empíros están representados on írulos Fgura 0.: Code JPEG 000. Estrutura del (a) odfador y (b) deodfador. (Adams y Kossentn, 000) Fgura 0.: Coefentes del fltro paso bajo (h 0 ) y paso alto (g 0 ) de las transformadas wavelet bortogonales 9/7 y 5/3. (Usevth, 00) Fgura 0.3: Valores de los parámetros del modelo estadísto gaussano para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 9 parámetros espaales. Los parámetros en orentaón están dspuestos horzontalmente, y vertalmente el parámetro en esala. El valor de a se muestra debajo, dentro de la elpse punteada Fgura 0.4: Valores de los parámetros del modelo estadísto gaussano para las subbandas vertales de las dferentes esalas Fgura 0.5: Valores de los parámetros del modelo estadísto gaussano para las subbandas dagonales de las dferentes esalas Fgura 0.6: Orden de reorrdo de muestras dentro de un bloque de odfaón Fgura 0.7: Fragmento de la magen Baboon utlzado omo entrada del ode JPEG 000 smplfado Fgura 0.8: Subbanda vertal de la esala más baja de (a) la transformada 9/7 y (b) la representaón no-lneal, del fragmento de la magen Baboon Fgura 0.9: fdp de los oefentes wavelet y los oefentes normalzados r, en la subbanda onsderada, tras fjar las desvaones estándar a Fgura 0.0: fdp de los oefentes wavelet y los oefentes normalzados r (alulados aquí según la expresón: r = / d + j e j j ), en la subbanda onsderada, tras fjar las desvaones estándar a Fgura 0.: Posones sobre la magen en las que se enuentran el 5% de los valores más altos de los oefentes wavelet ( x ) y normalzados ( o ) de la subbanda onsderada Fgura 0.: Número de bts de sgno en ada plano de bts (el plano es el menos sgnfatvo) en la subbanda onsderada de la transformada wavelet ( x ) y la transformaón no-lneal ( o ).... 8

23 ÍNDICE DE FIGURAS x Fgura 0.3: Número total de bts a (nluyendo los bts que odfan el sgno negatvo) en ada plano de bts (el plano es el menos sgnfatvo) en la subbanda onsderada de la transformada wavelet ( x ) y la transformaón no-lneal ( o )... 8 Fgura 0.4: Número de bytes a la salda del odfador en funón del número de planos de bts que se odfan de la subbanda onsderada de la transformada wavelet ( x ) y la transformaón no-lneal ( o ) Fgura 0.5: Error pereptual relatvo ( representa el error pereptual uando no se odfa nngún plano de bts de la subbanda onsderada) en funón del número de bytes a la salda del odfador, uando se utlza la transformada wavelet ( x ) o la transformaón no-lneal ( o ) Fgura 0.6: MSE relatvo ( representa el MSE uando no se odfa nngún plano de bts de la subbanda onsderada) en funón del número de bytes a la salda del odfador, uando se utlza la transformada wavelet ( x ) o la transformaón no-lneal ( o ) Fgura 0.7: PSNR en funón del número de bytes a la salda del odfador, uando se utlza la transformada wavelet ( x ) o la transformaón no-lneal ( o ) Fgura 0.8: (a) Imagen orgnal e mágenes deodfadas orrespondentes a (b) la transformada wavelet y () la transformaón no-lneal, utlzando 7 y 0 planos de bts respetvamente para odfar la subbanda onsderada Fgura 0.9: Representaón del error uadráto entre las mágenes deodfadas orrespondentes a la transformada wavelet y la transformaón no-lneal, uando se utlzan 7 y 0 planos de bts respetvamente para odfar la subbanda onsderada... 86

24

25 Índe de Tablas Tabla 4.: IM entre dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ), y entre los orrespondentes oefentes wavelet y j en la subbanda vertal de la esala más baja de una desomposón wavelet de 4 nveles basada en fltros de Daubehes de orden Tabla 5.: IM entre dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ) de la magen Ensten, entre los oefentes wavelet resultantes y j, entre las respuestas normalzadas r y r j, y entre la respuesta normalzada r y la orrespondente ombnaón lneal s de oefentes wavelet al uadrado adyaentes a. La subbanda onsderada es sempre la dagonal de la esala más baja Tabla 6.: IM entre dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ), entre los oefentes wavelet resultantes y j, y entre las respuestas normalzadas r y r j en el aso aproxmado (A) y en el aso uas-óptmo (CO) on e = 0. La últma olumna muestra tambén la dferena relatva de la IM en el aso uas-óptmo respeto a la del aso aproxmado. La subbanda onsderada es sempre la vertal de la esala más baja... 4 Tabla 7.: IM entre dos oefentes wavelet venos y j ( j es el veno nferor dereho de ), y entre las orrespondentes respuestas normalzadas r y r j (usando los valores de los parámetros alulados on la magen Lena ), para 5 mágenes de prueba estándar. La subbanda onsderada es sempre la subbanda vertal de la esala más baja Tabla 8.: IM entre dos oefentes QMF venos y j ( j es el veno nferor dereho de ), y entre las orrespondentes respuestas normalzadas r y r j, para las 6 mágenes del onjunto de entrenamento. La subbanda onsderada es sempre la vertal de la esala más baja. La olumna A orresponde al esquema desrto en este apítulo y la olumna B orresponde a un esquema que usa un vendaro más general (un vendaro de oefentes adyaentes a lo largo de las uatro dmensones: 8 venos en un uadrado en x

26 xv ÍNDICE DE TABLAS el espao D, en orentaón y en freuena espaal) on oefentes que perteneen no sólo a nveles más altos de la prámde QMF sno tambén al msmo nvel y a nveles más bajos Tabla 0.: IM entre dos oefentes wavelet venos y j ( j es el veno nferor dereho de ), y entre las orrespondentes respuestas normalzadas r y r j, para las 6 mágenes del onjunto de entrenamento. La subbanda onsderada es sempre la vertal de la esala más baja... 7

27 Capítulo Introduón y objetvos El desarrollo de representaones de mágenes efentes y on buenas propedades, está tomando ada vez una mayor relevana en el ampo del tratamento y análss de mágenes y en aplaones de vsón artfal. Certamente, según la forma en la que se represente la nformaón ontenda en las mágenes, ertas araterístas serán fáles de extraer mentras que otras quedarán prátamente oultas. Cada vez está más laro que el formato usado para representar las mágenes es tanto o más mportante que los algortmos aplados. Básamente, exsten dos razones para transformar una magen de una representaón a otra: que la transformaón permta aslar elementos mportantes de la magen faltando así su análss, o ben que la transformaón dsponga los datos de manera más ompata para que la magen pueda almaenarse y transmtrse más efentemente. Dentro de este ampo, la representaón de las mágenes en el sstema vsual humano (SVH) es espealmente relevante. Por un lado, es un ampo de nvestgaón ada vez más atvo dentro de la neurofsología, enas de la vsón, et., y por otro, es una nagotable fuente de nspraón para el desarrollo de métodos en tratamento y análss de mágenes. Por su parte, los avanes en los métodos de tratamento y análss de mágenes tenen a su vez una extraordnara reperusón en la nterpretaón, realzaón de modelos, y reorentaón de los nuevos estudos expermentales en vsón bológa. El SVH es el sstema de tratamento y análss de mágenes más potente, flexble y robusto que se onoe hasta la feha. No es de extrañar, por tanto, que, ada vez más, se trate de emular el SVH en aplaones de tratamento y análss de mágenes, y vsón artfal. Tampoo hay que olvdar que en muhas de esas aplaones, el reeptor últmo de la nformaón vsual resultante es el ojo humano. Por ello, entender y aplar los prnpos de funonamento del SVH ha obrado una gran relevana en este ampo de la ena y la ngenería. Es en este maro de nteraón entre la vsón bológa y el ampo del tratamento y análss de magen donde se enuadra esta Tess.

28 Capítulo. Introduón y objetvos Un ejemplo muy evdente de esta mutua nterrelaón, y que además onsttuye el punto de partda del trabajo desarrollado, son las representaones lneales multesala basadas en banos de fltros lneales. Durante las dos últmas déadas ha habdo un desarrollo paralelo de este tpo de banos de fltros, que ha dado lugar, entre otras, a las transformadas wavelet, on un gran desarrollo tanto de su maro teóro omo de un gran número de aplaones. Tanto es así que nluso los estándares atuales de ompresón están basados en ellos. Por otra parte, los estudos realzados sobre el tratamento de nformaón en el SVH han dejado patente que en las prmeras etapas de tratamento se realza una desomposón multesala, multorentaón (y multfaseloal), perfetamente ompatble on los esquemas de banos de fltros. Nuestro grupo de nvestgaón en el Departamento de Imágenes y Vsón del Insttuto de Ópta del CSIC desarrolló un esquema de representaón de mágenes multpropósto nsprado en la vsón bológa (Navarro y Tabernero, 99; Navarro et al., 996), que además de onsttur un modelo esquemáto de la representaón en el órtex vsual, se ha usado on éxto en dversas tareas de tratamento y análss de mágenes, tales omo la fusón de mágenes, el análss y la síntess de texturas o la restauraón ega de rudo. Desde entones, estos ampos de nvestgaón han evoluonado substanalmente, guados por nuevas evdenas expermentales, modelos teóros más avanzados y nuevos desarrollos en el ampo del tratamento de mágenes. Por un lado, está laro y se sabe desde hae muho tempo que las respuestas de las neuronas del órtex vsual presentan propedades no-lneales, por lo que está laro que los modelos lneales, aunque han logrado explar on éxto muhas de las propedades esenales de la representaón vsual de mágenes en el erebro, son nsufentes para explar muhas otras propedades no menos esenales. En este sentdo, Heeger (99, 99a, 99b) propuso un modelo del ontrol de ganana del ontraste en la respuesta de las neuronas, basado en aplar una no-lnealdad expansva seguda de una normalzaón dvsva de la respuesta de ada neurona por una suma ponderada de sus venas. Este modelo ha logrado explar de forma senlla y efetva el omportamento no-lneal de las neuronas del área V de la orteza vsual, explando además mportantes aspetos neurofsológos y pereptvos, omo por ejemplo por qué la aldad subjetva vsual de una magen dfere totalmente de la aldad basada en rteros objetvos lásos que aplan métras estándar dretamente a los valores de los píxeles. Otro aspeto que ha modfado profundamente el estado del arte, ha sdo los numerosos trabajos dedados a estudar la estadísta de las mágenes naturales, y en partular la estadísta de prmer y segundo (ondonal) orden de los oefentes de las representaones multesala (Gabor, wavelet, et.). Dversos estudos han do

29 3 onstatando la hpótess de que el tratamento y representaón de la nformaón vsual en el erebro está adaptada, a través de la evoluón, a la estadísta de las mágenes naturales, ya que éstas son los estímulos vsuales que ha rebdo el ser humano en su evoluón. Esta adaptaón permte utlzar de forma óptma los reursos lmtados (número de neuronas) de que dspone nuestro sstema vsual. En este sentdo, la gran apadad deorreladora de las transformadas wavelet y otras desomposones multesala propuestas omo modelos de la representaón vsual, han reforzado la dea de que el sstema vsual utlza una odfaón efente, en la que las respuestas de neuronas venas son ndependentes unas de otras. La deorrelaón de heho elmna las dependenas de segundo orden, que son la mayor fuente de redundana en las mágenes, dsmnuyendo drástamente la antdad de nformaón a odfar. Sn embargo, al estudar la estadísta ondonal de los oefentes lneales (wavelet o smlar), se onstata que s ben están deorrelados, los oefentes todavía presentan fuertes dependenas estadístas de alto orden. Los trabajos de Smonell y olaboradores (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00), en los que se basa esta Tess, han sdo fundamentales para, en prmer lugar, omprobar que la estadísta ondonal de los oefentes wavelet venos, sgue una dstrbuón gaussana, uya varanza vene dada por una expresón matemátamente análoga al modelo propuesto por Heeger de ontrol de ganana del ontraste. De forma ntutva, esto llevó a estos autores a pensar que la normalzaón dvsva planteada por Heeger proporonaría una varanza onstante en el hstograma ondonal, garantzando por tanto la ndependena estadísta de las respuestas, heho que omprobaron empíramente. Este hallazgo es fundamental, puesto que permte errar un lazo que lga la fsología on la estadísta de las mágenes naturales, reforzándose así la hpótess de odfaón efente, según la ual el SVH se habría adaptado, a través de la evoluón, a las mágenes naturales, que son los estímulos a los que ha debdo adaptarse. Es muy nteresante además omprobar que estas etapas de tratamento, tanto la lneal multesala, omo la normalzaón dvsva no-lneal, dan lugar, ada una de ellas ndependentemente, a una extraordnara rqueza de faetas que han posbltado explar numerosas propedades y fenómenos aparentemente ndependentes del sstema vsual. Las etapas lneales ya han dado lugar a numerosísmas aplaones, en todos los ampos del tratamento y análss de mágenes, y la vsón artfal (ompresón, mejora, restauraón, reonomento, et.) por lo que abe aplarles el alfatvo de multpropósto. La normalzaón dvsva aparee omo una etapa de tratamento no menos nteresante y posblemente no menos multpropósto que la anteror. Por ello, y

30 4 Capítulo. Introduón y objetvos sguendo la línea de nuestro grupo de nvestgaón en el desarrollo de representaón de mágenes multpropósto y de nspraón bológa, en esta Tess pretendemos estudar, mplementar y aplar la normalzaón dvsva omo etapa no-lneal que dará orgen a una representaón en la que las muestras son estadístamente ndependentes. La norporaón de esta etapa no-lneal supone además un mportante ambo oneptual. Frente a los modelos del SVH de nspraón sobre todo psofísa, usados tradonalmente en tratamento de mágenes, esta Tess aboga por modelos más neurobológos y on una fuerte omponente estadísta. Es más, on el reonomento y verfaón empíra de que el SVH está adaptado a la estadísta de las mágenes naturales, los esquemas de nspraón bológa, pasan a tener una formulaón estadísta. Pensamos que el futuro de los esquemas multpropósto de tratamento de mágenes, pasa por este tpo de modelos bológo-estadístos. Todos estos oneptos, así omo una puesta al día del tema, se desarrollan en los Capítulos y 3 de esta Tess, donde se hae espeal énfass en todas las deas y ténas que hemos aplado en los apítulos subsguentes.. Objetvos El objetvo fundamental de esta Tess es, partendo de los trabajos de Smonell y olaboradores (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00), onstrur un esquema de representaón de mágenes multpropósto nsprado en el tratamento no-lneal de nformaón en las élulas smples de la regón V del órtex vsual y por tanto, on oefentes estadístamente ndependentes. La no-lnealdad será de tpo dvsvo y estará ben adaptada a la estadísta de las mágenes naturales. Con ello se pretende onsegur que los oefentes de la representaón presenten mejores propedades estadístas y pereptuales que los de las transformadas wavelet y otras transformaones lneales ortogonales, de forma que la representaón sea útl en numerosas aplaones de tratamento y análss de mágenes. De heho, nos planteamos desarrollar algunas de estas aplaones, omo parte esenal de este objetvo, para demostrar esta utldad. Para umplr este objetvo general, nos planteamos los sguentes pasos u objetvos espeífos:. Puesta al día y revsón del estado del arte en estos ampos. Este punto no es trval n muho menos, dado que se trata de aprovehar, y en erta medda unfar, ampos tan alejados omo la perepón vsual, la neurofsología, la

31 . Objetvos 5 estadísta de mágenes y de oefentes lneales wavelet, la representaón de mágenes, y aplaones tales omo la ompresón, et.. Formulaón de la ndependena estadísta en térmnos de la nformaón mutua (IM) y el análss sstemáto de los modelos no-lneales, basados en la normalzaón dvsva, propuestos por Smonell y olaboradores. Se utlzarán los modelos gaussano y lognormal de la estadísta ondonal de mágenes naturales. Así podremos omprobar s la eleón ad ho de los parámetros de la normalzaón dvsva propuesta por estos autores garantza la ndependena estadísta entre las respuestas de salda. 3. Dado que la normalzaón de Smonell tene un orgen ntutvo, no hay garantía a pror de que ésta sea la soluón óptma, por lo que abordaremos el problema de enontrar la normalzaón dvsva óptma que mnmza la dependena estadísta de las respuestas de salda. Es der, llegaremos a la expresón general del mínmo global de la IM. Partularzando la expresón general para un modelo gaussano de la estadísta ondonal de los oefentes lneales de mágenes naturales, ntentaremos llegar a una expresón aproxmada que sea fatble de mplementar on un razonable oste omputaonal. 4. Estos modelos ad ho y optmzado se mplementarán y ompararemos los resultados obtendos on un onjunto de mágenes naturales, omo verfaón empíra de la teoría. 5. Para poder trabajar on vendaros más grandes, nvestgaremos una forma numéramente efente de fjar los parámetros de la normalzaón dvsva. Esto nos permtrá por tanto generalzar el esquema. 6. Un objetvo esenal, para onstrur un esquema de representaón multpropósto, es poder nvertr la transformaón. Sn embargo, en el aso más general, la nversón de la etapa no-lneal es numéramente nestable, por lo que deberemos enontrar una soluón a este problema, aún a osta de relajar alguna de sus propedades más mportantes, omo es la ndependena estadísta, on el fn de obtener una representaón fálmente nvertble. 7. Una vez resuelto el problema de la nvertbldad, podremos desarrollar aplaones. En prmer lugar se desarrollará una métra pereptual de aldad de magen, smlar a la propuesta por Teo y Heeger (994). La prnpal dferena será que en nuestro aso la normalzaón dvsva será más general (no onsderará sólo respuestas venas en orentaón sno tambén en espao y esala) y además estará adaptada a la estadísta de las mágenes naturales, en

32 6 Capítulo. Introduón y objetvos lugar de ajustarla dretamente para reprodur resultados de expermentos psofísos. 8. Por últmo, se aplará la normalzaón dvsva a ompresón de mágenes, norporándola a una versón lgeramente smplfada del ode báso del estándar JPEG 000. Así podremos omprobar s la representaón no-lneal puede mejorar la aldad pereptual de las mágenes omprmdas.. Estrutura de la memora Esta memora se ha estruturado en tres partes, más las onlusones y la bblografía: Parte I. Esta parte ontene dos apítulos donde se exponen los oneptos manejados en esta Tess, nluyéndose una puesta a punto y revsón del estado del arte en los aspetos bológos y en uanto a las representaones de mágenes, respetvamente. En el Capítulo se desrben brevemente los prnpales tpos de representaones de mágenes, y on mayor detalle y profunddad aquellos utlzados dretamente en esta Tess. En el Capítulo 3 desrbmos las propedades del SVH, sobre todo aquellas relevantes para este trabajo. Nos entraremos en el órtex vsual prmaro (regón V), que desempeña un papel fundamental en la vsón y es la regón del erebro que tratan de modelar los esquemas bológos estudados en esta Tess. Una parte mportante del apítulo se deda a desrbr los prnpos generales de representaón de mágenes en V. Estos prnpos relaonan la representaón ortal on la estadísta de las mágenes naturales y son un mportante tema de nvestgaón hoy en día. Fnalmente, el apítulo termna on una desrpón de la estrutura general de los modelos del SVH empleados hoy en día en tratamento y análss de mágenes. Parte II. Esta parte es propamente el núleo teóro de la Tess. Una nolnealdad partular, la normalzaón dvsva, tomada de los modelos nolneales de las neuronas del órtex vsual prmaro, es el hlo ondutor de esta parte, que nluye la formulaón matemáta y el estudo sstemáto de sus propedades, así omo su mplementaón y la obtenón y análss de resultados. En el Capítulo 4 se ntroduen las deas y formulaón de partda, que se neestarán en los apítulos sguentes. Además se desrben e mplementan los modelos propuestos en la lteratura de la estadísta ondonal de oefentes lneales ortogonales de mágenes naturales, relaonados, omo se verá, on el álulo de los parámetros de la normalzaón dvsva. En el Capítulo 5,

33 . Estrutura de la memora 7 presentamos una formulaón matemáta y un análss más rguroso, en térmnos de la IM omo métra de la ndependena estadísta, de los modelos no-lneales, basados en la normalzaón dvsva y adaptados a la estadísta de mágenes naturales. En el Capítulo 6 nos oupamos del problema de enontrar e mplementar la normalzaón dvsva óptma que mnmza la dependena estadísta de las respuestas de salda. Fnalmente, en el Capítulo 7 proponemos una nueva forma de fjar los pesos de la normalzaón dvsva, muho más efente y que permte por tanto onsderar un onjunto mayor de oefentes venos en aplaones que así lo requeran. Parte III. La terera parte de la Tess trata de la nversón de la representaón no-lneal de mágenes y de dos aplaones prátas de nterés. Así, en el Capítulo 8 mostramos una soluón efente al problema de la nversón de la normalzaón dvsva. En el Capítulo 9, presentamos una métra pereptual de dstorsón de magen basada en los modelos del órtex vsual prmaro (V) desarrollados en la Parte II, smlar a la propuesta por Teo y Heeger (994), pero on la fundamental dferena de estar adaptada a la estadísta de las mágenes naturales y no ajustada ad ho a los datos psofísos. Y en el Capítulo 0, norporamos la normalzaón dvsva a un ode JPEG 000 y omparamos los resultados obtendos on los orgnales, en térmnos de métras estándar sobre píxeles y de la métra pereptual desarrollada en el Capítulo 9.

34

35 Parte I: Revsón del estado del arte

36

37 Capítulo Representaón de mágenes Representar de manera adeuada las mágenes es fundamental en ualquer aplaón de tratamento o análss, y sobre todo en vsón. Certamente, según la forma en la que se represente la nformaón ontenda en las mágenes, ertas araterístas son fáles de extraer mentras que otras quedan prátamente oultas. En este apítulo se ntroduen los oneptos más mportantes relaonados on la representaón de mágenes. Se desrben muy brevemente algunos de los prnpales tpos de representaones de mágenes, y on mayor detalle, aquellos utlzados en esta Tess. En onreto, se desrben representaones lneales tales omo la DCT, la prámde laplaana, algunas desomposones en subbandas (las basadas en fltros QMF y la prámde dreonable) y las transformadas wavelet. Las representaones lneales son la base fundamental sobre la que onstruremos los nuevos esquemas nolneales de representaón de mágenes, ya que en estos esquemas sempre habrá una etapa lneal seguda de la etapa no-lneal propamente dha. Por otro lado y a fn de que la vsón dada sea ompleta, se menonan los prnpales tpos de representaones nolneales propuestos en la lteratura. No se nsste demasado en estos últmos, ya que en general se alejan bastante del enfoque planteado en esta Tess.. Coneptos generales Cada vez está más laro que en tratamento de mágenes el formato usado para representar las mágenes es tanto o más mportante que los algortmos aplados. Una magen dgtal onsste nalmente en una matrz de píxeles que representan nveles de ntensdad, pero este formato no es muy adeuado para la mayoría de tareas de análss. El objetvo del análss de señales es extraer la nformaón relevante de una señal medante transformaones. Básamente, exsten dos razones para transformar una magen de una representaón a otra: que la transformaón permta aslar elementos mportantes de la magen, faltando así su análss, o ben que la transformaón

38 Capítulo. Representaón de mágenes dsponga los datos de manera más ompata, para que la magen pueda almaenarse y transmtrse más efentemente. Las transformaones lneales son la base de numerosas ténas usadas en odfaón, tratamento y análss de mágenes. Por ejemplo, una magen puede representarse por su transformada de Fourer y así operar sobre los oefentes de la transformaón en lugar de los píxeles orgnales. Esto es adeuado para ertas tareas de ompresón de datos y reale de magen, pero nadeuado para otras tareas. En espeal, este tpo de representaón no es adeuada en vsón artfal, n en gráfos por ordenador, donde es rual la loalzaón espaal de los elementos de la magen. Más reentemente, ha redo el nterés por las representaones que están loalzadas tanto en el domno espaal on en el de la freuena espaal. Esto se onsgue desomponendo la magen en un onjunto de omponentes paso banda en el domno de la freuena espaal. Las muestras de ada una de estas omponentes ontenen nformaón onvenentemente loalzada de la magen, al msmo tempo que la magen paso banda, omo un todo, es una versón de la magen a una erta esala o nvel de detalle. Este tpo de esquemas es muy popular en vsón artfal y, en general, en tratamento de mágenes e nluso, omo veremos en el apítulo sguente, exsten pruebas de que el sstema vsual humano (SVH) usa una representaón así... Transformaones lneales Una transformaón lneal ompleta representa una señal f (x) omo una ombnaón lneal de funones base g (x): f ( x) = y g ( x) (.) donde y son los oefentes de la transformaón. Estos oefentes se alulan a partr de la señal, proyetándola sobre un onjunto de funones h (x), llamadas funones de proyeón: y = h ( x) f ( x dx (.) ) En sstemas dsretos, una transformaón ompleta on funones base g (x) lnealmente ndependentes, se de que tene muestreo ríto s la tasa de muestreo de los oefentes de salda onde on la de la señal de entrada. En ambo, s las

39 . Coneptos generales 3 funones base no son lnealmente ndependentes, entones se de que la transformaón es sobreompleta y, en ese aso, las funones de proyeón h (x) orrespondentes no son únas. Las representaones sobreompletas de mágenes naturales, en las que el número de funones base es mayor que el número de píxeles de la magen, atraen ada vez mayor nterés. Esto se debe a que el aráter sobreompleto permte representaones más estables y, por tanto, más sgnfatvas, en las que elementos omunes de las mágenes pueden desrbrse on unos poos oefentes, ndependentemente de su tamaño y de ómo y dónde estén dspuestos en la magen. Las representaones sobreompletas permten mejorar la efena de la odfaón en la ompresón de mágenes, e ntroduen mejoras en algunas otras tareas, tales omo la elmnaón de rudo ( denosng ), reduendo los artefatos debdos al fenómeno de Gbbs tan araterístos de las representaones on muestreo ríto. Dremos que una transformaón es autonvertble s las funones de proyeón onden on las funones base, esto es, s h (x) = g (x). S la transformaón es autonvertble y las funones base son lnealmente ndependentes, entones la transformaón es además ortonormal. Las transformaones ortonormales son autonvertbles, pero no todas las funones autonvertbles son ortonormales, ya que se pueden onstrur transformaones autonvertbles sobreompletas. Ejemplos de transformaones sobreompletas autonvertbles son la transformada órtex de Watson (987) y la prámde dreonable (Smonell et al., 99). Intutvamente, la mportana de la autonvertbldad rada en que otorga un sgnfado laro a los oefentes de la transformaón, ya que estos se alulan usando funones de proyeón on una erta posón y forma tanto en el domno espaal omo en el de la freuena. A menudo, estamos nteresados en las propedades ndvduales de las funones base o de proyeón. En partular, los problemas de análss de señales habtualmente requeren el uso de funones loalzadas. Una funón que smultáneamente está loalzada respeto a varos parámetros, se de que esta loalzada onjuntamente en esos parámetros. El onepto de loalzaón onjunta en espao y freuena espaal fue ntrodudo por Gabor (946), que defnó un onjunto de funones (produtos de snusodes y gaussanas) on loalzaón onjunta máxma. Más reentemente, Daugman (985) extendó la base de funones de Gabor a dos dmensones y señaló la mportana de analzar la orentaón en las mágenes.

40 4 Capítulo. Representaón de mágenes.. Análss multesala El análss multesala es otro tema mportante en tratamento de señales. Así por ejemplo, en vsón artfal es dfíl analzar la nformaón ontenda en una magen dretamente a partr de los valores de ntensdad de sus píxeles. De heho, estos valores dependen de las ondones de lumnaón, rudo, et. Más mportantes son las varaones loales de ntensdad, y así el tamaño del vendaro en el que se alula el ontraste debe adaptarse al tamaño de los objetos que se queren analzar. Este tamaño de vendaro defne una resoluón de referena para medr las varaones loales de la magen. En general, las estruturas que queremos reonoer tenen dferentes tamaños y por eso no es posble defnr a pror una resoluón óptma para analzar mágenes. Para tratar una magen a dferentes resoluones, uno puede reorganzar la nformaón de la magen en dstntas omponentes según el nvel de detalle. Una representaón así se denomna multrresoluón y proporona un maro jerárquo smple para nterpretar la nformaón de las mágenes. La multrresoluón ofree una manera efente de extraer nformaón de las mágenes on varos nveles de resoluón. Por lo general, a dferentes resoluones, los detalles de una magen orresponden a estruturas físas dferentes de la esena. Así, a una resoluón gruesa, estos detalles perteneen a las estruturas más grandes, las uales defnen el ontexto de la magen. Es por tanto natural analzar prmero los detalles de una magen a una resoluón gruesa para después r nrementando gradualmente la resoluón. Esta estratega de grueso a fno se usa muho en los algortmos de reonomento de patrones. Una desomposón multrresoluón on esalas dstrbudas logarítmamente, permte además realzar un análss nvarante a esala de las mágenes. Téngase en uenta que la esala de una magen depende de la dstana entre la esena y el entro ópto de la ámara, pero no queremos que uando ésta ambe, ambe además la nterpretaón de la esena. La soluón está en analzar todas las esalas smultáneamente. Otra razón del éxto de estas ténas es que su uso presenta ventajas omputaonales, debdas al aráter reursvo de los algortmos, los uales además pueden aplarse sobre versones on resoluón reduda (onos) de las mágenes. En resumen, los métodos multrresoluón son mportantes por varos motvos: () hay pruebas de que el SVH proesa la nformaón vsual usando multrresoluón; () las señales habtualmente ontenen araterístas que orresponden a estruturas físas sgnfatvas a dferentes esalas; () los sensores en general proporonan señales de una msma fuente a dversas resoluones; (v) los métodos multrresoluón son robustos y tenen menor oste omputaonal.

41 . Coneptos generales 5 Los banos de fltros están muy relaonados on la mplementaón de las ténas multrresoluón. Estos son estruturas de onvoluón en las que una seuena de datos se desompone en M anales medante onvoluón on M fltros de análss, sendo ada anal submuestreado por un fator M. Análogamente, es posble nterpolar por un fator M ada anal, onvoluonar on M fltros de síntess y fnalmente reombnar los anales para obtener una seuena a la salda. En defntva, un bano de fltros es una oleón de fltros on una msma entrada o una msma salda. Cuando los fltros omparten la entrada, forman un bano de análss, y uando omparten la salda, un bano de síntess. S el bano de fltros emplea más de una tasa de muestreo, entones se denomna multtasa, sendo éste el tpo utlzado en la mplementaón de las ténas multrresoluón...3 Prámdes multrresoluón Un prmer ejemplo de transformaón multrresoluón (o multesala) es la prámde laplaana, desarrollada por Burt y Adelson (983). Esta transformaón es muy efente omputaonalmente, graas a su estrutura pramdal reursva, y se ha utlzado en odfaón de mágenes y otras tareas de tratamento y análss. Las representaones pramdales están basadas en la aplaón reursva de operaones de fltrado y submuestreo. Típamente, en estas representaones la señal de entrada se dvde en una omponente paso alto y otra paso bajo, submuestreándose esta últma para volver a repetr reursvamente el proeso on ella. Estas transformaones desomponen la magen en un onjunto de subbandas, de modo que la nformaón de ada subbanda puede tratarse ndependentemente de la del resto de subbandas. Habtualmente, para evtar el alasng, ada subbanda se muestrea a una freuena gual a la freuena de Nyqust que tendría una magen de ese tamaño. S la transformaón está sobremuestreada, entones es sobreompleta. Más reentemente, se han heho muy populares las desomposones dsretas en subbandas on muestreo ríto (en las que el número de muestras de la representaón es gual al número de muestras de la señal). A esta últma lase perteneen las transformaones basadas en los fltros QMF (Johnston, 980) y en ondíulas (wavelets en nglés, que será el térmno que utlzaremos por ser el más extenddo), que volan el rtero de Nyqust, pero sn perder nformaón. Esto se onsgue garantzando que los errores de alasng de todas las subbandas se anelan al reombnarlas. Las transformaones onstrudas a partr de fltros QMF pueden onsderarse transformaones tpo wavelet, on freuena son sólo aproxmadamente ortonormales y se han usado en ompresón de mágenes. Un

42 6 Capítulo. Representaón de mágenes sero nonvenente para las aplaones de tratamento de señales, es que, al gual que las wavelets, no son nvarantes a traslaones. La prnpal araterísta que defne a una transformaón wavelet es su smpldad, ya que las funones base son traslaones, dlataones y rotaones de una msma funón (una ntroduón puede verse en Strang, 989). Además, una transformaón wavelet puede mplementarse reursvamente de manera smlar a la prámde laplaana. La teoría de la multrresoluón de Mallat (989) fue la que estableó el nexo entre la transformada wavelet del análss armóno y los banos de fltros para el tratamento de señales dsretas. Esta onexón permtó que la transformada wavelet, defnda nalmente en el domno ontnuo, pudera alularse, para ambos de esala guales a potenas de dos, on algortmos rápdos basados en banos de fltros. Las transformaones wavelet han demostrado ser muy adeuadas para odfar mágenes efentemente, y tambén se han utlzado on éxto en muhas otras tareas de tratamento de señales. Una de las propedades más atratvas de las transformaones wavelet es que representan la señal on un onjunto de funones base relaonadas medante traslaones, dlataones y rotaones. Estos operadores orresponden a transformaones físas típas de las señales. Como las funones base tenen esta relaón tan smple, uno esperaría que los oefentes de la transformaón se omportaran tambén de manera senlla al trasladar, dlatar o rotar la señal de entrada. Sn embargo, éste no es el aso, y el alasng debdo al muestreo ríto (que la ortogonaldad exge) es a menudo problemáto en las aplaones de tratamento y análss de mágenes. Por ejemplo, en el domno espaal, a uno le gustaría que la representaón de magen tratara su entrada de manera unforme, ndependentemente del alneamento de ésta respeto al patrón de muestreo. Sn embargo, esta nvaranza a traslaón no es posble en un sstema basado en onvoluones y submuestreos. En este tpo de sstemas, sólo es posble onsegur una erta nvaranza a traslaón, entendda omo que toda la nformaón ontenda dentro de una subbanda permanee en dha subbanda uando se desplaza la señal de entrada. Una ondón neesara y sufente para esta forma de nvaranza es el rtero de Nyqust. Como las transformaones en subbandas on muestreo ríto (omo las basadas en fltros QMF y wavelets) típamente volan el rtero de Nyqust, la nformaón se desplaza de unas bandas a otras tras una traslaón. Este problema se produe tambén en esala y orentaón, de forma que las transformaones wavelet no se omportan ben ante dlataones o rotaones de la señal de entrada. Es posble obtener transformaones (típamente sobreompletas) en las que la nformaón es nvarante a traslaones, dlataones o

43 . Coneptos generales 7 rotaones. Un ejemplo es la prámde dreonable (Smonell et al., 99) que presenta esta forma relajada de nvaranza onjuntamente en espao y orentaón. Las funones base son traslaones, dlataones y rotaones de una úna funón, y la transformaón es autonvertble y se onstruye omo una prámde reursva. La prámde es muy sobreompleta, ya que hay (4k-3)/3 vees más oefentes en la representaón que píxeles en la magen orgnal, sendo k el número de orentaones onsderadas. El aráter sobreompleto lmta la efena omputaonal, pero, en ambo, hae que aumente la utldad de la representaón en numerosas tareas de tratamento y análss de mágenes, y sobre todo en modelos de nspraón bológa. Un ejemplo de representaón de mágenes sobreompleta, multpropósto, e nsprada en la vsón bológa, es la desarrollada en el Departamento de Imágenes y Vsón del Insttuto de Ópta (Navarro y Tabernero, 99; Tabernero, 99; Navarro et al., 996), que además de onsttur un modelo esquemáto de la representaón en el órtex vsual, se ha usado on éxto en dversas tareas de tratamento y análss de mágenes, tales omo la fusón de mágenes, el análss y la síntess de texturas y la restauraón ega de rudo. Por otro lado, numerosos autores han propuesto extensones no-lneales de desomposones multesala, para su uso en tratamento de mágenes. Por ejemplo, pueden obtenerse prámdes no-lneales susttuyendo los fltros lneales por fltros nolneales omo los de medana, morfológos o de rango de orden. Análogamente, exsten muhas desomposones no-lneales basadas en desomposones lneales on muestreo ríto, tales omo las desomposones morfológas en subbandas, las basadas en estadístos de orden en subbandas y las morfológas wavelet.. Representaones lneales de mágenes En este apartado, sn pretender ser exhaustvos, veremos algunas de las representaones lneales de mágenes más mportantes. Insstremos sobre todo en aquellas representaones que se utlzan en esta Tess, entrándonos en sus araterístas más relevantes y presndendo en lo posble del formalsmo matemáto. Las transformaones onjuntas lneales se dvden básamente en: transformaones en subbandas y prámdes. En las transformaones en subbandas, las subbandas se obtenen onvoluonando la magen on un bano de fltros lneales. Un aso espeal de desomposón en subbandas son las transformaones lneales basadas en bloques, entre las que destaa la popular DCT. Las transformaones pramdales son tambén un tpo partular de transformaón en subbandas, en el que el fator de submuestreo se

44 8 Capítulo. Representaón de mágenes multpla por dos en ada etapa. Esto da lugar a varas subbandas de dstntos tamaños (de ahí el nombre de prámde) que orresponden a dferentes bandas de freuena. Muy relaonadas on las transformaones pramdales, las transformadas wavelet son transformaones en subbandas que proporonan ntrínseamente una estrutura de datos multrresoluón muy útl en numerosas aplaones... Transformada dsreta del oseno (DCT) La transformada dsreta del oseno (Dsrete Cosne Transform o DCT) (Ahmed et al., 974) es lneal, ortogonal y proporona una representaón de la magen en la que ada oefente está asoado a una erta regón de la magen y una banda de freuena. Otros ejemplos lásos de transformaones lneales ortogonales son la transformada dsreta de Fourer (Dsrete Fourer Transform o DFT), que desompone una señal en omponentes de freuena snusodales, y la transformada de Karhunen-Loeve (Karhunen-Loeve Transform o KLT). Estas transformaones se obtenen realzando el produto nterno de una señal de tamaño fnto on un onjunto de funones base. En el aso de la DCT, las funones base son reales y exsten algortmos rápdos para el álulo de la transformaón en una o dos dmensones basados en asadas de álulos en marposa. En onreto, el álulo de la DCT de un vetor de tamaño N x requere del orden de N log N operaones s se utlza una transformada rápda de Fourer (Fast Fourer Transform o FFT) de N puntos. Una propedad mportante de la transformaón es que empaqueta la energía de la señal muy efentemente en unos poos oefentes. En térmnos de ompataón de la energía, la DCT se aera bastante a la KLT, que es teóramente la transformaón lneal ortonormal óptma, sendo muho más fál de mplementar que ésta últma. En la práta, la DCT habtualmente no se alula globalmente sno que se apla ndependentemente a subbloques sn solapamento de la magen. S {x,j } es un bloque 8 x 8 de la magen, los oefentes {d k,l } de la DCT venen dados por la expresón: 7 7 ( k) ( l) ( + ) k π ( j + ) l π d k, l = x, j os os (.3) 4 = 0 j= donde k, l = 0,,..., 7 y ( k / s k = 0, ) = en el resto. La DCT por bloques onsttuye una transformaón en subbandas, s ben las subbandas no están muy ben loalzadas, por lo que ontenen gran antdad de

45 . Representaones lneales de mágenes 9 alasng. No obstante, omo la transformaón es nvertble (ortogonal de heho), el alasng de las subbandas se anela en la etapa de síntess. El problema vene uando los oefentes de la transformaón se uantzan o desartan (por ejemplo en un sstema de odfaón), en uyo aso el alasng en general ya no se anela y apareen errores en forma de artefatos en la magen reonstruda. Este efeto de bloques es espealmente vsble en aquellas regones de la magen on pequeña varanza loal y es un sero nonvenente del tratamento por bloques. A pesar de ello, la DCT por bloques es una representaón muy popular que se ha utlzado en varas aplaones de tratamento de mágenes, sobre todo en ompresón de mágenes. De heho, fue la representaón elegda para el estándar nternaonal de ompresón de mágenes JPEG... Prámde laplaana Una prámde se araterza por que las funones base y las de proyeón son versones desplazadas y dlatadas (sempre en una potena de dos) de una erta funón. Las subbandas (en otavas) se obtenen onvoluonando y submuestrando, nrementándose en ada etapa el fator de submuestreo en un fator dos (las subbandas van sendo ada vez más pequeñas y de ahí el nombre de prámde). Una prámde es una estrutura de datos dseñada para permtr onvoluones esaladas efentes sobre versones redudas de la magen orgnal, y onsste en una seuena de opas de la magen en la que tanto la freuena de muestreo omo la resoluón van dereendo a ntervalos regulares. Este tpo de transformaón se ha utlzado en numerosas aplaones, tales omo ompresón, odfaón y denosng. Además, el maro de las desomposones pramdales permte la onstruón de esquemas multrresoluón basados en dferentes operaones no-lneales, dando lugar a un ro onjunto de esquemas muy útles para muhas aplaones. Una de las prmeras desomposones pramdales fue desarrollada por Burt (98) y aplada a la odfaón de mágenes por Burt y Adelson (983). Estos autores utlzaron una asada pramdal de fltros gaussanos para rear una representaón en subbandas sobreompleta a la que llamaron prámde laplaana. La prámde laplaana se onstruye reursvamente y además permte reonstrur exatamente la magen orgnal de forma muy senlla y tambén reursva, smplemente reonstruyendo la prámde gaussana (ada nvel se obtene nterpolando el nvel nmedatamente nferor y sumándolo al orrespondente nvel de la prámde laplaana) y sumando todos sus nveles. Esta transformaón pramdal ofree un maro de baja omplejdad omputaonal, on poa redundana y que puede extenderse fálmente a un número

46 0 Capítulo. Representaón de mágenes mayor de dmensones. El aráter paso banda de la prámde laplaana tende a realzar ertas araterístas de las mágenes, omo son los bordes, mportantes para la nterpretaón de las mágenes. Estas araterístas quedan separadas según la esala, en los dferentes nveles de la prámde. Al gual que en la transformada de Fourer, los oefentes de la prámde laplaana están loalzados en el domno de la freuena espaal, pero a dferena de la prmera, los oefentes representan además regones loales en el domno espaal. La prámde laplaana tambén tene algunos nonvenentes. Por ejemplo, la transformaón no es ortogonal, lo ual es una fuente de problemas, tales omo que los errores de uantzaón en las subbandas paso alto se propagan a otras subbandas y se onverten en rudo on gran anho de banda en la magen reonstruda, o que los oefentes de nveles dferentes están orrelados. Como no exste un modelo laro de esta orrelaón, es dfíl saber s las semejanzas entre detalles de la magen a dferentes resoluones se deben a la propa magen o a la redundana ntrínsea de la representaón. Por otro lado, la base de funones es sobreompleta, neestándose /3 vees más oefentes que píxeles en la magen orgnal. A pesar del sobremuestreo, la prámde laplaana permte la ompresón de la nformaón, ya que el valor de los oefentes tende a ser muy próxmo a ero, de modo que estos pueden representarse on un número redudo de bts. Sn embargo, en aplaones de ompresón, en lugar de la prámde laplaana, normalmente se usan transformaones omo las transformadas wavelet, típamente ortogonales y on muestreo ríto. Una ventaja de la prámde laplaana respeto a las transformaones ortogonales on muestreo ríto, es que ada nvel de la prámde genera una úna señal paso banda, de modo que es fál aplar a la prámde dferentes algortmos multrresoluón basados en una estratega de grueso a fno. Además, omo sólo se submuestrea el anal paso bajo, la prámde no sufre el problema del salto de freuenas y permte desomponer nuevamente en subbandas las mágenes paso banda, sendo posble por ejemplo aplar banos de fltros dreonales sobre éstas para obtener así subbandas dreonales a varas esalas. El heho de que las funones base de la transformaón no estén orentadas es un nonvenente, puesto que así no es posble extraer las estruturas orentadas que se enuentran típamente en las mágenes. Esto lmta la utldad de la prámde laplaana en aplaones de reonomento de patrones, omo por ejemplo la dsrmnaón de texturas. A pesar de estos nonvenentes, la prámde laplaana se ha utlzado on éxto en aplaones omo la odfaón de vídeo por ompensaón de movmento, ya que el aráter sobreompleto de la prámde le otorga robustez frente a los errores. Además,

47 . Representaones lneales de mágenes debdo a su naturaleza multesala, la prámde es muy adeuada para la transmsón progresva de mágenes, que onsste en envar prmero una versón de baja resoluón de una magen para luego r envando de forma gradual la nformaón de más alta resoluón. En el aso de la prámde laplaana, esto se onsgue fálmente, envando los oefentes de la transformaón ordenadamente, desde el nvel más alto hasta el más bajo...3 Desomposones en subbandas En los últmos años, las desomposones en subbandas de mágenes se han onvertdo en un tema de ntenso estudo. Las transformaones en subbandas generalmente se obtenen onvoluonando la señal de entrada on un onjunto de fltros paso banda y submuestreando los resultados. Cada subbanda representa una erta porón del espetro de freuenas y ontene nformaón de la señal perteneente a una erta esala espaal. Como en el aso de la prámde laplaana, la naturaleza multesala de la transformaón falta la transmsón progresva multrresoluón de la magen. La reonstruón de la señal es muy senlla, ya que basta nterpolar las subbandas y sumarlas todas. Una ventaja de las transformaones en subbandas propamente dhas frente a la DCT por bloques, es la ausena del efeto de bloques. Otros artefatos, omo las dstorsones en torno a los bordes on alto ontraste debdas al fenómeno de Gbbs, se mantenen, pero pueden redurse o nluso elmnarse on un adeuado dseño del bano de fltros. En este apartado se desrben dos mportantes transformaones en subbandas, que se aplarán en el desarrollo de esta Tess. Éstas son las transformaones basadas en fltros QMF y la prámde dreonable, que, omo se verá a ontnuaón, tenen propedades bastante dferentes. Desomposones basadas en fltros QMF Los fltros espejo en uadratura (Quadrature Mrror Flter o QMF), ntrodudos por Johnston (980), onsttuyen uno de los métodos mejor onodos para el dseño de banos de fltros. Las transformaones basadas en fltros QMF reúnen las sguentes araterístas: son multesala, orentadas, espaalmente loalzadas y ortogonales (por ser ortogonales, los errores de uantzaón permaneen dentro de las respetvas subbandas). Un aspeto negatvo es que la desomposón en orentaón no es ompleta, sno que la nformaón de las dos orentaones dagonales se halla mezlada

48 Capítulo. Representaón de mágenes en una msma subbanda. Por otro lado, aunque el alasng se anela globalmente, las subbandas presentan alasng (éste puede mnmzarse on un adeuado dseño de los fltros). Las funones base QMF ofreen una buena loalzaón onjunta en el domno espaal y de la freuena espaal, y pueden agruparse en asada para formar bases ortonormales autosmlares. Además, pueden adaptarse en freuena y orentaón, y permten una mplementaón efente. Los fltros QMF no son fltros de reonstruón perfeta, pero tenen fase lneal (son smétros). Varos autores han estudado el dseño e mplementaón de estos fltros. Por ejemplo, Smonell (988) dseñó un onjunto de fltros on un número mpar de oefentes, utlzando un método de muestreo de freuena y onsderando un rtero de error smlar al de Johnston. Sguendo este proedmento, las funones base que se obtenen para una prámde QMF de 4 nveles, a partr de un fltro de 9 oefentes, son las que se muestran en la Fgura.. Habtualmente, los fltros QMF se aplan sobre las mágenes de una manera separable, lo ual representa una gran ventaja omputaonal. Para obtener una prámde multesala, la transformaón se apla reursvamente a la submagen paso bajo. Esta transformaón en asada dvde el domno de freuena en subbandas orentadas dstrbudas en otavas. Las ventajas de las transformaones basadas en fltros QMF son muhas. Por ejemplo, estas transformaones proporonan desomposones en subbandas ortogonales sn estableer bordes arbtraros omo la DCT por bloques. Además, la dstorsón y la nefena omputaonal, que araterzan a las subbandas abruptas (on forma de funón sn), se reduen onsderablemente medante el uso de fltros relatvamente pequeños y on transones suaves (nótese que el alasng se anela globalmente). Prámde dreonable Un onjunto de fltros forma una base dreonable s los fltros son opas rotadas unos de otros y además puede obtenerse una opa de un fltro en ualquer orentaón a partr de una ombnaón lneal de los fltros de la base. La prámde dreonable (Smonell y Freeman, 995) es una desomposón en la que las mágenes se dvden en subbandas loalzadas tanto en esala omo en orentaón. En esala, las subbandas están dstrbudas en otavas. En orentaón, la prámde puede dseñarse para generar ualquer número de orentaones k, de modo que la transformaón resultante es

49 . Representaones lneales de mágenes 3 Fgura.: Funones base de una transformaón de 4 nveles basada en un fltro QMF de 9 oefentes. Las funones base se muestran a la zquerda y sus transformadas de Fourer a la dereha. Las transformadas de Fourer están dbujadas entre 0 y π sobre ejes lneales. (Smonell y Adelson, 990). sobreompleta, on un fator de sobremuestreo de 4k/3. Las funones base son traslaones, dlataones y rotaones de una msma funón y forman onjuntos

50 4 Capítulo. Representaón de mágenes dreonables. La transformaón se onstruye omo una prámde reursva y es desplazable tanto en espao omo en orentaón, querendo der on esto que la potena de los oefentes de la transformaón en una subbanda se onserva uando se desplaza la magen de entrada, y que la potena de los oefentes en una erta posón y esala es nvarante ante ambos en la orentaón de la magen de entrada (en otras palabras, la transformaón es desplazable porque umple el rtero de Nyqust en el domno espaal y además es dreonable). Además, la transformaón es autonvertble y prátamente no tene alasng. Por otro lado, se han propuesto dversas extensones y mejoras a la prámde dreonable, omo por ejemplo los fltros deformables de Portlla (999), no sólo dreonables en orentaón sno tambén en esala. Un nonvenente de la prámde dreonable es la falta de ortogonaldad, que hae que exstan orrelaones mportantes entre los oefentes de la transformaón (ver Fgura.). Sn embargo, la prámde dreonable presenta algunas de las ventajas de las transformaones en subbandas ortonormales (p.ej., las funones base están loalzadas en espao y freuena espaal, y la transformaón es autonvertble) y mejora algunos de los nonvenentes de éstas (p.ej., no hay alasng, y la desomposón en orentaón es dreonable). Otro nonvenente de la prámde dreonable es el aráter maradamente sobreompleto de la representaón, que hae que la efena omputaonal sea menor que en el aso de las representaones on muestreo ríto. No obstante, en muhas aplaones meree la pena pagar ese preo, debdo a las ventajas que trae onsgo la desplazabldad de la desomposón. Fgura.: Hstograma ondonal de dos oefentes venos ( j es veno nferor de ) en la subbanda vertal de la esala más baja, de la prámde dreonable de la magen estándar Ensten.

51 . Representaones lneales de mágenes 5..4 Transformadas wavelet La mayor parte de las mplementaones de esta Tess utlzan transformadas wavelet en la etapa lneal. La teoría wavelet proporona un maro unfado en el que se engloban varas ténas que se desarrollaron ndependentemente para dferentes aplaones de tratamento de señales (Roul y Vetterl, 99). Por ejemplo, el tratamento multrresoluón de señales (Mallat, 989), usado en vsón artfal; la odfaón en subbandas para omprmr mágenes y audo; y los desarrollos en seres wavelet, usados en las matemátas apladas (Daubehes, 990), pueden onsderarse elementos dferentes de una msma teoría. La teoría wavelet se basa en analzar las señales utlzando un onjunto de funones base. La dea fundamental es analzar las señales a dferentes esalas, o resoluones, y por eso se trata de una téna multrresoluón. Las wavelets son una lase de funones usadas para loalzar una señal smultáneamente en el domno espaal y en el de la esala, y utlzan el onepto de autosmltud. Una funón wavelet nal, llamada funón madre y que se dseña para que presente ertas araterístas deseadas, se usa para generar todas las funones base. En una formulaón multrresoluón, se neesta tambén una segunda funón, que se llama funón de esalado. La wavelet madre es típamente un fltro paso banda y por tanto el resto de fltros tambén lo son, por ser opas esaladas de éste. La famla de wavelets se onstruye ensanhando o omprmendo la wavelet madre para ambar así el tamaño de la ventana de análss. De esta forma, las wavelets grandes dan una dea de la señal, mentras que las pequeñas haen un zoom de los detalles. Un pequeño ambo en la representaón wavelet genera sólo un pequeño ambo en la señal reonstruda, lo que sgnfa que los errores loales no ehan a perder toda la transformaón. La transformada wavelet es espealmente adeuada para analzar señales no-estaonaras, tales omo las señales de muy pequeña extensón y las que tenen omponentes nteresantes a dferentes esalas. Una representaón wavelet está a aballo entre el domno espaal y el de Fourer. El álulo puede haerse efentemente graas a la exstena de algortmos pramdales basados normalmente en fltros QMF. Además, es posble reonstrur la señal orgnal utlzando algortmos smlares. Los sstemas multtasa y los banos de fltros juegan un mportante papel en los sstemas wavelet. La transformada wavelet desompone una señal utlzando un erto onjunto de funones base wavelet. S representamos on ψ(x) la wavelet madre (que debe umplr que ψ ( x) dx = 0 ), el resto de wavelets pueden obtenerse smplemente esalando o desplazando ψ(x) omo sgue:

52 6 Capítulo. Representaón de mágenes x b ψ a, b ( x) = ψ (.4) a a Normalmente, el esalado es dsreto y dádo, de modo que a = -j. El desplazamento se dsretza on respeto a ada esala, sendo b = k -j T. Así, las funones base venen dadas por: j ( x k T ) j / ψ ( x) = (.5) j, k ψ El entero j, se suele denomnar esala, y representa la freuena de la funón wavelet o desplazamento del espetro. El entero k, por su parte, representa el desplazamento de la wavelet y está relaonado on la dmensón espaón en la transformada wavelet. Esta parametrzaón de la esala y el espao resulta muy adeuada. En la formulaón multrresoluón, además de la funón ψ(x) se neesta otra funón ϕ(x), llamada funón de esalado. El esalado y el desplazamento de ϕ(x) se defnen de manera smlar a los de ψ(x). Así, la desomposón wavelet de una señal y(x) vene dada por (Burrus et al., 998): y ( x) = k j k x + dj k 0, ( ), ψ j, k k k j= j ϕ ( x) (.6) 0 Para wavelets reales y ortogonales, las expresones que relaonan los oefentes wavelet on la señal orgnal son las sguentes: k = y( x) ϕ j, k ( x) dx (.7) 0 d j, k = y( x) ψ j, k ( x) dx (.8) S las wavelets son bortogonales, las funones madre y de esalado apareen por parejas, ψ(x), ψ ~ ( x ) y ϕ(x), ϕ ~ ( x ). En este aso, una de las parejas de funones se utlza para el análss y la otra para la síntess, y los oefentes wavelet se obtenen a partr de las sguentes expresones:

53 . Representaones lneales de mágenes 7 k = y( x) ϕ ~ j, k ( x) dx (.9) 0 d = y x ~ j, k ( ) ψ j, k ( x) dx (.0) En la mayoría de las aplaones de las transformadas wavelet, se requere que la señal orgnal pueda ser reuperada a partr de los oefentes wavelet. Esta ondón se onoe on el nombre de reonstruón perfeta. En ambo, en otras aplaones tales omo el reonomento de patrones, esta ondón puede relajarse. En el aso de reonstruón perfeta, s se quere representar de forma ompata la señal y utlzar el msmo onjunto de wavelets tanto para el análss omo para la síntess, las wavelets deben ser ortogonales. S se utlzan dos onjuntos de wavelets dferentes para el análss y la síntess, entones la ondón de reonstruón perfeta es equvalente a la ondón de bortogonaldad. En el domno dsreto, la transformada wavelet rebe el nombre de transformada wavelet dsreta (Dsrete Wavelet Transform o DWT). El álulo efente de los oefentes de la DWT se realza normalmente medante un onjunto partular de fltros multtasa. Los fltros usados para el álulo de la transformada se denomnan fltros de análss y aquellos usados para el álulo de la transformada nversa, se denomnan fltros de síntess. Los oefentes de estos fltros, normalmente on respuesta fnta al mpulso (Fnte Impulse Response o FIR), se obtenen a partr de las funones wavelet madre y de esalado. A dferena de las transformaones del tpo de la de Fourer, que están basadas en un onjunto partular de funones base, exsten muhas bases wavelet dstntas on dferentes araterístas. El heho de que una base wavelet dada sea útl en una erta aplaón, en absoluto mpla que tambén lo sea en ualquer otra aplaón. Por tanto, la eleón de la base wavelet debe haerse on udado para ada aplaón. En general, el objetvo es rear una funón wavelet madre que dé una desrpón nformatva, efente y útl de la señal de nterés. Como el ontendo de la mayoría de las mágenes varía suavemente, es razonable usar una funón wavelet madre suave para analzar las mágenes. No es senllo dseñar un proedmento unforme para desarrollar la mejor wavelet madre o transformada wavelet para una lase dada de señales. Sn embargo, basándose en las araterístas generales de las funones wavelet, es posble determnar qué wavelets son más adeuadas para una erta aplaón. En la práta, las wavelets ompatas on soporte fnto (FIR) son las más utlzadas debdo a su relaón on los banos de fltros multrresoluón. Entre estas

54 8 Capítulo. Representaón de mágenes wavelets, las más usadas se dvden en dos lases: ortogonales y bortogonales. Las wavelets ortogonales desomponen las señales en espaos ortogonales on un buen omportamento. En onreto, la ortogonaldad tene dos buenas araterístas: las funones wavelet madre y de esalado de análss son guales a las de síntess, y además se elmnan las orrelaones de la señal entre subespaos. En este aso, los fltros de análss y de síntess no son smétros (la smetría puede ser neesara en algunas aplaones de tratamento de mágenes), y no exsten expresones explítas para las funones madre y de esalado. Es deseable que los fltros wavelet sean smétros, ya que así la transformada wavelet orrespondente puede mplementarse usando ondones de frontera de tpo espejo, que reduen los artefatos en los bordes. Por desgraa, aparte de la wavelet de Haar (un aso trval), no exste nnguna otra wavelet que sea a la vez ortogonal y smétra. Para onsegur la smetría, debemos relajar la ondón de ortogonaldad usando bases bortogonales. Las wavelets bortogonales son más ompladas y se defnen, omo hemos vsto, a partr de pares de funones wavelet madre y de esalado. Esta mayor flexbldad es la que permte forzar que los fltros de análss y de síntess sean smétros, lo ual es mportante en aquellas aplaones que requeren fltrados on fase lneal. Exsten muhas funones que son ortogonales, pero algunas de estas funones son muy rregulares, nluso de naturaleza fratal. Esto puede ser onvenente para analzar señales rregulares o fratales, pero ertamente no lo es para la mayoría de las señales e mágenes. El número de momentos evanesentes de la funón wavelet madre ψ(x) está relaonado on la suavdad y la dferenabldad de dha funón, así omo de la de la funón de esalado ϕ(x). Fjado el orden de los fltros wavelet FIR, Daubehes (990) onstruyó wavelets on regulardad máxma, maxmzando el número de momentos nulos de la funón madre ψ(x). Dhas wavelets se denomnan wavelets de Daubehes y son las que hemos elegdo en el desarrollo de esta Tess. Algunos ejemplos pueden verse en la Fgura.3. En general, todas las wavelets ortogonales son asmétras, omo sabemos. En algunas aplaones, s las wavelets son smétras o no, no es mportante. Sn embargo, en otras aplaones esto puede ser relevante. Por ejemplo, en las aplaones de tratamento de magen, ya que el SVH tolera mejor los errores smétros que los asmétros. Además, las wavelets smétras permten tratar los bordes de la magen de manera más senlla. La smetría perfeta sólo es posble en fltros wavelet omplejos, wavelets bortogonales, wavelets on soporte nfnto y mult-wavelets. En la mayoría de las aplaones se desea que los oefentes de los fltros sean reales, por lo que las wavelets bortogonales son la úna opón s se requeren wavelets smétras. Las

55 . Representaones lneales de mágenes 9 Fgura.3: Ejemplos de wavelets de Daubehes. ψ es la funón madre y ϕ es la funón de esalado. Los subíndes representan el orden del fltro wavelet orrespondente (en el aso de wavelets ortogonales es sempre un número par). wavelets bortogonales omúnmente están basadas en funones splne. Algunos ejemplos de estas wavelets se muestran en la Fgura.4. En este aso, hay dos funones madre, ψ(x) y ψ ~ ( x ), una para análss y otra para síntess, y dos funones de esalado, ϕ(x) y ϕ ~ ( x ), sendo nterambable el papel de los fltros de análss y de síntess. Las transformadas wavelet han demostrado ser muy útles en la odfaón de mágenes y en onseuena, muhos esquemas de ompresón de mágenes usan estas transformaones. Así por ejemplo, el reente estándar nternaonal de ompresón de mágenes JPEG 000 está basado en dos transformaones wavelet bortogonales (las transformadas 5/3 y 9/7). En ompresón de mágenes, es muy mportante dsponer de una representaón efente de las mágenes. Idealmente, querríamos representar una magen on un número pequeño de parámetros. Las transformadas wavelet proporonan una representaón así, ya que la mayoría de los oefentes wavelet de una magen típa valen prátamente ero, de modo que la magen puede aproxmarse on un número pequeño de oefentes de valor alto. El motvo de la efena de la representaón wavelet es que las mágenes son señales no-estaonaras que pueden

56 30 Capítulo. Representaón de mágenes Fgura.4: Ejemplos de wavelets bortogonales. ψ y ψ ~ son las funones madre de análss y síntess respetvamente, y ϕ y ϕ ~ las funones de esalado. Los subíndes apareen por parejas, representando el prmero, el orden del fltro paso bajo de análss y el segundo, el orden del fltro paso bajo de síntess (a dferena del aso ortogonal, el orden de los fltros puede ser par o mpar, sendo la úna restrón que la dferena sea par). modelarse omo un onjunto de regones suaves loalmente, separadas por bordes. Dentro de estas regones suaves, el valor de los oefentes wavelet ae rápdamente desde las esalas gruesas a las fnas, sendo muy pequeño en las esalas fnas. En el vendaro de los bordes, el valor de los oefentes wavelet ae muho más lentamente, pero, debdo al aráter loal del soporte de los fltros wavelet, relatvamente poos oefentes se ven afetados por los bordes..3 Representaones no-lneales de mágenes En los últmos años, se ha extenddo el uso de fltros no-lneales en aquellos problemas de tratamento de mágenes en los que los métodos lneales no son apropados. Los fltros no-lneales pueden lasfarse fundamentalmente en tres tpos: fltros de medana, morfológos y estadístos de orden.

57 .3 Representaones no-lneales de mágenes 3 Las transformaones pramdales son espealmente adeuadas para mplementar sobre ellas métodos no-lneales. El aráter sobreompleto de estas transformaones proporona flexbldad a la hora de elegr fltros para los operadores no-lneales. Por ejemplo, susttuyendo los fltros lneales por fltros de medana (Stark et al., 995; Melnk et al., 000; Asghar y Barner, 00), operadores morfológos (Toet, 989; Goutsas y Hejmans, 000) o fltros de rango de orden (Peng et al., 999), pueden obtenerse desomposones multrresoluón no-lneales. Por otro lado, tambén se han onstrudo banos de fltros no-lneales a partr de desomposones on muestreo ríto. Estos se obtenen a menudo utlzando métodos de dseño e mplementaón, omo la estrutura en esalera y el esquema lftng, pensados nalmente para desomposones lneales en subbandas. Ejemplos de banos de fltros no-lneales on muestreo ríto son las desomposones morfológas en subbandas (Egger et al., 995; Hampson y Pesquet, 998; Queroz et al., 998), las desomposones en subbandas basadas en estadístos de orden (Salember y Kunt, 99; Bangham et al., 994; Are y Tan, 996) y las desomposones morfológas wavelet (Egger y L, 994; Egger et al., 999; Hejmans y Goutsas, 000). Además, se han propuesto representaones no-lneales de mágenes basadas en meddas loales de ontraste (p.ej., Pel, 990). En estas representaones, habtualmente se dvde ada uno de los oefentes de una transformada wavelet entre el valor medo de la lumnana loal, para obtener así oefentes multesala de ontraste que de una forma natural dan lugar a representaones pramdales (Tabernero, 99; Nestares et al., 998). En esta Tess, presentaremos una nueva representaón multrresoluón no-lneal de mágenes nsprada en el tratamento de nformaón en el órtex vsual prmaro (Smonell y Shwartz, 999; Shwartz y Smonell, 00). La no-lnealdad es de tpo dvsvo y está ben adaptada a la estadísta de las mágenes naturales. Con ello se onsgue que los oefentes de la representaón presenten mejores propedades estadístas y pereptuales que los de las wavelets y demás transformaones lneales ortogonales, de forma que la representaón es muy útl en numerosas aplaones de tratamento y análss de mágenes. Dado que esta es la dea entral de la Tess, ésta se desarrolla on mayor detalle en el sguente apítulo.

58

59 Capítulo 3 Representaón de mágenes en el sstema vsual humano El sstema vsual humano (SVH) es el sstema de tratamento y análss de mágenes más potente, flexble y robusto que se onoe hasta la feha. No es de extrañar por tanto, que, ada vez más, se trate de emular el SVH en aplaones de tratamento y análss de mágenes, y vsón artfal. Tampoo hay que olvdar que, en muhas de esas aplaones, el reeptor últmo de la nformaón vsual resultante es el ojo humano. Es por todo ello que entender los prnpos de funonamento del SVH ha obrado una gran relevana en este ampo de la ngenería. En este apítulo desrbmos brevemente el SVH. Centramos nuestro estudo en el órtex vsual prmaro (regón V), que desempeña un papel fundamental en la vsón y es la base de los modelos de vsón bológa utlzados en esta Tess. Una parte mportante del apítulo se deda a desrbr los prnpos generales de representaón de mágenes en V. Estos prnpos relaonan la representaón ortal on la estadísta de las mágenes naturales y son un mportante tema de nvestgaón hoy en día. Fundamentalmente podemos señalar dos orrentes, entre las que exste un amplo debate todavía sn errar: una defende que el prnpal objetvo de V es obtener una representaón efente de la magen y la otra pone el aento en el aráter dsperso y sobreompleto de la representaón. Estas dos orrentes, no ompletamente exluyentes sno relaonadas entre sí, han dado lugar a toda una sere de modelos funonales de V, algunos de los uales han sdo objeto de un mnuoso estudo en esta Tess. Fnalmente, el apítulo termna on una desrpón de la estrutura general de los modelos del SVH empleados hoy en día en tratamento y análss de mágenes. Estos modelos están basados sobre todo en la psofísa, sendo todavía poo freuentes los basados dretamente en aspetos neurobológos. Esta Tess apunta presamente en esta últma dreón. 33

60 34 Capítulo 3. Representaón de mágenes en el SVH 3. El sstema vsual humano En este apartado, se desrbe muy brevemente el SVH, haendo énfass en los aspetos más relevantes para esta Tess. Una desrpón más detallada puede enontrarse, por ejemplo, en Kandel et al. (99) y Wandell (995). La Fgura 3. muestra esquemátamente la anatomía del SVH. El SVH se araterza por tener una organzaón fundamentalmente modular y jerárqua, on bastante tratamento paralelo en ada etapa, y fuertes nteraones entre módulos dferentes a la hora de realzar una tarea determnada. El proeso de la vsón omenza en el ojo, que es básamente un sstema ópto que proyeta la esena 3D sobre la superfe esféra de la retna. Una vez formada la magen sobre la retna, ésta es detetada y muestreada por los fotorreeptores, que son fundamentalmente de dos tpos: onos y bastones. La densdad de fotorreeptores presenta un máxmo en la fóvea (orrespondente al entro del ampo vsual), donde la agudeza vsual es máxma. Al aumentar la exentrdad, el espaado entre fotorreeptores aumenta, perdéndose resoluón de forma progresva, y dando lugar a un muestreo de tpo log-polar del ampo vsual. Este es el ompromso adoptado por el SVH para resolver smultáneamente dos requermentos ontrapuestos, alta resoluón y gran ampo vsual, on un número lmtado de fotorreeptores. El proesamento neuronal omenza en la retna, donde exste un omplejo entramado de onexones que omprende varos nveles y tpos de élulas. En el últmo nvel se enuentran las élulas ganglonares, uyos axones (del orden de 0 6 ) forman el nervo ópto. Una de las funones prnpales de la retna es la ompresón de la nformaón, ya que se debe pasar de un total de unos 0 8 fotorreeptores, a tan sólo unas 0 6 élulas ganglonares. Fundamentalmente, la señal vsual es proesada en paralelo por dos vías vsuales, que llevan la señal desde la retna, pasando por el uerpo genulado lateral (CGL), hasta el órtex vsual prmaro (regón V). La prmera vía retnoortal se orgna en las élulas ganglonares de respuesta sostenda, on ampos reeptvos que presentan oponena romáta, mentras que la segunda vía se orgna en las élulas ganglonares de respuesta transtora, on nula o poa oponena romáta. Estas vías se denomnan vía parvoelular y magnoelular, respetvamente, dependendo de los substratos (ventrales o dorsales) del CGL sobre los que proyetan sus axones. Asmsmo, las élulas ganglonares que proyetan sus axones sobre los substratos ventrales (formados por élulas de pequeño tamaño) se denomnan parvoelulares, mentras que las que proyetan sus axones sobre los dorsales, se denomnan magnoelulares (debdo al gran tamaño de las élulas de estos substratos). La apadad de nformaón del órtex

61 3. El sstema vsual humano 35 vsual prmaro, donde exsten unas 0 9 neuronas, y en general de las otras regones superores, es muy superor que la de la retna o el nervo ópto, lo que lleva a pensar que la redundana aumenta, ya que no puede rearse nueva nformaón. Fgura 3.: El sstema vsual humano. En el órtex vsual, se sguen mantenendo las dos vías paralelas de tratamento paralelo, las uales transportan tpos de nformaón dferentes (movmento frente a olor y forma). La prmera vía (vía Dónde o Cómo ) se orgna en los substratos magnoelulares del CGL, y se proyeta a la regón V5 (tambén llamada temporal meda o MT) desde el substrato 4C α del órtex prmaro a través del 4B, ben dretamente o ben pasando por la regón V. La segunda vía (vía Qué ), parte del substrato 4C β de la regón V para proyetarse sobre los substratos y 3, de ahí a las lámnas de la regón V y después a la regón V4. Regones omo la MT y la V4 se proyetan dretamente haa regones vsuales del lóbulo paretal y frontal que ntervenen en la atenón, la memora operatva (memora a orto plazo) y la planfaón motora. Como lustra la Fgura 3., mentras que las regones vsuales dorsales (regones paretales) se oupan del razonamento espaal y de analzar la nformaón neesara para guar aones drgdas haa objetos (tales omo apuntar, alanzar y oger), las regones ventrales (regones temporales) se enargan de la perepón de patrones omplejos y el reonomento de formas y objetos.

62 36 Capítulo 3. Representaón de mágenes en el SVH Vía Dónde Vía Qué Fgura 3.: Vías Qué y Dónde del sstema vsual. Éstas nluyen regones espealzadas en el tratamento de nformaón de profunddad (representado por unas gafas), forma (ángulo), olor y dreón (señal de urva pelgrosa). La vía Qué se enarga del reonomento de objetos, mentras que la vía Dónde permte la loalzaón de los msmos. 3. El órtex vsual prmaro (V) El órtex vsual prmaro, tambén llamado órtex estrado, área 7 de Brodmann o regón V, es probablemente la regón ortal que mejor se onoe desde un punto de vsta tanto morfológo omo fsológo. Por otro lado, el órtex vsual prmaro desempeña un papel fundamental en la vsón. Para empezar, onsdérese el heho de que toda la nformaón vsual proedente de la retna pasa por la regón V. Desde hae más de un sglo se sabe que ualquer daño en esta regón produe prátamente una eguera total. Además, la regón V no se lmta a servr de puente entre el CGL en el tálamo y las otras regones ortales, sno que transforma onsderablemente las entradas que rebe del CGL. En omparaón on los relatvamente smples ampos reeptvos de tpo entro/perfera de las neuronas del CGL, los ampos reeptvos de las neuronas de V son muho más omplejos, de forma que estas neuronas responden más seletvamente a araterístas vsuales espeífas. Fnalmente, hay que tener en uenta que la regón V es la regón vsual ortal de mayor tamaño y la más ompleja, ya que tene un mayor número de neuronas y una estrutura fuertemente lamnar ( estrada ).

63 3. El órtex vsual prmaro (V) 37 Comenzando on los trabajos de Hubel y Wesel (96), la medón de las respuestas de las neuronas de V (en forma de potenales de aón) ha proporonado abundante nformaón aera de los posbles meansmos bofísos y boquímos de estas neuronas, así omo del tratamento que realzan de la nformaón vsual. Las nvestgaones de las últmas déadas, han mostrado que la respuesta seletva frente a estímulos juega un papel fundamental en el análss de la nformaón vsual en el sstema vsual de humanos, prmates y espees relaonadas. Más onretamente, en el órtex vsual, ada neurona está adaptada a unas ertas araterístas vsuales. Por tanto, podemos medr las respuestas en funón de las dferentes dmensones que araterzan a los estímulos vsuales, omo, por ejemplo, posón, orentaón, freuena espaal, freuena temporal, dreón del movmento, ontraste, olor, et. Cada neurona del órtex vsual prmaro responde únamente a un ntervalo espeífo de valores en un espao multdmensonal de araterístas (no neesaramente ntutvo). Debdo a su aráter seletvo, la respuesta de ada neurona ontene nformaón aera de la presena o ausena de una erta araterísta vsual, de manera que meansmos erebrales subsguentes pueden utlzar esta nformaón para detetar, segmentar e dentfar dhas araterístas vsuales. En su ntento de araterzar la estrutura y la funón de las neuronas de órtex vsual, muhos neuroentífos han utlzado las ténas de análss de sstemas. En ese ontexto, las neuronas de V pueden modelarse omo fltros espao-temporales que son funón de las dferentes dmensones del estímulo. Así por ejemplo, los estímulos y las respuestas se pueden analzar en el domno de la freuena, en el domno espaal y/o temporal, en el llamado domno de rudo blano, et. Todos estos métodos se han aplado al estudo de las neuronas del órtex vsual. Un onepto fundamental es el de ampo reeptvo. El ampo reeptvo láso de una neurona del SVH se defne omo el área del espao vsual que nfluye en la respuesta de dha neurona (Levne y Shefner, 99), es der, es lo que ve la neurona. Este onepto juega un papel mportante en el maro de análss usado por los neurofsólogos para estudar las neuronas on respuesta a los estímulos vsuales, ya que permte araterzar la relaón que exste entre la magen vsual y la respuesta neuronal. Los ampos reeptvos de las neuronas de V (ver Fgura 3.3) son funón de una sere de omponentes del espao de araterístas de los estímulos vsuales. Entre estas omponentes están la posón en el ampo vsual, el ojo de orgen (domnana oular), la orentaón, la dreón de movmento, la freuena espaal y la dspardad. Una propedad omún de la arqutetura ortal es la organzaón olumnar. Ésta onsste en que las neuronas stuadas perpendularmente a la superfe de V, en una

64 38 Capítulo 3. Representaón de mágenes en el SVH Fgura 3.3: Campos reeptvos de las élulas smples y omplejas de V. El ampo reeptvo de las élulas smples presenta dos subregones alargadas que responden a estímulos brllantes (+) u osuros (-). Las élulas omplejas, sn embargo, responden tanto a estímulos brllantes omo a osuros en ualquer posón de su ampo reeptvo. (DeAngels et al., 995). msma olumna, responden aproxmadamente de la msma manera ante un estímulo vsual. Sn embargo, las repuestas varían sguendo un erto patrón a medda que nos desplazamos paralelamente a la superfe. Esta organzaón bdmensonal de las respuestas prnpales en funón del valor de una erta araterísta del estímulo, es lo que se denomna mapa (mapa de domnana oular, mapa de orentaón, et.) y varos de estos mapas oexsten sobre el msmo substrato neuronal. El mapa de posones preferdas del ampo vsual es topográfo a gran esala, esto es, un movmento sstemáto en el ampo vsual se tradue en un movmento sstemáto a lo largo del órtex. El mapa de domnana oular onsste en un onjunto de bandas on erta peroddad, de modo que las neuronas en ada una de ellas responden sobre todo a los estímulos rebdos a través de uno de los dos ojos. El mapa de orentaón tambén presenta una organzaón peróda en bandas, pero on sngulardades puntuales en

65 3. El órtex vsual prmaro (V) 39 torno a las uales onfluyen todas las orentaones de 0º a 80º. La estrutura del mapa de freuena espaal es más ontrovertda, habéndose propuesto tanto una representaón bnara omo una representaón más ontnua. Fnalmente, en la lteratura tambén se menonan olumnas de dreón. Una funón mportante del órtex vsual es la de ntegrar la nformaón loal de la magen vsual para formar pereptos globales tales omo ontornos, superfes, y formas trdmensonales. S ben tradonalmente el proeso de ntegraón vsuoespaal se ha asgnado a regones ortales superores, exsten ada vez más pruebas de que el órtex prmaro puede jugar un papel mportante. Aunque los ampos reeptvos lásos son bastante pequeños, estímulos aplados fuera de ellos pueden ejerer tambén una gran nfluena uando se presentan a la vez que estímulos aplados dentro de los ampos reeptvos. Estas nfluenas moduladoras permten a las neuronas de V ntegrar nformaón proedente de amplas regones del ampo vsual y partpar así en tareas pereptuales omplejas, omo la ntegraón de ontornos y la segmentaón de superfes. La exstena de efetos perféros, espealmente nhbtoros, en las neuronas de V, es algo que se sabe desde hae bastantes años, pero ahora se sabe además que las nteraones extatoras son tambén mportantes en las respuestas. Mentras que las nteraones ontextuales extatoras se pensa que ntervenen en la ntegraón de ontornos (Feld et al., 993), las nteraones nhbtoras probablemente ntervenen en la segmentaón de superfes y texturas (Knerm y van Essen, 99). Estas nteraones tenen lugar a través de las llamadas onexones largas laterales (tambén llamadas horzontales o ntrínseas), que son mayormente extatoras. Las onexones largas laterales unen neuronas on respuestas smlares y forman una red densa en el órtex. Las onexones laterales además pareen ser reíproas, esto es, s la regón A está onetada on la regón B entones la regón B tambén está onetada on la regón A. El patrón de onexones no es unforme n tampoo está determnado genétamente, sno que se desarrolla a partr de la experena vsual. 3.. Células smples y omplejas Hubel y Wesel (96) desrberon dos tpos básos de neuronas en el órtex vsual: élulas smples y élulas omplejas. Desde entones, han surgdo por un lado lasfaones más elaboradas on dversas sublases (p.ej., Henry, 977) y por otro, algunos nvestgadores han propuesto que las élulas smples y omplejas son extremos opuestos de un ontnuo de élulas (Gesler y Albreht, 000; Mehler y Rngah, 00). A pesar de esto últmo, la dstnón entre élulas smples y omplejas sgue

66 40 Capítulo 3. Representaón de mágenes en el SVH tenendo vgena. En breves palabras, las élulas smples tenen una sere de propedades lneales que en general no tenen la mayoría de las élulas omplejas. En partular, en su artíulo orgnal, Hubel y Wesel desrben uatro propedades lneales básas de las élulas smples: Campos reeptvos on subregones extatoras e nhbtoras dferenadas. Sumaón espaal dentro de una subregón dada. Antagonsmo mutuo entre subregones. Ante estímulos nuevos, las respuestas pueden prederse (ualtatvamente) a partr de la dsposón de las subregones. Estas uatro propedades son las que esperaríamos de un fltro espao-temporal lneal. Por su parte, las élulas omplejas no muestran estas propedades y por tanto se defnen por elmnaón. Así por ejemplo, una élula ompleja típa produe respuestas extatoras tanto para un ontraste laro omo uno osuro, en una msma posón espaal, lo que laramente no es lo que se esperaría de un fltro espao-temporal lneal. En uanto a los ampos reeptvos, los de las élulas smples onstan de dos o tres subregones alargadas y dferenadas on araterístas ON y OFF, mentras que los de las élulas omplejas son más grandes y no presentan subregones ON y OFF (ver Fgura 3.3). Además, las élulas omplejas sólo responden fuertemente ante estímulos en movmento, y sus respuestas dependen de la dreón, pero no de la fase del estímulo. Es mportante señalar que ambos tpos de neuronas responden de manera muy seletva ante atrbutos espeífos de los estímulos (omo, por ejemplo, la orentaón). Las propedades no-lneales más araterístas son las sguentes: Retfaón. Hubel y Wesel (96) fueron los prmeros en observar los efetos de retfaón. Estos autores omprobaron que muhas élulas omplejas responden de manera extatora tanto a barras blanas omo a negras, en una msma posón del ampo reeptvo. Este tpo de omportamento es lo que se denomna retfaón de onda ompleta. En las élulas smples, en ambo, este tpo de omportamento no-lneal es más ben una retfaón de meda onda (ver Fgura 3.4). A pesar de que la retfaón de meda onda oblga a duplar el número de elementos neesaros para transmtr valores postvos y negatvos, ésta tene una sere de ventajas. En prmer lugar, redue el onsumo de energía del órtex, ya que redue el número de potenales de aón que se produen. En segundo lugar, hae que la respuesta de las neuronas sea más

67 3. El órtex vsual prmaro (V) 4 seletva a un erto tpo de estímulo. De este modo, unos poos potenales de aón ya son sufentes para restrngr enormemente el onjunto posble de araterístas vsuales en un erto punto (Adelson y Bergen, 985; Watson y Ahumada, 985). Por otro lado la retfaón de onda ompleta es útl para alular la energía de movmento (Adelson y Bergen, 985; Watson y Ahumada, 985) y la energía de textura del estímulo (Bergen, 99). Fgura 3.4: Retfaón en (A) élulas omplejas y (B) élulas smples. (Adaptado de De Valos et al., 98). Expansón. A medda que se nrementa el ontraste, las respuestas, en general, reen de forma exponenal (ver Fgura 3.5). La forma de las respuestas se puede aproxmar por una funón de Naka-Rushton, uyo exponente srve para uantfar la expansón de las respuestas. El valor promedo de este exponente en el órtex vsual prmaro es de aproxmadamente,5. Un fltro lneal segudo de una no-lneardad expansva produe exatamente este tpo de respuesta.

68 4 Capítulo 3. Representaón de mágenes en el SVH Fgura 3.5: Funón de respuesta al ontraste de una neurona ortal para no freuenas espaales dferentes. (Observaones sn publar de Albreht y Gesler). Saturaón. Las meddas de la funón de respuesta al ontraste muestran que las neuronas ortales tenen un rango dnámo lmtado segudo por una saturaón de la respuesta (ver Fgura 3.5). Control de ganana de ontraste. Al nrementar el ontraste, llega un momento en que las respuestas de las neuronas ortales se saturan, a vees nluso on bajos ontrastes (ver Fgura 3.5). Esta saturaón es una manfestaón de un esalado de la respuesta basado en la magntud del ontraste, esto es, un ontrol de ganana de ontraste (para una revsón ver Carandn et al., 999; Gesler y Albreht, 000). 3.3 Prnpos de representaón de mágenes en el órtex vsual El órtex vsual es el responsable de la mayor parte de nuestra perepón onsente del mundo vsual y sn embargo todavía desonoemos en gran medda los prnpos que rgen su funonamento. La prnpal ausa de esto últmo no es la esasez de datos, sno más ben la falta de un maro teóro sóldo que permta dseñar expermentos e nterpretar los resultados.

69 3.3 Prnpos de representaón de mágenes en el órtex vsual 43 Por otra parte, la evoluón y el desarrollo de los sstemas neuronales bológos está ondonado por tres aspetos fundamentales:. Las tareas que el organsmo debe desempeñar.. El número de neuronas y las apadades de ómputo y lmtaones de las msmas (esto nluye restrones metabólas y de nteronexón). 3. El entorno en el que vve el organsmo. Tradonalmente, los estudos teóros y modelos del proesamento neuronal han tendo en uenta los dos prmeros aspetos prnpalmente, s ben el desarrollo reente de mejores modelos de los entornos naturales ha aumentado el nterés aera de la nfluena del entorno en el proesamento neuronal. Así en los últmos años, ha surgdo un maro teóro de ómo se realza el análss de patrones en el órtex vsual. Esta teoría hunde sus raíes en las deas propuestas hae más de 40 años por Atteneave y Barlow. La dea es esenalmente que el órtex vsual ontene un modelo probablísto de las mágenes y que las respuestas de las neuronas están representando las mágenes omo realzaones onretas de dho modelo. Este método pone el énfass en desubrr una buena desrpón de las mágenes naturales usando modelos probablístos y relaonar esta desrpón on las propedades de las respuestas de las neuronas vsuales. Según esta teoría, la tarea de la perepón vsual es nferr las propedades del entorno a partr de la nformaón que llega a través de los reeptores sensorales. Lo que hae que esto sea un problema dfíl, es que se ntenta reonstrur el mundo trdmensonal a partr de un onjunto bdmensonal de sensores. Este proeso lleva asoada además una erta nertdumbre, debda al heho de que la ntensdad lumnosa que llega a ada punto de la retna depende de las araterístas de la lumnaón, en onstante ambo, y de la forma y refletana de las superfes. Es por ello que el problema de determnar las propedades del entorno a partr de las respuestas de los fotorreeptores, no tene una soluón úna, sno que algunos entornos proporonan una explaón más probable de los datos que otros, basándonos en nuestro onomento de ómo está estruturado el mundo y en ómo se forman las mágenes. La perepón vsual sería por tanto, según esta teoría, un problema de nferena probablísta. En este maro, los modelos de vsón bológa están evoluonando para ser ada vez más de naturaleza estadísta, omo es el aso del enfoque adoptado en esta Tess.

70 44 Capítulo 3. Representaón de mágenes en el SVH 3.3. Estadísta de mágenes naturales Las neuronas de los sstemas sensorales están adaptadas a las señales a las que están expuestas. Como estas señales en general no son equprobables, es lógo pensar que los sstemas pereptuales son apaes de proesar mejor aquellas señales que ourren on más freuena. De ahí que las propedades estadístas del entorno sean tan relevantes desde el punto de vsta del proesamento sensoral. S queremos desrbr de manera estadísta onjuntos de mágenes, lo mejor es onsderar ada magen omo una realzaón de un vetor aleatoro. Cada vetor de magen representará un úno punto en un espao vetoral de alta dmensonaldad. El onjunto de mágenes naturales onstturá un subonjunto de este espao. Basándonos en la freuena relatva de las mágenes naturales dentro del espao global, podemos asgnar a estas mágenes una funón de densdad de probabldad (fdp). S onoéramos esta fdp, tendríamos una desrpón estadísta ompleta del onjunto de mágenes naturales. Sn embargo, esto no es posble en la práta debdo al elevado número de dmensones del espao de las mágenes, de modo que nos debemos onformar on araterzar ertos aspetos de la estadísta de las mágenes naturales, algunos de los uales los desrbremos brevemente en los párrafos sguentes. Tambén hay que tener en uenta que las mágenes naturales son no-estaonaras, en el sentdo de que se omponen de objetos laramente delmtados y espaalmente loalzados, de modo que la estadísta es relatvamente unforme dentro de un objeto, pero amba al pasar de un objeto a otro. Las mágenes naturales son estadístamente redundantes. Kersten (987) demostró que en mágenes dgtales de 4 bts, el ontendo de nformaón pereptual de un píxel es aproxmadamente,4 bts, y que la redundana en las mágenes naturales está en torno al 65%. Las ténas de ompresón de mágenes aprovehan presamente esta redundana para obtener nuevos formatos que permten transmtr y almaenar las mágenes dgtales de manera efente. La smple nspeón de mágenes naturales permte ver que las posones espaales venas están fuertemente orreladas en ntensdad. Esto puede verse en la Fgura 3.6, donde se representan los valores de ntensdad de pares de píxeles que están separados una dstana dada, para varas mágenes naturales. De una manera más formal, la orrelaón entre pares de píxeles vene dada por la funón de autoorrelaón, que en el ejemplo baja de a 0,3 on la dstana (ver Fgura 3.6). El aráter no-estaonaro de las mágenes naturales que omentábamos antes, laramente se umple en las orrelaones entre píxeles. Así, las orrelaones ntraobjeto, esto es, entre píxeles de un msmo objeto, son elevadas,

71 3.3 Prnpos de representaón de mágenes en el órtex vsual 45 mentras que las orrelaones nterobjeto, entre píxeles perteneentes a objetos dferentes, son prátamente despreables. Fgura 3.6: (a) Valores de ntensdad de pares de píxeles separados una dstana dada. (b) Funón de autoorrelaón. (Smonell y Olshausen, 00). S ben la mayor parte de la redundana presente en las mágenes naturales está ontenda en las orrelaones de segundo orden entre los píxeles, tambén exsten dependenas estadístas de más alto orden. El análss de estas relaones estadístas demuestra que se trata de dependenas no-lneales a lo largo de la dmensón espaal, así omo entre esalas y entre orentaones (Wegmann y Zetzhe, 990; Smonell, 997; Smonell y Shwartz, 999). En la Fgura 3.7 se muestra el hstograma (a) onjunto y (b) ondonal de las respuestas de dos ampos reeptvos lneales que no se solapan. El hstograma ondonal lustra varos aspetos mportantes de la relaón entre las respuestas. Así vemos que las respuestas están (aproxmadamente) deorreladas, ya que el valor esperado de la ordenada vene dado aproxmadamente por el eje de abssas. Sn embargo las respuestas no son ndependentes, puesto que la varanza de la ordenada depende fuertemente del valor de la abssa. Además, estas

72 46 Capítulo 3. Representaón de mágenes en el SVH Fgura 3.7: (a) Hstograma onjunto de las respuestas de dos ampos reeptvos que no se solapan. (b) Hstograma ondonal de los msmos datos. El nvel de grs representa la probabldad, salvo por el heho de que ada olumna se ha normalzado ndependentemente para abarar todo el rango de nveles de grs posbles. (Smonell y Olshausen, 00). dependenas no pueden elmnarse on nnguna transformaón lneal ulteror. Las dependenas estadístas entre las respuestas de fltros orentados son debdas, al menos en parte, a la mportana de los ontornos en las mágenes naturales. Gesler et al. (00) examnaron empíramente las dstrbuones de orentaones domnantes en posones venas y las utlzaron para preder el resultado de una tarea psofísa de deteón de ontornos. Asmsmo, Sgman et al. (00) mostraron que estas dstrbuones onden on las de elementos orentados o-rulares y relaonaron este resultado on la onetvdad de las neuronas en el órtex vsual prmaro. Por otro lado, se ha demostrado empíramente que la potena espetral de las mágenes naturales ae on la freuena f sguendo una ley potenal /f p, on p (Ruderman y Balek, 994). Un ejemplo se muestra en la Fgura 3.8. Las ausas de esta ley potenal todavía son motvo de espeulaón y debate. Comúnmente se ree que esto se debe a la nvaranza a esala del mundo vsual. Téngase en uenta que las mágenes naturales son proyeones sobre el plano magen de onjuntos de objetos a dferentes dstanas. Así, los objetos eranos dan lugar a mágenes retnanas grandes, mentras que los msmos objetos, stuados a dstanas mayores, generan mágenes retnanas más pequeñas. Es por tanto razonable pensar que las mágenes naturales deben ser hasta erto punto nvarantes ante ambos de esala. La nvaranza a esala sgnfa que las propedades estadístas de las mágenes no amban al ambar la esala. En onreto, para que la potena espetral no ambe bajo esta transformaón,

73 3.3 Prnpos de representaón de mágenes en el órtex vsual 47 debe aer sguendo una ley potenal. Otra teoría es que la potena espetral /f se debe a la presena de bordes en las mágenes, ya que estos bordes tenen una potena espetral /f. Sn embargo Ruderman (997) y Lee et al. (00) han mostrado que lo que goberna la aída espetral es la partular dstrbuón de tamaños y dstanas de los objetos en las mágenes naturales. Fgura 3.8: Potena espetral, promedada sobre todas las orentaones, de una magen natural (línea ontnua), omparada on /f (línea dsontnua). (Smonell y Olshausen, 00). La nvaranza a esala de las mágenes naturales, mpla que éstas son en erto modo fratales, en el sentdo de que presentan autosemejanza estadísta. No obstante, las mágenes naturales no son smples fratales, ya que presentan dferentes leyes potenales, uyos exponentes, además, no se pueden relaonar fálmente. Esto es porque las mágenes naturales son multfratales (Turel et al., 998a, 998b; Turel y Parga, 000a), de forma que sus propedades de nvaranza a esala requeren una desrpón más omplada. Esta nteresante propedad geométra está relaonada on otra forma de smetría de las mágenes naturales, a saber, el multesalado (omo ada omponente fratal posee su propa dmensón fratal, ada una amba de manera dferente ante un erto ambo de esala). Otro tpo de nvaranza que se suele onsderar en las mágenes naturales es la nvaranza a traslaón. La nvaranza a traslaón sgnfa que la estadísta de las mágenes naturales es nvarante frente a traslaones. Esta hpótess es bastante

74 48 Capítulo 3. Representaón de mágenes en el SVH razonable puesto que las mágenes retnanas de heho expermentan todo tpo de traslaones a medda que el ndvduo explora su entorno medante movmentos oulares saádos. Bajo la ondón de nvaranza a traslaón y sempre que la dstrbuón de las mágenes naturales fuese gaussana, la ampltud de la potena espetral sería sufente para araterzar ompletamente la fdp de las mágenes naturales. Sn embargo, este no es el aso, ya que la dstrbuón de las mágenes naturales es fuertemente no-gaussana. De heho, la fase espetral es muho más mportante que la ampltud espetral para araterzar el ontendo de una magen natural (a partr de la ampltud espetral es mposble reonstrur una magen, mentras que la nformaón de fase da una dea detallada de la posón de los objetos en la magen). Hay dferentes maneras de ver que la dstrbuón de las mágenes naturales es no-gaussana. Por ejemplo, s las mágenes naturales fuesen gaussanas (e nvarantes a traslaón), deberíamos ser apaes de obtener mágenes naturales a partr de un onjunto de oefentes de Fourer gaussanos e ndependentes (esto es, rudo blano gaussano), multplándolos por /f ( desblanqueo ) e nvrtendo segudamente la transformada de Fourer. Sn embargo, s se hae esto, lo que se obtene es una magen sn bordes, ontornos, n muhas otras estruturas que estamos aostumbrados a ver en las mágenes naturales. Análogamente, s las mágenes naturales fuesen gaussanas (e nvarantes a traslaón), entones la transformada de Fourer deorrelaría la dstrbuón y, tras el blanqueo, obtendríamos oefentes gaussanos ndependentes. Sn embargo, una magen natural blanqueada todavía ontene laras estruturas (líneas, bordes, ontornos, et.). Feld (987) y Daugman (989) proporonaron otra prueba más del aráter no-gaussano de las mágenes naturales. Estos nvestgadores mostraron que las dstrbuones de las respuestas de fltros paso banda orentados (fltros de Gabor) presentan un fuerte po en ero y olas más largas que las de una gaussana (ver Fgura 3.9). Esto es una prueba dreta de que la fdp global no es una gaussana, ya que la fdp en ualquer eje de una gaussana multdmensonal debe ser tambén una gaussana. Debdo a que las mágenes naturales están dstrbudas de manera fuertemente no-gaussana, es rual para su orreta araterzaón el onsderar estadístos de orden más alto que (nótese que una dstrbuón gaussana queda ompletamente araterzada onodos sus estadístos de prmer y segundo orden). Los prmeros estudos sstemátos de las propedades estadístas de las mágenes naturales, más allá de las orrelaones entre pares de oefentes, son bastante reentes (Ruderman y Balek, 994; Turel et al., 998a, 998b; Turel y Parga, 000a). Turel et al. (998a, 998b) propuseron un nuevo método para entender las propedades

75 3.3 Prnpos de representaón de mágenes en el órtex vsual 49 estadístas de las mágenes naturales, que permte araterzar y explar la estadísta no-gaussana de los ambos de ontraste, utlzando un proeso estoásto multplatvo (los ambos de ontraste en una esala dada, se obtenen a partr de los de una esala más gruesa, multplando por una varable aleatora ndependente). Fgura 3.9: Hstograma de las respuestas de un fltro de Gabor aplado sobre una magen natural (línea ontnua), omparado on una fdp gaussana on la msma varanza (línea dsontnua). (Smonell y Olshausen, 00). Los expermentos realzados por Ruderman (994), lustran muhas de las propedades estadístas de las mágenes naturales. Ruderman aluló para dferentes esalas los hstogramas de los valores medos en ventanas pequeñas de los nveles de grs. Así pudo omprobar que: () los hstogramas son smlares para las dferentes esalas, lo que nda que la fdp global es nvarante a esala; () las formas de los hstogramas dferen onsderablemente de los que abría esperar de una dstrbuón gaussana; () para ventanas más grandes (esto es, promedando más píxeles), los hstogramas sguen sn tener forma gaussana, lo que quere der que el teorema del límte entral no se umple en este aso y, por tanto, que píxeles venos tenen una fuerte dependena estadísta entre sí. Reaptulando, podemos señalar algunas propedades estadístas mportantes de las mágenes naturales: Las mágenes naturales son no-estaonaras, de ahí que sea tan mportante la desrpón loal y estadísta de las msmas.

76 50 Capítulo 3. Representaón de mágenes en el SVH Las mágenes naturales son muy redundantes. En gran parte la redundana se debe a las dependenas estadístas de segundo orden entre los nveles de grs de los píxeles, s ben tambén exsten dependenas de más alto orden. Su estadísta es nvarante a esala e nvarante a traslaón. Además, las mágenes naturales son multfratales, por lo que presentan multesalado. Los estadístos de segundo orden y la potena espetral no son sufentes para araterzar las mágenes naturales. La estrutura de las mágenes naturales está ontenda en estadístos de alto orden relaonados on la fase del espetro. Estruturas mportantes son los alneamentos loales de fase (bordes). La dstrbuón estadísta de las mágenes naturales es omplada y fuertemente no-gaussana Hpótess de Codfaón Efente Tal omo hemos vsto, las señales retnanas se transmten al órtex vsual prmaro donde generan omplejos patrones de respuesta espao-temporal. Estos patrones ortales de atvaón forman parte de una representaón nterna del entorno exteror. Las regones subsguentes del erebro enargadas del tratamento de la nformaón vsual, no tenen aeso dreto al mundo exteror, sno sólo a la representaón nterna, de modo que es fundamental que ésta sea efente y flexble. Es por tanto razonable pensar que los sstemas vsuales se han adaptado a lo largo de la evoluón para onstrur representaones nternas efentes del mundo natural. Es mportante señalar que el ódgo de esta representaón no tene porqué funonar ben on ualquer magen, sno sólo on el subonjunto relatvamente pequeño de mágenes que genera el entorno vsual del ser vvo. Del msmo modo, los modelos omputaonales de las prmeras etapas de la vsón ( vsón temprana ) onsderan que la manera en que el sstema vsual odfa las esenas naturales es óptma según un erto rtero, bajo las restrones mpuestas por la anatomía y la fsología del propo sstema. Una vez que se defne el rtero de optmaldad (o prnpo de dseño), es posble araterzar los ódgos que satsfaen dho rtero y omparar las predones obtendas on la estratega de odfaón on las propedades de las respuestas neuronales. Uno de estos posbles rteros de optmaldad rebe el nombre de Hpótess de Codfaón Efente (HCE) y relaona uanttatvamente las propedades estadístas del entorno on la estrutura del sstema vsual. En su forma más senlla, esta hpótess

77 3.3 Prnpos de representaón de mágenes en el órtex vsual 5 queda reogda en los sguentes dos enunados, uno de los uales se refere a la estadísta de la respuesta de una neurona y el otro a la estadísta onjunta de las respuestas de un grupo de neuronas:. La dstrbuón estadísta de las respuestas de una neurona ante el entorno natural debe ser tal que la nformaón sea máxma. La forma óptma de la dstrbuón dependerá en gran medda del tpo de restrón que mpongamos a las respuestas (s no hubese nnguna restrón, la antdad de nformaón smplemente no estaría aotada). Así por ejemplo, s fjamos el valor máxmo de las respuestas, la dstrbuón óptma es unforme, s fjamos la varanza, es gaussana, y s fjamos la meda, es exponenal.. Las respuestas de dferentes neuronas ante el entorno natural deben ser estadístamente ndependentes entre sí. En otras palabras, la nformaón odfada por una neurona no debe ser redundante, esto es, no debe estar duplada en nnguna otra neurona. Esta ondón es oherente on la dea de que el sstema vsual ntenta desomponer una magen en elementos estadístamente ndependentes. Un ódgo así se denomna ódgo fatoral, ya que en este aso la fdp onjunta de las respuestas neuronales es gual al produto de las fdp de ada una de las respuestas. En este ontexto, la Teoría de la Informaón juega un papel mportante, ya que lo que vene a der la HCE es que la efena de la odfaón es un aspeto fundamental del proesamento neuronal, de modo que las neuronas en onjunto deben odfar el máxmo posble de nformaón, haendo así buen uso de los reursos de ómputo dsponbles. Es mportante señalar tres osas:. La efena del ódgo neuronal depende tanto de la transformaón que relaona la entrada on la respuesta neuronal, omo de la estadísta de la entrada. En partular, s la efena de las respuestas neuronales es óptma para una erta dstrbuón de entrada, esto no quere der que lo sea para otras dstrbuones dferentes.. Codfaón efente no es lo msmo que ompresón óptma (según la teoría de tasa-dstorsón) n estmaón óptma. Nótese por ejemplo que la HCE no hae menón a la exattud on la que las señales se representan y n squera exge que la transformaón entre la entrada y las respuestas neuronales sea nvertble. 3. El rtero de odfaón efente es smplsta y no onsdera el rudo que puede ontamnar el estímulo de entrada. Tampoo tene en uenta la nertdumbre o varabldad de las respuestas neuronales ante estímulos

78 5 Capítulo 3. Representaón de mágenes en el SVH déntos. En defntva, el rtero asume que las respuestas neuronales dependen determnístamente de la señal de entrada. La HCE se remonta a Helmholtz (867). A pesar de lo extenddo de la opnón de que la estadísta del entorno debía de nflur en el proesamento neuronal, resultó ser sorprendentemente dfíl araterzar esta relaón de un modo uanttatvo. Hae 50 años, graas a los avanes en la Teoría de la Informaón, Attneave (954) señaló que el objetvo de la perepón vsual es produr una representaón efente de la señal de entrada. En térmnos matemátos y neurobológos muho más presos, Barlow (96) ndó que el papel desempeñado por las neuronas de las prmeras etapas sensorales, es el de elmnar la redundana estadísta de la entrada sensoral. Otros muhos autores (p.ej., Laughln, 98; Atk, 99; van Hateren, 99; Feld 994, Reke et al., 995) tambén han formulado varantes de la HCE. Más reentemente, dferentes autores han amplado la hpótess nluyendo restrones auxlares o extensones. Así por ejemplo, algunos autores han ntentado norporar ertos ostes metabólos a modo de restrón (Levy y Baxter, 996; Laughln et al., 998). Otros han propuesto que la odfaón efente tambén puede aplarse a los proesos de adaptaón (Barlow y Foldak, 989; Barlow, 990; Wanwrght, 999). Algunos autores han dervado modelos de las élulas omplejas de V maxmzando la ndependena o la oherena temporal de ombnaones no-lneales de subundades lneales (sumas de respuestas de fltros lneales al uadrado) (Hyvärnen y Hoyer, 000a; Kayser et al., 00; Berkes y Wskott, 00). Por otro lado, tambén se han propuesto hpótess alternatvas, tales omo que el sstema está dseñado para detetar y representar araterístas espeífas de la magen en presena de rudo fotóno (Balboa y Grzywaz, 000) o que la representaón del olor en las neuronas es un problema de optmzaón de la dsrmnabldad meda de las señales de olor en el entorno natural (von der Twer y MaLeod, 00). Básamente exsten dos métodos para omprobar y refnar la HCE. El método más dreto es estudar las propedades estadístas de las respuestas neuronales en ondones de estmulaón natural (Laughln, 98; Reke et al., 995; Dan et al., 996; Baddeley et al., 998; Vnje y Gallant, 000). Un método alternatvo onsste en dervar un modelo del proesamento en las prmeras etapas sensorales (Sanger, 989; Atk, 99; Olshausen y Feld, 996; van Hateren y van der Shaaf, 998; Smonell y Shwartz, 999). En este método, uno analza las propedades estadístas de las señales del entorno y muestra que una transformaón obtenda a partr de un erto rtero de optmzaón estadísta, proporona una buena desrpón de las propedades que presentan las respuestas de un onjunto de neuronas sensorales.

79 3.3 Prnpos de representaón de mágenes en el órtex vsual 53 Los prmeros ntentos de probar de forma uanttatva la HCE fueron los trabajos de Laughln y Srnvasan. Estos alularon hstogramas y orrelaones espaales de píxeles de mágenes naturales proedentes del entorno vsual de mosas y los usaron para haer predones uanttatvas aera de las propedades de las respuestas de las neuronas en las prmeras etapas del sstema vsual (Laughln, 98; Srnvasan et al., 98). Otro avane mportante se produjo dez años más tarde de manos de Atk (99) y van Hateren (99, 993), quenes formularon una teoría de odfaón en la retna basada en el blanqueo de la potena espetral de mágenes naturales en espao y tempo. En los últmos años, ha aparedo un gran número de artíulos expermentales examnando las respuestas neuronales ante mágenes o seuenas de mágenes naturales (una revsón puede verse en Renagel, 00). En estos artíulos la efena se mde de muy dversas formas y la mayoría paree onfrmar la HCE. Así por ejemplo, Baddeley et al. (998) han mostrado que las dstrbuones de la tasa de dsparo de las neuronas de V del gato son exponenales bajo ondones naturales, lo que supone una transmsón de nformaón óptma, fjada la tasa promedo de dsparo. Igualmente, Nrenberg et al. (00) mostraron a partr de meddas multelulares on estímulos naturales y una nueva (y ontrovertda) forma de medr la redundana, que las élulas ganglonares de la retna se omportan omo odfadores ndependentes. Por otro lado, Vnje y Gallant (00) han mostrado que la presena de estímulos naturales dentro del ampo reeptvo no-láso nrementa varas meddas de efena relaonadas on la nformaón. Asmsmo, numerosos estudos pareen demostrar que el sstema vsual presenta un rendmento superor en ondones de estmulaón natural. Dseño de un sstema sensoral óptmo bajo la HCE Ahora onsderemos el problema de dseñar un sstema sensoral óptmo bajo la HCE. El objetvo es desomponer las señales de entrada en un onjunto de respuestas estadístamente ndependentes. El problema general es extremadamente dfíl, ya que la araterzaón del hstograma onjunto de la entrada ree exponenalmente on el número de dmensones. Por este motvo, normalmente se restrnge el problema smplfando la desrpón estadísta de la entrada y/o fjando la forma de la desomposón. La restrón más onoda onsste en onsderar sólo desomposones lneales y las propedades de segundo orden (esto es, ovaranza o, equvalentemente, orrelaón) de la señal de entrada. Tal omo hemos vsto, una parte mportante de la redundana presente en las mágenes naturales se debe a las orrelaones de segundo orden entre los píxeles. Por otro lado, los estadístos de

80 54 Capítulo 3. Representaón de mágenes en el SVH segundo orden no son adeuados para araterzar estruturas mportantes en las mágenes tales omo los bordes loales y los alneamentos de fase. Es por todo ello que paree razonable pensar que el sstema vsual elmna las redundanas de segundo orden ya en las prmeras etapas (retna y CGL). En el aso de la retna exsten además otros ndos, omo son por ejemplo, el problema de uello de botella que supone transmtr la nformaón de aproxmadamente 0 mllones de fotorreeptores a través de los mllones de fbras del nervo ópto, y el heho de que, sendo la elmnaón de redundanas de segundo orden una operaón lneal de tratamento de señales, la mayor parte de las neuronas de la retna tene un omportamento prátamente lneal. Bajo estas ondones, la soluón del problema puede obtenerse usando Análss en Componentes Prnpales (Prnpal Component Analyss o PCA). Las omponentes prnpales son un onjunto de ejes ortogonales a lo largo de los uales las omponentes están deorreladas. S ben este onjunto de ejes exste sempre, puede no ser úno. Una vez representados los datos sobre el sstema de oordenadas formado por las omponentes prnpales, lo que se suele haer es reesalar los ejes para gualar las varanzas de las omponentes. Este reesalado es lo que omúnmente se denomna blanqueo. Aunque el PCA puede usarse para obtener un onjunto de ejes estadístamente ndependentes que permtan representar datos gaussanos, esta téna falla uando los datos son no-gaussanos, omo es el aso de las mágenes naturales. En otras palabras, aunque se elmnen las orrelaones medante blanqueo en la retna y el CGL, esto todavía no es sufente para onsegur odfar efentemente las mágenes naturales. En onreto, en el aso de que los datos sean una mezla lneal de fuentes no-gaussanas, se puede demostrar que es neesara una rotaón adonal del sstema de oordenadas para obtener ejes ndependentes. Esta rotaón además sólo puede alularse a partr de propedades estadístas de los datos más allá de la ovaranza (esto es, de orden mayor que ). A lo largo de la últma déada, se han desarrollado métodos para estmar esta matrz de rotaón que se basan en maxmzar momentos de alto orden (por ejemplo la urtoss) en lugar de optmzar dretamente la ndependena de las omponentes. Este tpo de desomposones se denomnan Análss en Componentes Independentes (Independent Component Analyss o ICA), s ben el nombre ndue a error, ya que no está garantzado que las omponentes resultantes sean realmente ndependentes. No obstante, estas ténas pueden usarse para obtener los ejes lneales a lo largo de los uales los datos son lo más ndependentes posble, y resultan muy útles en el aso de mágenes naturales. Convene nsstr en el heho de que aunque estas ténas busan onsegur ndependena estadísta, en general las respuestas resultantes no son

81 3.3 Prnpos de representaón de mágenes en el órtex vsual 55 ompletamente ndependentes. Esto se debe a que las mágenes naturales no están formadas por sumas de omponentes ndependentes. Consdérese por ejemplo que la luz provenente de dferentes objetos se suele ombnar de auerdo a reglas de olusón (en lugar de adón) en el proeso de formaón de la magen. El análss de las relaones estadístas entre respuestas revela que se trata de dependenas no-lneales en espao, así omo en orentaón y esala (Wegmann y Zetzshe, 990; Smonell, 997; Smonell y Shwartz, 999). En partular, las transformaones lneales no dan lugar a ódgos fatorales debdo a las restrones que mpone la propedad de multesalado de las mágenes naturales (Turel y Parga, 000b). Tenendo en uenta estas restrones, es posble obtener ódgos que elmnan mejor la redundana, proporonando una representaón más ompata del mundo vsual. Así, Turel y Parga (000b, 000) y Turel et al. (003), basándose en la propedad de multesalado, onstruyeron una representaón wavelet óptma, en la que las varaones de ontraste en las dferentes esalas están relaonadas medante un proeso estoásto multplatvo. La representaón wavelet es óptma en el sentdo de que mnmza las dependenas estadístas entre oentes de oefentes perteneentes a esalas dferentes (nótese que el rtero de optmaldad se establee entre esalas, de forma que dentro de una msma esala pueden segur exstendo dependenas en espao y orentaón). De esta forma, partendo de propedades estadístas de las mágenes naturales, al mponer un erto rtero de optmaldad, se llega a un ódgo no-lneal, basado en un oente, que posee ertas araterístas observadas en los sstemas vsuales de los mamíferos (Turel y Parga, 003). Por otro lado, Smonell y Shwartz (999) mostraron que las dependenas estadístas (en espao, orentaón y esala) pueden redurse usando una transformaón no-lneal en la que ada respuesta lneal se eleva al uadrado y después se dvde por una suma ponderada de respuestas lneales al uadrado en un vendaro. Este tpo de no-lnealdad se adapta ben a la estadísta no-gaussana de las mágenes naturales, y además ha sdo utlzada por dferentes autores para araterzar algunos omportamentos no-lneales de las neuronas (Rehhardt y Poggo, 979; Bonds, 989; Gesler y Albreht, 99; Heeger, 99a; Carandn et al., 997). El modelo resultante reprodue sorprendentemente ben un gran número de observaones neurofsológas en las que la presena de estímulos no-óptmos, tanto dentro omo fuera del ampo reeptvo láso, atenúa las respuestas (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00). La normalzaón dvsva permte, por

82 56 Capítulo 3. Representaón de mágenes en el SVH tanto, ndependzar estadístamente las respuestas de salda, al msmo tempo que modela ertos omportamentos no-lneales de las neuronas ortales. Aunque es el fundamento sobre el que se asenta esta Tess, la HCE ha rebdo, no obstante, dferentes rítas. Estas rítas, o se deben a nterpretaones norretas de la teoría, o van drgdas a varantes partulares de la msma, o se referen a uestones expermentales, o son ya más fundamentales. A ontnuaón dsutmos brevemente algunas de ellas (una dsusón más extensa puede enontrarse en Barlow, 00): - Propósto de la vsón. Con freuena se ha dho que la odfaón efente de la nformaón vsual es rrelevante porque el propósto de la vsón no es odfar n reonstrur el mundo vsual. Hay algo de erto en esta ríta y es que la hpótess no tene en uenta ómo se va a usar la nformaón extraída. Por ello, teorías más ompletas, omo las basadas en desón y estmaón bayesana, onsderan tanto la estrutura estadísta del entorno, omo la tarea y el objetvo vsuales. - Relevana de la Teoría de la Informaón. Una segunda ríta es que la Teoría de la Informaón es rrelevante porque el erebro no trabaja on bts. Sn embargo, los bts son sólo una undad de nformaón. La defnón abstrata de nformaón, que está ben justfada y que es úna, es ertamente relevante para el erebro. - Dependena observada expermentalmente. Otra ríta es que algunos datos expermentales muestran orrelaón, snronzaón u otras formas de dependena estadísta entre neuronas. La mayoría de estos expermentos no usan estímulos naturales, y por tanto las dependenas observadas en las respuestas neuronales no suponen una ríta a la hpótess. Estudos reentes han mostrado que las respuestas a estímulos naturales en el órtex vsual prmaro son relatvamente ndependentes. Pero además, en aso de que se observasen dependenas en las respuestas neuronales bajo ondones de estmulaón natural, esto sería ompatble on la hpótess, ya que lo que ésta de es que el sstema vsual trata de onsegur ndependena estadísta, pero no que fnalmente lo onsga. Más realsta es pensar que las subsguentes etapas de tratamento ontnúan reduendo la dependena estadísta. - Representaón redundante en el órtex. Esta ríta se basa en la omparaón del número de élulas ganglonares retnanas frente al número de neuronas en el órtex vsual prmaro. Los rítos aduen que el número de neuronas dedadas al tratamento de nformaón sensoral paree aumentar onforme se avanza en el sstema vsual, lo que lleva a pensar que el erebro nrementa la redundana.

83 3.3 Prnpos de representaón de mágenes en el órtex vsual 57 Sn embargo, para que este argumento sea erto es neesaro que todas las neuronas tengan la msma apadad de odfaón. S varía la forma de odfaón neuronal empleada por las neuronas, omo paree ser el aso, la dstrbuón de la nformaón entre mayor número de neuronas no mpla neesaramente más redundana. - Impratabldad expermental. Muhos autores han señalado que la estmaón de las magntudes relaonadas on la Teoría de la Informaón requere enormes antdades de datos, lo que hae que sea nvable una verfaón expermental. Este es un problema sero, tenendo en uenta además que los estmadores de nformaón usados omúnmente tenen un fuerte sesgo. No obstante, las meddas expermentales realzadas on éxto reentemente son un motvo para el optmsmo. - Defnón de la entrada y la salda. La HCE depende muho de la dstrbuón de probabldad de las mágenes naturales y de ómo se mda la respuesta neuronal. Por tanto, la teoría no está tan lbre de supuestos omo podría reerse. Éste es quzá el problema más sero que presenta la hpótess. - Importana del rudo. Una últma ríta es que la HCE normalmente usa versones de la teoría que gnoran el rudo, sendo las otras restrones físas tambén demasado smplstas. Esta es una ríta verdadera, pero en muhos asos no onsttuye un problema. De heho, nluso las versones más smplstas de la teoría permten haer predones nteresantes. Por otro lado, muhos autores han desarrollado versones más sofstadas que nluyen restrones físas omo el rudo. La ríta más sera a la HCE, es que gnora dos de las tres prnpales restrones del sstema vsual: la mplementaón y la tarea. Las restrones de mplementaón son dfíles de espefar, pero laramente juegan un papel mportante en el erebro. De otra parte, las tareas que debe desempeñar el organsmo onsttuyen una restrón más mportante s abe. Es por esto que, se hae neesaro un maro teóro más elaborado. Comúnmente, la teoría de desón/estmaón bayesana se propone omo ejemplo de un maro teóro así, ya que nluye tanto un modelo estadísto prevo del entorno omo una funón de oste/benefo que espefa el oste de dferentes errores o la onvenena de dferentes omportamentos.

84 58 Capítulo 3. Representaón de mágenes en el SVH Representaón dspersa y sobreompleta S ben la HCE ha permtdo explar on bastante éxto las propedades de las respuestas neuronales en la retna y el uerpo genulado lateral (CGL), es posble que en el órtex haya que tener en uenta onsderaones adonales. Una dferena mportante entre la retna y el órtex, es que la retna debe haer frente a una sera restrón estrutural, el nervo ópto, que lmta el número de axones que salen del ojo, mentras que la regón V, en ambo, tene bastantes más saldas que entradas y por tanto expande la representaón de magen proedente del CGL. S suponemos que el anho de banda por axón es aproxmadamente el msmo, entones la onlusón a la que se llega es que la redundana aumenta en el órtex, ya que la antdad total de nformaón no puede nrementarse. Cuáles pueden ser las razones que están detrás de este empleo de reursos neuronales adonales? En prmer lugar, hay que tener en uenta que el objetvo últmo de la representaón sensoral es modelar la redundana de las mágenes y no neesaramente redurla (Barlow, 00). Lo que realmente se busa es una representaón sgnfatva, algo que apture las ausas de las mágenes, esto es, lo que está ahí fuera en el entorno. En segundo lugar, la reduón de redundana sería un modelo probablísto váldo de las mágenes s el mundo natural pudera desrbrse en térmnos de omponentes ndependentes. Sn embargo, aunque algunos aspetos del mundo vsual pueden desrbrse así, en general esto no es posble. Por tanto, para entender ómo forma el órtex representaones útles de la estrutura de las mágenes, quzá neestemos un prnpo dstnto de la smple reduón de redundana. Una forma posble de onsegur una representaón sgnfatva de la nformaón sensoral, es agrupar elementos, de modo que el mundo pueda desrbrse en ada momento a partr de un número redudo de eventos. En una representaón neuronal esto sgnfa que en un momento dado sólo una pequeña fraón de la poblaón de neuronas está atva, dando lugar a lo que se onoe omo ódgo dsperso ( sparse en nglés). Debdo a que la respuesta de las neuronas vale ero la mayor parte del tempo, las dstrbuones de la atvdad presentan un fuerte po en ero y largas olas, es der, tenen una alta urtoss. Al maxmzar la urtoss del ódgo onservando la entropía total, se obtene una representaón dspersa al msmo tempo que se fuerza el aráter fatoral del ódgo. Una representaón así, s ben es muy redundante, ya que la atvdad de una neurona es muy predeble (la mayor parte del tempo la neurona está natva), proporona una desrpón sgnfatva de las mágenes naturales y por tanto puede ser más útl que una representaón densa en la que se haya redudo la

85 3.3 Prnpos de representaón de mágenes en el órtex vsual 59 redundana. Una representaón dspersa proporona una forma robusta de almaenar y reuperar fálmente nformaón, pero tambén es deseable por otras razones. Así por ejemplo, omo el oste metabólo de los potenales de aón es elevado, es muy mportante mnmzar el tráfo de dsparos. El oste de una neurona en sleno es quzá del orden de entos de mles de vees menor y de ahí el nterés de desarrollar un sstema de representaón que mnme el número de potenales de aón, aunque sea a osta de aumentar el número de neuronas neesaras. La prmera evdena uanttatva de la odfaón dspersa en el órtex vsual fue proporonada por Feld (987), que estudó los hstogramas de las respuestas neuronales ante mágenes naturales en un modelo de V. Feld mostró que la forma partular de los ampos reeptvos de las élulas smples de V paree ser la adeuada para lograr una representaón dspersa de las mágenes naturales. Olshausen y Feld (996, 997) reexamnaron la relaón entre los ampos reeptvos de las élulas smples y la odfaón dspersa, esta vez sn mponer nnguna forma funonal a los ampos reeptvos. El onjunto de funones que emerge, omenzando on valores aleatoros, tras un entrenamento on entos de mles de pequeños fragmentos de mágenes naturales tomados aleatoramente, se asemeja bastante a los ampos reeptvos de las élulas smples (las funones están loalzadas espaalmente, están orentadas y son paso banda en dferentes bandas de freuena espaal, omo puede verse en la Fgura 3.0). Este método puede entenderse omo un modelo probablísto que ntenta explar las mágenes en térmnos de omponentes que son al msmo tempo dspersas y estadístamente ndependentes (Olshausen y Feld, 997), y por tanto pertenee a la ampla lase de algortmos ICA. Resultados smlares se han obtendo on otras formas de ICA (Bell y Sejnowsk 997; van Hateren y van der Shaaf, 998; Lewk y Olshausen, 999) y Hyvärnen y Hoyer (000b) nluso han explado propedades de las élulas omplejas extendendo el ICA para operar sobre subespaos. Por otra parte, estudos fsológos reentes de Vnje y Gallant (000, 00) han onfrmado la dea de la odfaón dspersa, mostrando que las respuestas de las neuronas del órtex vsual prmaro son más dspersas uando se presentan estímulos naturales. El efeto no es sólo una supresón global de las respuestas, sno más ben una ombnaón de supresón y reale seletvo. Además de los parámetros de los ampos reeptvos, el órtex debe elegr la forma en la que se ubre el espao de posón, orentaón y freuena espaal, para obtener una representaón ompleta de mágenes. Smonell et al. (99) señalaron que el ubrmento del espao de entrada onvene que sea sobreompleto, esto es, on un número de saldas mayor que la dmensón de la entrada. En una representaón on

86 60 Capítulo 3. Representaón de mágenes en el SVH Fgura 3.0: Ejemplos de funones base obtendas maxmzando el aráter dsperso. (Smonell y Olshausen, 00). muestreo ríto (en la que hay tantas saldas omo entradas), es dfíl dar sgnfado al valor de una salda, ya que mezla nformaón de dferentes posones, orentaones y esalas. De esta forma, expandendo la representaón se onsgue una mejor desrpón de la estrutura de la magen. Lo deal sería por tanto ombnar el aráter dsperso on el sobreompleto para aprovehar así las ventajas de ambos. Expandendo la representaón de magen y haéndola dspersa, las neuronas de V obtendrían una desrpón sunta de las mágenes a partr de desrptores espealmente adaptados a las estruturas presentes en las mágenes naturales. La onsón proporonada por la odfaón dspersa y sobreompleta puede ser útl tambén en etapas posterores de tratamento. Así, una vez que una magen se desrbe de forma dspersa utlzando elementos de borde loales, es muho más fál modelar las relaones entre dhos elementos para representar ontornos, ya que sólo hay que tener en uenta un número redudo de neuronas. El aráter dsperso es asmsmo deseable para el reonomento de patrones, ya que redue la probabldad de falsos reonomentos. Aunque aquí hayamos nsstdo en el aráter dsperso omo posble prnpo que rge el funonamento de V, ésta no es en absoluto una uestón zanjada y exsten otras alternatvas que tratan de explar las propedades de las respuestas de las

87 3.3 Prnpos de representaón de mágenes en el órtex vsual 6 neuronas vsuales. Por ejemplo, tal omo hemos vsto, algunas alternatvas dan más mportana a la ndependena estadísta que al aráter dsperso. Dentro de éstas están las que aplan ICA a las mágenes naturales (Bell y Sejnowsk, 997; van Hateren y van der Shaaf, 998; van Hateren y Ruderman, 998) y en general todas aquellas basadas en la HCE (ver Apartado 3.3.). Los algortmos ICA utlzados en estos asos proporonan unos resultados smlares, s ben es verdad que mplítamente tambén están busando una desrpón dspersa de los datos. Debería estudarse s la ndependena es por sí sola sufente para explar las propedades de los ampos reeptvos de las élulas smples. En este sentdo, Sato et al. (000) han mostrado que uando uno mpone que las funones base sean ortonormales y maxmza la ndependena, la soluón obtenda es smlar a la que se obtene maxmzando el aráter dsperso. De manera smlar, Turel y Parga (003) mostraron que no es neesaro mponer el aráter dsperso del ódgo, ya que éste aparee omo onseuena del aráter dsperso de los bordes en las mágenes naturales. Otro posble objetvo de las neuronas ortales es el de la establdad a lo largo del tempo (Enhauser et al., 00; Hurr y Hyvärnen, 003). La dea aquí es mponer la establdad de la representaón on la esperanza de que las neuronas enuentren nvaranzas en las mágenes, y los resultados venen a apoyar la hpótess de que los ampos reeptvos de las élulas smples tambén ayudan a onsegur representaones nvarantes de seuenas de mágenes naturales. Fnalmente, algunos autores han ntentado explar las propedades de los ampos reeptvos ortales utlzando smplemente la estadísta de segundo orden que aparee ben a partr de la atvdad aleatora durante el desarrollo (Mller, 994) o ben en respuesta a las mágenes naturales (L y Atk, 994; L, 996). Sn embargo, estos métodos típamente deben haer alguna suposón explíta aera de las propedades de los ampos reeptvos, tales omo la nvaranza a traslaón o la nvaranza a esala, para poder obtener ampos reeptvos smlares a los de las élulas smples. 3.4 Modelos funonales de V El objetvo de un modelo funonal es araterzar las propedades de las respuestas neuronales usando para ello un algortmo de tratamento de la nformaón vsual. Una vez observadas, analzadas y uantfadas las tendenas de los datos, es posble empezar a espeular aera de las funones que pueden ajustar un erto onjunto de meddas.

88 6 Capítulo 3. Representaón de mágenes en el SVH Orgnalmente, muhos de los ntentos por explar los datos fsológos se redujeron a un fltrado lneal y un modelado estadísto de segundo orden (Lnsker, 988; Foldak, 990; Atk, 99; van Hateren, 99). Más reentemente, algunos autores han relaonado el fltrado lneal on las propedades estadístas de más alto orden (Olshausen y Feld, 996; Bell y Sejnowsk, 997). Otros han usado varas formas de tratamento no-lneal, omo, por ejemplo, un ontrol dvsvo de ganana (Smonell y Shwartz, 999; Shwartz y Smonell, 00; van Hateren y Snppe, 00; Zetzshe y Röhrben, 00). La medda sstemáta de las respuestas de las élulas smples en funón del ontraste y de la posón espaal, permte observar las sguentes araterístas: La funón de respuesta al ontraste presenta una no-lnealdad exponenal y se satura a partr de un erto ontraste. Además, las respuestas omenzan a reer exponenalmente y se saturan a partr de los msmos ontrastes, tanto para posones espaales óptmas omo subóptmas, s ben la magntud de la respuesta es muy dferente para estos dos tpos de posones. Las élulas smples responden dferentemente según el sentdo del movmento del estímulo. Las respuestas se saturan a partr del msmo ontraste para los dos sentdos del movmento, s ben la ampltud de la respuesta es muy dferente según se trate del sentdo óptmo o no. El grado de dependena de las respuestas on el sentdo del movmento es funón de la fase espaal y es muho mayor de lo que se esperaría. La funón de respuesta a la fase es aproxmadamente snusodal, sendo más estreha y puda que la funón seno. Aunque las respuestas dependen del sentdo del movmento, hay posones de fase nula en las que las respuestas se aeran a ero. Estas araterístas aparentemente dspares, pueden reunrse en un modelo funonal senllo: un fltro espaal lneal, uya ganana depende de la magntud global del ontraste, segudo por un exponente expansvo sobre la respuesta (p.ej., Heeger, 99, 99a, 99b; Albreht y Gesler, 99; Carandn y Heeger, 994; Ferster, 994; y pueden verse revsones en Carandn et al., 999; Gesler y Albreht, 000). En Albreht et al. (00), se muestran varos ejemplos de modelos funonales. Como ya hemos vsto en el Apartado 3.., mentras que los ampos reeptvos de las élulas smples se omponen de una regón extadora y otra nhbdora, los de las élulas omplejas no, araterzándose únamente por la forma en la que la respuesta depende de ertos parámetros (orentaón, freuena espaal, dreón de

89 3.4 Modelos funonales de V 63 movmento, et.). Como onseuena de esto, las élulas omplejas son loalmente nvarantes a la posón o fase. El omportamento no-lneal de las élulas omplejas puede explarse utlzando un modelo multetapa de odfaón dspersa adaptado a las mágenes naturales (Hyvärnen y Hoyer, 000b). Es mportante señalar que nada se ganaría ponendo varos modelos lneales uno detrás de otro, ya que al fnal tendríamos sólo otro modelo lneal. Para aumentar la apadad desrptva on un modelo jerárquo multetapa, es mpresndble algún tpo de no-lnealdad. Hoyer y Hyvärnen (00) onstruyeron un modelo jerárquo de dos etapas usando una no-lnealdad semejante a la de las élulas omplejas. Este modelo agrupa en undades de ontorno elementos orentados que reuerdan a funones de Gabor. La HCE (ver Apartado 3.3.) ha llevado a numerosos nvestgadores a proponer modelos del proesamento sensoral basados dretamente en las propedades estadístas de las señales naturales. En la mayoría de estos modelos, se optmza una base lneal de modo que las respuestas a mágenes naturales sean lo más estadístamente ndependentes posble. Las funones base que resultan de este tpo de desomposones de mágenes naturales, presentan propedades smlares a las de los ampos reeptvos de las élulas smples del órtex vsual (Olshausen y Feld, 996, 997; Bell y Sejnowsk, 997; van Hateren y van der Shaaf, 998; Lewk y Olshausen, 999). Sn embargo, no hay que olvdar que las neuronas sensorales son fuertemente no-lneales, nluso en las prmeras etapas de proesamento. En las últmas déadas, los expermentos fsológos han mostrado muhos omportamentos nolneales de estas neuronas, entre los que están la retfaón y saturaón de las repuestas, la supresón medante másaras no-óptmas y los ambos en la urva de respuesta según el valor de la señal. Los modelos lneales estableen un prmer nexo entre la estadísta de las mágenes naturales y el proesamento neuronal. Sn embargo, las propedades estadístas de las mágenes naturales son demasado omplejas omo para que una transformaón lneal permta obtener un onjunto de omponentes ndependentes. No obstante, las matemátas asoadas a los modelos lneales son abordables, por lo que son un buen punto de partda para onstrur modelos probablístos de mágenes naturales. Es por esto que los modelos suelen partr de una etapa lneal. Aunque los modelos lneales busan onsegur ndependena estadísta, las respuestas resultantes en general no son ompletamente ndependentes, sno que presentan dependenas estadístas no-lneales. Estas dependenas pueden redurse sgnfatvamente usando un modelo no-lneal del proesamento neuronal basado en la odfaón efente de mágenes naturales, al msmo tempo que se modelan algunos

90 64 Capítulo 3. Representaón de mágenes en el SVH de los omportamentos fsológos no-lneales observados en las neuronas vsuales. Smonell y Shwartz (999) mostraron que las dependenas estadístas pueden elmnarse prátamente, utlzando una forma de tratamento no-lneal en la que las respuestas de la etapa lneal se elevan al uadrado y después se dvden por una suma ponderada de respuestas venas (en espao, orentaón y esala) elevadas al uadrado, más una onstante regularzadora d : + e r = d j j j (3.) Numerosos autores (Rehhardt y Poggo, 979; Bonds, 989; Gesler y Albreht, 99; Heeger, 99a, 99b; Carandn et al., 997) han utlzado modelos basados en una normalzaón dvsva smlar para explar omportamentos no-lneales de las neuronas ortales. Este tpo de no-lnealdad que enontramos en el proesamento ortal, se ajusta ben a la estadísta no-gaussana de las mágenes naturales. Además, los parámetros de la normalzaón dvsva (la onstante y los pesos e j ) pueden elegrse de forma que la ndependena estadísta entre las respuestas normalzadas r sea máxma. El modelo resultante es apaz de explar sorprendentemente ben numerosas observaones neurofsológas en las que las respuestas se atenúan en presena de estímulos subóptmos tanto dentro omo fuera del ampo reeptvo láso (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00). Shwartz y Smonell (00) sostuveron que el órtex utlza sus onexones laterales para elmnar dependenas medante la normalzaón dvsva. Una hpótess alternatva es onsderar que las onexones horzontales modelan dretamente las dependenas que exsten, en lugar de elmnarlas. Hay bastantes modelos omputaonales para haer segmentaón de ontornos basados en esta dea. Gesler et al. (00) y Sgman et al. (00) mderon la probabldad de o-ourrena de fltros orentados sobre mágenes naturales y mostraron que estos sguen una estrutura orular, esto es, que las undades orentadas sobre una msma runferena están más orreladas. Este tpo de dependenas podrían norporarse a un modelo dsperso y sobreompleto, suponendo una probabldad a pror no-fatoral para los oefentes y adaptando el modelo a mágenes naturales (Olshausen, 997). d

91 3.5 Modelos del SVH para tratamento de mágenes Modelos del SVH para tratamento de mágenes Las propedades del SVH pueden aproveharse en muhas aplaones de tratamento de mágenes. Así, métras basadas en modelos del SVH están reemplazando lentamente a los esquemas lásos, en los que la métra de aldad onsste smplemente en una medda a partr de dferenas de píxeles, omo puede ser el error uadráto medo. La mejora de la aldad que puede onsegurse usando un método basado en el SVH es sgnfatva y es aplable a una gran varedad de aplaones de tratamento de mágenes. Así por ejemplo, usando estos métodos, las herramentas de evaluaón de la aldad de mágenes preden mejor las valoraones subjetvas, los esquemas de ompresón de mágenes reduen la vsbldad de los artefatos ntrodudos y los algortmos de marado de agua ( watermarkng ) esonden nformaón en mágenes de manera más robusta. El SVH tambén juega un papel mportante en las aplaones relaonadas on la reproduón de mágenes, ya que así los patrones de medo tono ( half-tonng ) pueden optmzarse pereptualmente y los olores reprodurse más felmente. El dseño de nuevos dspostvos apturadores de magen y dsplays ya no es posble sn onsderar las propedades del SVH. Aunque los requermentos espeífos de ada una de estas aplaones son dferentes, el elemento omún es sempre un modelo omputaonal de la vsón humana. La estrutura general de estos modelos suele venr determnada por ertos aspetos psofísos. Tambén se han propuesto modelos basados en la neurobología, pero todavía no están extenddos debdo a su omplejdad y a nuestro lmtado onomento de los proesos que están por debajo. A pesar de todo lo que sabemos aera del SVH, su omplejdad hae mposble onstrur un modelo fsológo ompleto. Se han realzado algunos ntentos (Guth, 99; Atk et al., 99; De Valos y De Valos, 993), pero restrngdos sobre todo a la retna y por tanto, sn ouparse de la perepón de alto nvel. En onseuena, hoy por hoy los modelos del SVH usados en tratamento de mágenes por lo general están basados en las respuestas psofísas. Sólo unos poos artíulos han revsado el papel del modelado de la vsón humana en las aplaones de tratamento de mágenes (Granrath, 98; Pappas y Safranek, 000). Los modelos del SVH usados en tratamento de mágenes suelen estar basados en una sere de aspetos psofísos que típamente se mplementan de forma seuenal omo se muestra en la Fgura 3.. En general, un modelo ompleto del SVH para tratamento de mágenes se ompone de no etapas:

92 66 Capítulo 3. Representaón de mágenes en el SVH Fgura 3.: Dagrama de bloques de un modelo típo del SVH para tratamento de mágenes.. Lumnana y olor. La prmera etapa de los modelos del SVH mplementa la transformaón a un espao de olor pereptual adeuado, normalmente basado en olores oponentes. Tras este paso, la magen queda desompuesta en un anal aromáto y dos anales romátos que ontenen la nformaón de dferena de olor. Esta prmera etapa se oupa tambén de la perepón no-lneal de la lumnana por parte del SVH. En espaos de olor omo el CIE L*a*b*, esta no-lnealdad ya vene mplementada, pero en otros espaos de olor, omo por ejemplo los lneales tpo RGB, debe añadrse. En las aplaones de ompresón, la no-lnealdad puede norporarse al fjar el error de uantzaón de los oefentes de la transformaón.. Desomposón multanal. Está amplamente aeptado que el SVH basa su perepón en múltples anales que abaran dferentes posones, fases loales, freuenas espaales y orentaones. Este omportamento puede reprodurse muy ben on un bano de fltros multrresoluón o una desomposón tpo wavelet. Un ejemplo de bano de fltros es la transformada órtex (Watson, 987), que es una prámde multrresoluón muy flexble uyos fltros pueden ajustarse en gran medda. 3. Contraste y adaptaón. Según la ley de Weber-Fehner, la respuesta del SVH depende muho menos de la lumnana global que de las varaones loales de la lumnana respeto al entorno rundante. El ontraste es una medda de esta varaón relatva y se utlza muho en los modelos de vsón. Aunque es senllo defnr el ontraste para patrones smples, es muho más dfíl modelar la perepón humana del ontraste en mágenes omplejas, ya que ésta depende del ontendo loal de la magen. Además, la adaptaón a un determnado nvel de lumnana o olor nfluye en la perepón del ontraste. 4. Sensbldad al ontraste. Uno de los aspetos más mportantes en los modelos del SVH, se refere al efeto paso banda, de forma que hay una dsmnuón de

93 3.5 Modelos del SVH para tratamento de mágenes 67 la sensbldad tanto a bajas omo a altas freuenas espaales. Este fenómeno se representa on la funón de sensbldad al ontraste (Contrast Senstvty Funton o CSF). El orreto modelado de la CSF es espealmente dfíl para mágenes en olor. Típamente, se supone que las sensbldades al olor y al patrón son separables, de modo que sólo es neesaro determnar e mplementar una CSF para ada uno de los anales del espao de olor. 5. Enmasaramento. El enmasaramento se produe uando un estímulo, vsble por sí msmo, no se deteta en presena de otro estímulo. A vees puede darse tambén el efeto ontraro, llamado faltaón, que onsste en que un estímulo, que uando está solo no es vsble, se deteta en presena de otro estímulo. En el ontexto del tratamento de mágenes, podemos onsderar que es la magen orgnal la que enmasara o falta la dstorsón. El enmasaramento expla por qué dstorsones smlares son muy molestas en ertas zonas de la magen mentras que son apenas pereptbles en otras zonas. Las ténas pereptuales de evaluaón de aldad de magen (las uales se verán en el Capítulo 9 de esta Tess) representan el estado del arte del modelado del SVH. Por otra parte, la ompresón de mágenes (ver el Capítulo 0) es probablemente la aplaón de tratamento de mágenes más extendda que puede benefarse onsderablemente del uso de modelos del SVH, ya que de esta forma es posble maxmzar la aldad pereptual para ada tasa de ompresón. Frente a los modelos del SVH de nspraón sobre todo psofísa, usados tradonalmente en tratamento de mágenes, esta Tess aboga por el uso de modelos tendentes a la neurobología y on una fuerte omponente estadísta. En onreto, veremos ómo a partr de modelos funonales del órtex vsual prmaro, adaptados a la estadísta de las mágenes naturales, es posble obtener representaones de mágenes estadístamente más ndependentes y además más sgnfatvas desde el punto de vsta pereptual, muy útles por tanto en múltples aplaones de tratamento y análss de mágenes. El futuro de los esquemas multpropósto de tratamento de mágenes de nspraón bológa, pasa sn duda por este tpo de modelos.

94

95 Parte II: Desarrollo teóro e mplementaón

96

97 Capítulo 4 Normalzaón dvsva Con este apítulo omenzamos la segunda parte de esta Tess, propamente el núleo de la msma. Una no-lnealdad partular, la normalzaón dvsva, tomada de los modelos no-lneales de las neuronas del órtex vsual prmaro, es el hlo ondutor de esta parte, que nluye el estudo pormenorzado de sus propedades, el ajuste de sus parámetros y los detalles de mplementaón, que al gual que en el resto de la Tess se ha realzado utlzando MATLAB. En este apítulo en partular se ntroduen algunas deas prevas y herramentas que se neestarán en los próxmos apítulos. Más onretamente, se defnen dos mportantes magntudes, la nformaón mutua (proponéndose además una mplementaón efente para su estmaón) y la urtoss, que nos permtrán medr respetvamente la ndependena estadísta y el aráter dsperso de las varables aleatoras que ntervenen en nuestro problema. Además se desrben e mplementan varos modelos de la estadísta ondonal de oefentes lneales ortogonales de mágenes naturales, relaonados, omo se verá, on el álulo de los parámetros de la normalzaón dvsva. Fnalmente, se espefa el rtero que se segurá para adaptar la normalzaón dvsva a la estadísta de las mágenes naturales. Este rtero, a semejanza de la HCE para los sstemas sensorales, onsste en adaptar la normalzaón para que las respuestas normalzadas sean lo más estadístamente ndependentes posble. El ontendo de este apítulo está reogdo sobre todo en las sguentes dos publaones: Valero y Navarro (003b) y Valero y Navarro (003d). 4. Informaón mutua y urtoss La nformaón mutua (IM), tambén llamada dstana de Kullbak-Lebler (KL) (Kullbak y Lebler, 95; Kullbak, 959), es una medda de la dependena 7

98 7 Capítulo 4. Normalzaón dvsva estadísta entre varables aleatoras. S s, s,..., s n son n varables aleatoras, la IM entre ellas se defne omo sgue (Cover y Thomas, 99): IM p( s, s,..., s ) =... dsn (4.) + + n ( s, s,..., sn)... p( s, s,..., sn)log dsds p( s) p( s)... p( sn) En la práta, la IM se alula a partr de hstogramas, de modo que las ntegrales pasan a ser sumatoros fntos. Fjado el ntervalo y el número de barras de los hstogramas, el álulo dsreto (aproxmado) de la IM es muy sensble a la forma de las fdp y en espeal, a las varanzas de las varables aleatoras. Por este motvo, es onvenente fjar la desvaón estándar de las varables aleatoras (nótese que podemos multplar ada varable por un fator sn modfar la IM entre ellas) e nluso eualzar los hstogramas (se puede demostrar fálmente que s aplamos una nolnealdad monótona a ada una de las varables, la IM no varía) antes de alular la IM, sobre todo s se queren omparar varos resultados. Nosotros típamente alularemos la IM a partr del hstograma onjunto on 00 barras en el ntervalo (-00, 00) de las orrespondentes varables aleatoras, después de fjar su desvaón estándar a 5 on objeto de omparar los resultados. La Tabla 4. muestra algunas meddas de dependena estadísta en térmnos de la IM, para las mágenes del onjunto de entrenamento utlzado en esta Tess (ver Fgura 4.). La IM es sempre no-negatva y vale ero s y sólo s las varables son estadístamente ndependentes. Es mportante señalar que la IM tene en uenta toda la estrutura de dependenas de las varables y no sólo la ovaranza. Es por eso que la IM es la métra que se suele utlzar para onstrur las representaones basadas en Análss en Componentes Independentes (ICA). Por otro lado, una medda lása del aráter dsperso (supergaussano) de una varable aleatora es la urtoss. La urtoss de una varable aleatora s es smplemente una versón normalzada del momento entrado de orden uatro (Abramowtz y Stegun, 97): 4 < ( s < s > ) > k ( s) = 3 (4.) < ( s < s > ) > La urtoss puede ser postva o negatva. Las varables aleatoras que tenen urtoss negatva se llaman subgaussanas y aquellas que tenen urtoss postva se llaman supergaussanas. La urtoss de las varables aleatoras gaussanas vale ero.

99 4. Informaón mutua y urtoss 73 Tabla 4.: IM entre dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ), y entre los orrespondentes oefentes wavelet y j en la subbanda vertal de la esala más baja de una desomposón wavelet de 4 nveles basada en fltros de Daubehes de orden 4. IM( p, p j ) IM(, j ) Boats,075 0,736 Elane,4450 0,0480 Goldhll,340 0,0980 Lena,4364 0,78 Peppers,577 0,086 Salboat,340 0,64 Aquí nos nteresarán sobre todo las varables supergaussanas (dspersas), las uales se araterzan por tener fdp muy pudas en ero y on largas olas (ver Fgura 4.), ya que las respuestas de las neuronas del órtex vsual prmaro a las mágenes naturales son varables de este tpo. Fgura 4.: fdp on una urtoss postva elevada (línea ontnua). En línea dsontnua se muestra una fdp gaussana on la msma varanza.

100 74 Capítulo 4. Normalzaón dvsva Fgura 4.: Imágenes estándar de prueba. De arrba abajo y de zquerda a dereha: Boats, Elane, Goldhll, Lena, Peppers, y Salboat. La urtoss es una medda muy senlla del aráter no-gaussano de una varable aleatora, pero tene el nonvenente de que no es robusta, ya que es muy sensble a los valores extremos. Por tanto, habrá que utlzar esta medda on erta reserva.

101 4. Modelos de la estadísta ondonal de oefentes lneales de mágenes naturales Modelos de la estadísta ondonal de oefentes lneales de mágenes naturales Tal omo se vo en el Capítulo, las transformaones lneales multesala ortogonales son muy populares omo representaones de mágenes. Aunque los oefentes de tales transformaones están prátamente deorrelados, estas transformaones lneales no pueden elmnar las dependenas estadístas de alto orden, debdo a que en general las mágenes naturales no están formadas por sumas de omponentes ndependentes. Para poner de manfesto estas propedades hemos alulado hstogramas ondonales entre oefentes venos en varas transformaones lneales ortogonales y tambén no-ortogonales. La Fgura 4.3 permte omparar los hstogramas ondonales típos de dos oefentes adyaentes de una transformaón lneal (a) ortogonal y (b) no-ortogonal. Como puede verse, los dos oefentes de la transformaón ortogonal están deorrelados, ya que el valor esperado de la ordenada del hstograma ondonal es aproxmadamente ero ndependentemente del valor de la abssa y por tanto, la ovaranza es tambén aproxmadamente ero. Esto es una dferena mportante on respeto a las transformaones no-ortogonales (b), en las que los oefentes adyaentes están fuertemente orrelados, de modo que en el hstograma ondonal orrespondente el valor esperado de la ordenada no es ero, sno que varía lnealmente on la abssa. Por otro lado, en el aso ortogonal (a), la forma de pajarta del hstograma revela que los oefentes no son estadístamente ndependentes. Cualquer par de oefentes, tomados en espao, orentaón o esala, muestra sempre este tpo de dependena (Wegmann y Zetzshe, 990; Smonell, 997). (a) (b) Fgura 4.3: Hstogramas ondonales de dos oefentes venos ( j es el veno nferor de ) en la subbanda vertal de la esala más baja de (a) una desomposón ortogonal y (b) no-ortogonal.

102 76 Capítulo 4. Normalzaón dvsva En la Fgura 4.4 se analza más en detalle el hstograma ondonal de los oefentes de la transformaón lneal ortogonal. En la Fgura 4.4a, se observa que dferentes seones vertales del hstograma ondonal presentan una forma gaussana que se ensanha progresvamente al alejarnos del orgen de oordenadas. En la Fgura 4.4b, se ha tomado el logartmo del valor absoluto de los oefentes. En ese aso, la parte zquerda del hstograma ondonal es prátamente horzontal, mentras que la parte dereha es unmodal sobre la reta de pendente undad. Seones vertales del hstograma presentan ahora una forma aproxmadamente onstante, esto es, que no depende del punto de la abssa en el que se toma la seón. (a) j (b) Log Log j Fgura 4.4: (a) Hstograma ondonal de un oefente wavelet de la subbanda vertal de la esala más baja y su veno nferor dereho j, dos seones vertales de este hstograma y una muestra de fdp gaussanas y lognormales. (b) Lo msmo pero usando varables logarítmas.

103 4. Modelos de la estadísta ondonal de oefentes lneales de mágenes naturales 77 Estas araterístas del hstograma ondonal se mantenen para un rango amplo de mágenes y dferentes pares de oefentes. Además, ésta es una propedad de las mágenes naturales en sí msmas y no de las funones base elegdas (Wanwrght et al., 00). En el ontexto de los modelos del órtex vsual prmaro, se han propuesto varas dstrbuones para modelar la estadísta ondonal de los oefentes que se obtenen al proyetar mágenes naturales sobre una base lneal ortogonal. Nosotros aquí onsderaremos dos modelos alternatvos: uno gaussano (Shwartz y Smonell, 00) y otro lognormal (Wanwrght et al., 00). Estos dos modelos permten ajustar los hstogramas ondonales tanto en el domno lneal omo en el domno logarítmo (ver Fgura 4.4). Fuera del ontexto de los modelos del órtex vsual prmaro tambén se han propuesto otros modelos relaonados, tales omo los modelos de mezla en esala de gaussanas (Gaussan Sale Mxture o GSM) (Wanwrght y Smonell, 000; Wanwrght et al., 00). Sn embargo, estos últmos no se onsderarán aquí porque no son un modelo adeuado de las respuestas dspersas (muy urtótas y por tanto, nogaussanas) de las neuronas de V (una dsusón sobre odfaón dspersa en V puede enontrarse por ejemplo en Olshausen y Feld, 997; Olshausen, 00). La Fgura 4.4 muestra una justfaón gráfa senlla de los modelos gaussano y lognormal. Por un lado, s tomamos dos seones vertales de un hstograma ondonal típo de dos oefentes wavelet de una magen natural, podemos observar que el hstograma ondonal está entrado en ero, tene forma gaussana y su anhura ree on la ampltud de la abssa j. Esto sugere que la fdp ondonal p( { p( j ) j }) puede modelarse on una fdp gaussana on meda nula y varanza gual a la suma de una onstante a más una ombnaón lneal de oefentes al uadrado } (j ) (Shwartz y Smonell, 00): { j p( { j }) = exp π ( a + ) ( + j j ) bj a b j j j (4.3) Por otro lado, s onsderamos el logartmo del valor absoluto de los oefentes wavelet (Fgura 4.4b), entones el hstograma ondonal tambén tene forma gaussana pero su anhura no depende de la abssa. En lugar del ambo de anhura, hay un desplazamento proporonal al valor de la abssa. Es fál ver que este

104 78 Capítulo 4. Normalzaón dvsva omportamento puede modelarse on una fdp lognormal (Athson y Brown, 963). En onreto, la fdp ondonal p( { j }) vendría dada por la sguente expresón (Wanwrght et al., 00): p( { }) = exp log log( + a bj πγ γ j j j ) (4.4) Nótese que γ y log( a + b ) en la Euaón 4.4, representan respetvamente la varanza y la meda de la fdp gaussana que modela la fdp ondonal en el domno logarítmo. j j j Algunos ejemplos de fdp perteneentes a estos dos modelos se muestran a la dereha en la Fgura 4.4, para permtr una omparaón vsual dreta on los hstogramas reales. Como puede verse, los dos modelos son bastante smlares y reproduen ben las prnpales araterístas de la estadísta ondonal de los oefentes wavelet de mágenes naturales, tanto en el domno lneal omo en el logarítmo. En los dos modelos, a y {b j } ( j) son parámetros lbres y pueden alularse utlzando por ejemplo el método de estmaón de máxma verosmltud (Maxmumlkelhood Estmaton o MLE). Operando on las Euaones 4.3 y 4.4, se llega a las sguentes euaones MLE para el modelo gaussano y lognormal respetvamente: { a, b j } = arg { a mn E (4.5), b j + log( a + } b ) j j a + bj j j j { a, b j } = arg { a mn E (4.6), b j } log log( a + bj j ) j γ = E log log( + b ) (4.7) a j j j donde E denota valor esperado. Estudando las dependenas entre oefentes en espao, orentaton y esala, se observa una aída suave de la dependena estadísta (ver Fgura 4.5). Sn embargo, fundamentalmente por smpldad (ver Capítulos 5 y 6),

105 4. Modelos de la estadísta ondonal de oefentes lneales de mágenes naturales 79 en general onsderaremos los oefentes { j } (j ) adyaentes a a lo largo de las 4 dmensones (8 en un uadrado en el espao D, en orentaón y en esala). 3.5 (a) IM dstana 3.5 (b) IM dstana Fgura 4.5: IM en funón de la dstana de dos oefentes wavelet venos (uno sempre está en la subbanda vertal de la esala más baja) (a) en espao (la urva x es para la dreón horzontal y o para la vertal) y (b) en esala ( x ) y orentaón ( o ), de la magen Lena.

106 80 Capítulo 4. Normalzaón dvsva Una forma alternatva de determnar qué oefentes nlur en el onjunto ondonal es obtener el onjunto de oefentes ntrabanda e nterbanda que mnmza la dstana KL entre la fdp ondonal real y el modelo estadísto (Bugross y Smonell, 999). Una vez elegdo el onjunto ondonal, los parámetros del modelo estadísto se alulan usando las esperanzas matemátas de las Euaones 4.5, 4.6 y 4.7 sobre todos los oefentes de las 6 mágenes de entrenamento (ver Fgura 4.), pero ndependentemente para ada subbanda de la prámde wavelet. Para resolver los orrespondentes problemas de mnmzaón, usamos un método lneal de búsqueda (la funón fmnon del toolbox de optmzaón de MATLAB), mponendo la ondón adonal de postvdad de los parámetros lbres del modelo para evtar la nestabldad de la onvergena de la optmzaón. Este método proporona un ajuste muy bueno de ambos modelos (en espeal del gaussano) a los datos reales (ver Fgura 4.6), omo puede omprobarse por ejemplo alulando la raíz uadrada de la suma de los errores al uadrado entre los modelos dsretzados y los hstogramas ondonales reales (0,008 y 0,0975 para el modelo gaussano y lognormal respetvamente, en los ejemplos de la Fgura 4.6). 4.3 Adaptaón de la normalzaón dvsva La no-lnealdad en la que se entra esta Tess es de tpo dvsvo y está tomada de los modelos de normalzaón dvsva de las neuronas del órtex vsual prmaro, propuestos por Smonell y olaboradores (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00). La expresón general es la sguente: + e r = d j j j (4.8) donde r es la respuesta resultante, y j representan oefentes obtendos proyetando mágenes naturales sobre un onjunto de funones base ortogonales (estos oefentes onsttuyen la entrada a la normalzaón dvsva) y la onstante y los pesos {e j } son parámetros lbres que vendrán determnados por la estadísta de las mágenes naturales. El vendaro j en el denomnador puede nlur venos en las uatro dmensones: el espao XY, la esala y la orentaón. En los modelos de las neuronas de V basados en la normalzaón dvsva, los parámetros de la normalzaón pueden alularse a partr de la estadísta de las d

107 4.3 Adaptaón de la normalzaón dvsva 8 mágenes naturales s se aepta la hpótess de que los sstemas sensorales están adaptados a las propedades estadístas de las señales a las que están expuestos (Attneave, 954; Barlow, 96). En otras palabras, esta hpótess (ver Apartado 3.3.) vene a der que las respuestas neuronales deben ser estadístamente ndependentes (a) (b) Fgura 4.6: Hstograma ondonal de un oefente wavelet de la subbanda vertal de la esala más baja de la magen Lena, onoda la orrespondente ombnaón lneal s de oefentes wavelet adyaentes, onsderando el modelo (a) gaussano y (b) lognormal (ambos en línea ontnua).

108 8 Capítulo 4. Normalzaón dvsva Análogamente, podemos adaptar la no-lnealdad de la Euaón 4.8 a la estadísta de las mágenes naturales, on objeto de obtener una representaón efente de dhas mágenes. La no-lnealdad óptma vendrá defnda por aquellos valores de los parámetros (onstante d y pesos {e j } en la Euaón 4.8) que mnmzan la dependena estadísta entre las respuestas normalzadas para un onjunto de mágenes naturales (este onjunto de entrenamento ontene un número arbtraro de mágenes). De esta forma, se establee un nexo de unón entre los modelos de la estadísta ondonal de los oefentes lneales ortogonales de las mágenes naturales, que veíamos en el apartado anteror, y la no-lnealdad dvsva. Obvamente, tambén son posbles otros rteros a la hora de alular los parámetros de la normalzaón dvsva. Por ejemplo, sn salrnos del ontexto de los modelos omputaonales de V, veíamos en el Capítulo 3 que un posble prnpo alternatvo de representaón de mágenes en el órtex vsual humano onsste en la maxmzaón del aráter dsperso de la representaón. Nosotros aquí no seguremos este prnpo (que oblga a mponer ondones adonales), pero sí veremos que está muy relaonado on el prnpo de odfaón efente, en el sentdo de que al aumentar la ndependena estadísta de una representaón, en general estamos aumentando tambén el aráter dsperso de la msma.

109 Capítulo 5 Esquema smple Smonell y olaboradores (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00) han propuesto modelos no-lneales, basados en la normalzaón dvsva y adaptados a la estadísta de mágenes naturales, del órtex vsual prmaro (V). En este apítulo, presentamos una formulaón matemáta y un análss más rguroso de estos modelos en térmnos de la IM omo métra de la ndependena estadísta. Aquí demostramos que la eleón ad ho de los parámetros de la normalzaón dvsva propuesta por Smonell y olaboradores no garantza la ndependena estadísta entre las respuestas de salda, s ben, hemos enontrado un resultado nteresante y es que esa eleón garantza que ada salda es estadístamente ndependente de prátamente todas las entradas lneales. Esto se umple para los dos modelos (gaussano y lognormal) de la estadísta de mágenes naturales analzados teóramente y es oherente on los resultados empíros obtendos a partr de un onjunto de mágenes naturales. Este apítulo ha dado lugar a las sguentes publaones: Valero y Navarro (003d) y Valero y Navarro (004). 5. Estudo teóro Smonell y Shwartz (999) señalaron que una normalzaón dvsva adaptada estadístamente permte redur las dependenas estadístas de alto orden entre las respuestas en los modelos de las neuronas de V. Nuestro objetvo aquí es formular matemátamente esta dea empíra. Utlzaremos la fdp gaussana de la Euaón 4.3 para modelar la estadísta ondonal de los oefentes obtendos al proyetar mágenes naturales sobre una base lneal ortogonal (wavelet), s ben los desarrollos matemátos y los resultados son ompletamente análogos en el aso de una fdp lognormal (Euaón 4.4). 83

110 84 Capítulo 5. Esquema smple Comenemos estudando la relaón estadísta entre las respuestas normalzadas venas. Con objeto de smplfar sgnfatvamente la formulaón, ntroduremos dos restrones. Prmero, elmnaremos el propo oefente en el denomnador de la normalzaón dvsva, esto es, haremos e = 0 en la Euaón 4.8. Esto es poo plausble bológamente, pero on freuena se ha mpuesto ad ho en este tpo de modelos senllos (Smonell y Shwartz, 999; Shwartz y Smonell, 00; Wanwrght et al., 00), por lo que en este apítulo mantendremos esta restrón. Por otro lado, tambén por smpldad, onsderaremos sólo un par de oefentes lneales y venos. Bajo estas dos ondones smplfadoras, estudaremos la IM entre las dos respuestas normalzadas r y r, sendo nmedata la generalzaón a un numero ualquera de oefentes. Partendo de las defnones de la IM para las uatro parejas posbles de las varables mpladas y aplando el teorema del ambo de varable (Papouls, 99), es senllo llegar a la sguente relaón: IM ( r, r ) = = IM ( r, ) + IM (, r ) IM (, ) p(, ) log( e e r r ) d d (5.) Desmostremos esta euaón. S susttumos las tres nformaones mutuas por sus orrespondentes defnones y agrupamos térmnos, entones la parte dereha de la Euaón 5. se onverte en: p p( r, ) p( (, )log d d p( r ) p( r ) p(, )( eer r ), r ) (5.) Segudamente, usamos el teorema del ambo de varable (Papouls, 99) para obtener las sguentes expresones de las fdp onjunta p ( r, ) y p, r ) : ( p( r, ) = p( r, r ( r r ) ) r = onst = p( r, r ( e ) d + e d r r ) er (5.3)

111 5. Estudo teóro 85 ), ( ) )(, ( ) ( ), ( r r e e r e d d p e d p r r p onst + = = + = = = ), ( p (5.4) Fnalmente, substtuyendo la Euaón 5.3 y 5.4 en la Euaón 5. y smplfando, se llega a la defnón de IM(r,r ), omo queríamos demostrar: ), ( ) ( ) ( ), ( ) log, ( ) ( ) ( ), ( ) log, ( r r IM dr dr r p r p r r p r r p d d r p r p r r p p = = = (5.5) A partr de la Euaón 5., podemos obtener las uatro ondones neesaras de mínmo de IM(r,r ) para los parámetros lbres de la normalzaón, e, y e. Tomando dervadas parales e gualándolas a ero, se obtenen para y e las sguentes ondones de mínmo (las ondones para y e son ompletamente análogas): d d d d 0 ), ( ), ( ), ( 0 0 = + = + + d d r r e e r r e e e d p d r IM d r r IM (5.6) 0 ), ( 0 0 = + + = d d r r e e e d p e e ), ( ), ( + + r r e d r IM r r IM (5.7) Shwartz y Smonell (00) y Wanwrght et al. (00) usaron dretamente los parámetros del modelo de la estadísta ondonal y {b j } ( j) (ver Capítulo 4) omo parámetros de la normalzaón dvsva. Esto es, d = y e j = b j ( j). S onsderamos esta eleón de parámetros, puede demostrarse que el prmer sumando de ada ondón de mínmo vale ero. Para ver esto últmo, estudemos las dervadas parales a a ), ( d r IM y ), ( e r IM, omenzando on la defnón de : ), ( r IM

112 Capítulo 5. Esquema smple ) ( ) ( ), ( )log, ( ), ( d d p r p r p p r IM + + = (5.8) En la Euaón 5.8, las fdp que dependen de los parámetros d y e son y, así que obtenemos expresones para dhas fdp usando los teoremas del ambo de varable, el de Bayes y el de la probabldad total (Papouls, 99): ), ( r p ( ) r p ) ( ) ( ) ( ), ( ), ( p e d r p r e d r p r p onst + = + = = = (5.9) + = = + = + = 0 0 ) ( ) ( ξ ξ ξ ξ ξ d p e d r p e d r + = = = ), ( ) ( ξ ξ d r p r p (5.0) Ahora, tomamos la dervada de y on respeto a (nótese que usamos la fdp gaussana de la Euaón 4.3 para modelar ): ), ( r p ) ( r p d ) ( p ), ( ), ( r p e d d r p + = (5.) ( ) = = + = + + = = + = = = + = ) ( ) ( ) ( ) ( ) ( ) ( ) ( ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ ξ d p e d r p b a e d r d p e d r p b a e d e d r d p e d r p e d r r p e d d + = ) p(r (5.) A partr de la Euaón 5. y 5. es dreto obtener ), ( d r IM :

113 5. Estudo teóro 87 ( ) ), ( ) ( ) ( ) ( ), ( ), ( d d b a r p d d d p e d r p b a e d r p r e d p d r IM = = + = = ξ ξ ξ ξ ξ ξ (5.3) Y análogamente, podemos obtener ), ( e r IM : ( ) ), ( ) ( ) ( ) ( ), ( ), ( d d b a r p d d d p e d r p b a e d r p r e d p e r IM = = + = = ξ ξ ξ ξ ξ ξ (5.4) Fnalmente, s evaluamos las Euaones 5.3 y 5.4 en la eleón de parámetros = y e = b propuesta por Smoell y olaboradores (Shwartz y Smonell, 00; Wanwrght et al., 00), es fál ver que d a 0 ), (, = = = b e a d d r IM y 0 ) (, = = = b e a d, e r IM. Por ejemplo, la Euaón 5.3 se onverte en: 0 ), ( ) ( exp ) ( ), ( ), ( , = + + = + = = = d d b a r p d d d p r r p r b a p d r IM b e a d ξ ξ π (5.5) que vale ero, ya que:

114 88 Capítulo 5. Esquema smple p( r ) = r exp d = a, e = b πr (5.6) + p( = ξ ) dξ = (5.7) 0 Una manera alternatva de ver esto es darse uenta de que, para esa eleón partular de los parámetros, r y por un lado y r y por otro son estadístamente ndependentes omo veremos más adelante. Esto mpla que las dervadas parales d IM ( r, d j ) =, e j = b j ( j) y e = 0. a y IM ) ( r, j e j deben ser ero uando se evalúan en El segundo sumando de las ondones de mínmo, sn embargo, no vale ero en general, ya que el ntegrando es sempre postvo y no vale ero en todo el domno de ntegraón. Por tanto, podemos onlur que la eleón de parámetros ad ho d =, e j = b j ( j) y e = 0 no proporona un mínmo (n absoluto n loal) de la IM de las repuestas de salda r. Esto sgnfa que la eleón de parámetros propuesta por Smonell y olaboradores no proporona respuestas de salda estadístamente ndependentes y que dha eleón n squera es óptma en ese sentdo. No obstante, las ondones de mínmo de la IM son aproxmadamente ertas uando se evalúan en d a = y e j = b j ( j) para el aso de mágenes naturales: el prmer térmno de las a ondones de mínmo es ero y el segundo térmno es aproxmadamente ero, ya que, debdo fundamentalmente al aráter dsperso de las respuestas de salda, podemos aproxmar las ntegrales por el valor del ntegrando en el orgen. Esto sugere que esta eleón de parámetros está era del mínmo de la IM y por tanto era de la soluón óptma. De heho, veremos en el Apartado 5.3 que la IM de las respuestas de salda se redue drástamente, hasta valer prátamente ero. Nótese tambén que para el aso partular en el que b = b = 0, esto es, en el que y son ndependentes, entones IM(r,r ) = IM(, ) = IM(r, ) = IM(r, ) = 0. Esto quere der que la normalzaón dvsva mantene la ndependena en la salda uando ésta ya exste en la entrada. Segudamente, estudemos la relaón estadísta entre las respuestas normalzadas de salda r y los oefentes lneales de entrada al uadrado { j } la fdp ondonal, usamos de nuevo el teorema del ambo de varable: (j ). Para obtener

115 5. Estudo teóro 89 p( r { }) = = πr j p( r ( ) + j exp 3 ( ) ( ) r e a + bj j r e a + bj j d { }) j e j j { } = onst j j = r d + j j e j j (5.8) Ahora es fál ver que s elegmos otra vez = y e j = b j ( j), entones p( r { j }) no depende de } (j ), o en otras palabras, r y } (j ) son estadístamente ndependentes. Es mportante señalar que una vez que elegmos d = y e j = b j ( j), la ndependena estadísta entre la entrada y la salda no a depende del valor de e, de modo que, en lugar de ero, uno podría usar un valor más plausble bológamente. { j En resumen, en este apartado hemos vsto que los modelos no-lneales basados en la normalzaón dvsva de Shwartz y Smonell (00) y Wanwrght et al. (00) no están optmzados para mnmzar las dependenas estadístas entre las respuestas de salda. Sorprendentemente, ha quedado demostrado sn embargo que estos modelos partulares orresponden a la soluón que elmna ompletamente las dependenas entre las respuestas normalzadas r y los oefentes lneales al uadrado d a { j (j ). En los sguentes apartados, exploraremos un poo más estas uestones usando para ello expermentos numéros on mágenes naturales. { j } 5. Implementaón Los expermentos numéros se han llevado a abo usando el onjunto de entrenamento de la Fgura 4. on ses mágenes estándar en blano y negro y de 5 x 5 píxeles ( Boats, Elane, Goldhll, Lena, Peppers, y Salboat ). Los oefentes lneales de entrada se obtuveron aplando una desomposón wavelet de 4 nveles basada en fltros de Daubehes de orden 4 (db8), esto es, on 4 momentos evanesentes y 8 oefentes (Daubehes, 99). Esto da lugar a subbandas (horzontal, vertal y dagonal para ada una de las 4 esalas onsderadas aquí) más un anal paso bajo adonal. La estadísta ondonal de los oefentes wavelet resultantes se modeló usando tanto un modelo gaussano (Euaón 4.3) omo uno lognormal (Euaón 4.4). Como vendaro { j } (j ) hemos onsderado los oefentes adyaentes a a lo

116 90 Capítulo 5. Esquema smple largo de las 4 dmensones (8 en un uadrado en el espao D, en orentaón y en esala). Los parámetros del modelo estadísto se alulan usando las esperanzas matemátas de las Euaones 4.5, 4.6 y 4.7 sobre todos los oefentes de las 6 mágenes de entrenamento, pero ndependentemente para ada subbanda de la prámde wavelet. Para resolver los orrespondentes problemas de mnmzaón, se usó un método lneal de búsqueda (la funón fmnon del toolbox de optmzaón de MATLAB), mponendo la ondón adonal de postvdad de los parámetros lbres del modelo para evtar la nestabldad de la onvergena de la optmzaón. Las Fguras 5., 5. y 5.3 muestran los valores de los parámetros del modelo gaussano para todas las subbandas. En general, los valores {b j } ( j) son muho menores que uno y, omo era de esperar, los valores más altos orresponden a aquellos oefentes venos en espao, orentaón y esala, que tenen una mayor dependena estadísta on el oefente. Fnalmente, asgnamos los parámetros resultantes al modelo no-lneal basado en la normalzaón dvsva de forma que =, e j = b j ( j) y e = 0. d a 5.3 Resultados Cuando aplamos la normalzaón dvsva on los parámetros que aabamos de ver, las respuestas muestran una aparena rudosa, omo puede verse en la Fgura 5.4. Esto es porque la transformaón no-lneal tene el efeto de haer más aleatora (menos estruturada) la representaón de la magen on objeto de redur las dependenas estadístas entre los oefentes que perteneen a un msmo elemento estrutural. La Fgura 5.5 muestra uatro hstogramas ondonales e lustra la progresva ndependena estadísta onseguda medante la aplaón suesva de la transformaón lneal (wavelet) y no-lneal (normalzaón). El hstograma superor (a) orresponde a la magen orgnal, de forma que p y p j son píxeles adyaentes (p j es el veno nferor dereho de p ). La pendente prátamente gual a del hstograma demuestra la fuerte orrelaón entre los píxeles. El hstograma entral (b) orresponde a los oefentes wavelet y j. Ahora el valor esperado de la ordenada es aproxmadamente ero ndependentemente de la abssa, lo ual sgnfa que la transformada wavelet ortogonal ha elmnado efazmente la orrelaón nal. Sn embargo, esta transformaón lneal no puede elmnar las dependenas estadístas de alto orden, omo demuestra la forma de pajarta del hstograma. La parte nferor de la Fgura 5.5 muestra dos hstogramas ondonales tras la normalzaón dvsva. El de la zquerda () es el hstograma ondonal de las dos respuestas de salda r y r j. Por otro lado, el de la dereha (d) orresponde al hstograma ondonal entre la repuesta

117 5.3 Resultados 9 0,00 (a) 0,09 0,7 0,08 0,00 0,5 0,5 0,06 0,08 0,8 0,09 0,0 0, 0,04 (b) 0,04 0,8 0,05 0,00 0,0 0,0 0,0 0,04 0, 0,04 0,00 0, 0, () 0,04 0,8 0,03 0,00 0,0 0, 0,00 0,05 0,4 0,03 0,00 0,0 0,09 (d) 0,0 0,3 0,07 0,00 0,0 0,3 0,00 0,04 0,9 0,04 0,00 0,40 Fgura 5.: Valores de los parámetros del modelo estadísto gaussano para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 8 parámetros espaales. Los parámetros en freuena están dspuestos vertalmente, y horzontalmente los dos parámetros en orentaón. El valor de se muestra debajo, dentro de la elpse punteada. a

118 9 Capítulo 5. Esquema smple 0,00 (a) 0,06 0,6 0,06 0,0 0,6 0,7 0,04 0,06 0,6 0,06 0,0 0,4 0,05 (b) 0,04 0, 0,04 0,00 0,7 0, 0,05 0,03 0,0 0,04 0,00 0,4 0,4 () 0,03 0,4 0,03 0,00 0,6 0,3 0,00 0,0 0, 0,03 0,00 0,05 0,4 (d) 0,09 0,7 0,03 0,00 0, 0,9 0,00 0,00 0,9 0,08 0,00 0,0 Fgura 5.: Valores de los parámetros del modelo estadísto gaussano para las subbandas vertales de las dferentes esalas.

119 5.3 Resultados 93 0,00 (a) 0,06 0,9 0,08 0,0 0,5 0,4 0,00 0,08 0,0 0,07 0,03 0,4 0,0 (b) 0,05 0,6 0,06 0,00 0,6 0,8 0,00 0,07 0,7 0,06 0,03 0,08 0,4 () 0,0 0,9 0,04 0,00 0,4 0,6 0,00 0,06 0, 0,0 0,03 0,03 0,40 (d) 0,03 0,6 0,03 0,0 0, 0,6 0,00 0,04 0,0 0,05 0,00 0,6 Fgura 5.3: Valores de los parámetros del modelo estadísto gaussano para las subbandas dagonales de las dferentes esalas.

120 94 Capítulo 5. Esquema smple (a) (b) () Fgura 5.4: (b) Desomposón de Daubehes y () no-lneal, de la magen Ensten (a).

121 5.3 Resultados 95 p 00 (a) p j (b) j r () r (d) r j s Fgura 5.5: Hstogramas ondonales de (a) dos píxeles venos p y p j (p j es el veno nferor dereho de p ), (b) dos oefentes wavelet y j, () dos respuestas no-lneales r y r j, y (d) una respuesta nolneal r y la orrespondente ombnaón lneal s de oefentes wavelet al uadrado adyaentes a, de la magen Ensten, usando el modelo lognormal. La subbanda onsderada es sempre la subbanda dagonal de la esala más baja.

122 96 Capítulo 5. Esquema smple de salda r y la orrespondente ombnaón lneal wavelet al uadrado de oefentes (j ). Ésta es una manera de analzar la dependena estadísta entre la respuesta de salda r y todos los oefentes wavelet de entrada al uadrado { j } { j } (j ) adyaentes a smultáneamente. Tras la normalzaón, tanto las dependenas estadístas a la salda omo entre la salda y la entrada son prátamente nulas, ya que en ambos asos los hstogramas ondonales resultantes son aproxmadamente ndependentes del valor de la abssa. La Tabla 5. muestra numéramente la dsmnuón de la dependena estadísta en térmnos de la IM. Coherentemente on la Fgura 5.5, la IM es alta, aproxmadamente, en el domno de la magen. La IM es muho menor en el domno wavelet, después de elmnar las orrelaones lneales. La normalzaón dvsva todavía redue más la IM hasta valores muho más eranos a ero. Nótese que esto se ha obtendo on una magen externa al onjunto de entrenamento lo que muestra la generaldad y robustez del modelo. Tanto la transformada wavelet omo la normalzaón dvsva, pareen redur la IM en un fator en torno a 6, de forma que su aón tene un efeto multplatvo reduendo la IM en un fator de as 36. Estos resultados muestran además que, en la práta, las dependenas entre pares de saldas normalzadas se reduen onsderablemente, a pesar de que la normalzaón dvsva onsderada no proporona en teoría un valor mínmo de la IM. s = j b j j Tabla 5.: IM entre dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ) de la magen Ensten, entre los oefentes wavelet resultantes y j, entre las respuestas normalzadas r y r j, y entre la respuesta normalzada r y la orrespondente ombnaón lneal s de oefentes wavelet al uadrado adyaentes a. La subbanda onsderada es sempre la dagonal de la esala más baja. IM( p, p j ) IM(, j ) IM( r, r j ) IM( r, s ) Modelo gaussano 0,0 0,03,05 0,7 Modelo lognormal 0,03 0,03 Por otro lado, en la Tabla 5. apenas se observa dferena entre la ndependena estadísta a la salda y entre la entrada y la salda, onsegudas por la etapa no-lneal.

123 5.3 Resultados 97 Esto onfrma el heho de que para el aso de mágenes naturales, el mínmo global de la IM entre la entrada y la salda paree estar era del mínmo de la IM a la salda y así, onsguéndose la ndependena nterapa entre la entrada y la salda, se está reorrendo la mayor parte del amno haa la ndependena ntraapa a la salda. Fnalmente, y omo se verá en el apítulo sguente, donde se aporta un onjunto mayor de resultados, es mportante señalar la robustez de los modelos no-lneales basados en la normalzaón dvsva y adaptados a la estadísta, en el sentdo de que los resultados no dependen sgnfatvamente n de la desomposón lneal (sempre que sea ortogonal), n del modelo de la estadísta ondonal de los oefentes lneales, del vendaro onsderado, n del onjunto de entrenamento de mágenes naturales. Tampoo paree que nfluyan los errores de álulo (por ejemplo al estmar los parámetros), n la magen onreta (perteneza ésta o no al onjunto de entrenamento).

124

125 Capítulo 6 Esquema uas-óptmo En el apítulo anteror se ha estudado teóra y empíramente el esquema ad ho de Smonell y olaboradores, habendo enontrado que no orresponde al mínmo absoluto de IM y que por tanto no proporona la máxma ndependena estadísta de las respuestas. En este apítulo nos oupamos del problema de enontrar la normalzaón dvsva que mnmza la dependena estadísta de las respuestas de salda. Para ello, formulamos el problema en térmnos de la IM de las respuestas, omo una medda dreta de la ndependena estadísta de las msmas. De esta manera llegamos a la expresón general del mínmo global de la IM. S partularzamos la expresón general, suponendo un modelo gaussano para la estadísta ondonal de los oefentes lneales de mágenes naturales, podemos obtener una expresón aproxmada más senlla de resolver numéramente. Esta expresón aproxmada permte alular unos valores uas-óptmos de los parámetros, de forma que la normalzaón dvsva proporona un valor de la IM próxmo al mínmo global. Aunque este valor es mayor que ero, es muy pequeño, por lo que prátamente se alanza la ndependena estadísta. Usando mágenes naturales, hemos omparado esta soluón uas-óptma on la aproxmaón ad ho estudada en el apítulo anteror y en general la uas-óptma proporona la menor IM entre respuestas, s ben la dferena es pequeña. El ontendo de este apítulo ha dado lugar a las sguentes publaones: Valero y Navarro (003a), Valero y Navarro (003b), Valero y Navarro (003) y Valero y Navarro (004). 6. Estudo teóro Denomnaremos normalzaón dvsva óptma a aquella defnda por los valores de los parámetros (onstante d y pesos {e j } en la Euaón 4.8) que proporonan la mínma 99

126 00 Capítulo 6. Esquema uas-óptmo IM, esto es, que mnmza la dependena estadísta entre las respuestas normalzadas para un onjunto de mágenes naturales. Este onjunto de entrenamento puede ontener en general un número arbtraro de mágenes, aunque en nuestra mplementaón seguremos usando el de la Fgura 4.. En este apartado, el objetvo es llegar a una expresón matemáta explíta de los valores óptmos de los parámetros de la normalzaón dvsva. Con este propósto, omenzamos formulando la ondón de óptmo en el aso general. Segudamente nos entramos en el aso partular de estadísta ondonal gaussana de los oefentes obtendos proyetando mágenes naturales sobre bases lneales ortogonales (Apartado 6..). Esta suposón es realsta para mágenes naturales, omo ya ha quedado demostrado en el apítulo anteror. Bajo este modelo gaussano llegamos a una ondón de uas-óptmo (Apartado 6..3), que es muho más senlla de resolver y que está era del mínmo global de la IM. 6.. Condón general de óptmo Para obtener la ondón general de óptmo, partmos de la defnón de la IM (dstana KL) de las respuestas normalzadas r, que es la funón a mnmzar: IM p( r, r,..., r ) =... drn (6.) + + n ( r, r,..., rn )... p( r, r,..., rn )log dr dr 0 0 p( r ) p( r )... p( rn ) Entones usamos el teorema del ambo de varable (Papouls, 99) para expresar la fdp onjunta de las respuestas normalzadas p(r, r,, r n ) en funón de la fdp onjunta de las entradas lneales elevadas al uadrado p(,,..., ) : n p( r, r,..., r n p(,,..., n ) ) = (6.) det[ J(,,..., )] n donde J(,,..., n ) Euaón 6. puede alularse omo sgue: representa la matrz jaobana. El determnante jaobano de la ( r, r,..., rn ) r r... rn [ J(,,..., )] = det = det[ Id R E] det n (6.3) (,,..., n )... n

127 6. Estudo teóro 0 donde Id representa la matrz dentdad, E la matrz de pesos {e j } y R la matrz dagonal de las respuestas normalzadas r. Susttuyendo la Euaón 6. y 6.3 en la Euaón 6. y ambando las varables de ntegraón, se llega a: IM ( r, r,..., r ) = = n... n p(,,..., n ) p(,,..., n ) log r r... rn p( r ) p( r )... p( rn ) det[ Id R E] d d... d n (6.4) Y por tanto la expresón general del onjunto de parámetros que mnmza la IM es: { d, e } = arg mn j = arg max { d, ej } + { d, ej }... IM ( r, r,..., r ) = + p(,,..., ) log n n ( r r... rn p( r ) p( r )... p( rn ) det [ Id R E] ) d d... dn (6.5) Podemos r un paso más allá, ya que las fdp de las respuestas normalzadas p(r ) pueden expresarse en térmnos de las orrespondentes fdp ondonal de los oefentes lneales omo sgue. Aplquemos de nuevo el teorema del ambo de varable para obtener las fdp ondonal de las respuestas normalzadas de salda r dados los oefentes lneales al uadrado en un erto vendaro loal { } (j ): j p( r { p( { j }) }) = = d + ej 3 r ( ) r ( ) j r e j j p( { j }) (6.6) Ahora, aplando el teorema de Bayes e ntegrando on respeto a { } (j ) obtenemos la expresón deseada de las fdp de las saldas: j + + p ( r )... p( r { j }) p({ j }) d... d d +... dn 0 0 = (6.7) La Euaón 6.7 es espealmente útl uando se dspone de una expresón analíta para las fdp ondonal de las entradas.

128 0 Capítulo 6. Esquema uas-óptmo 6.. Soluón aproxmada En el Capítulo 4 hemos vsto que se han propuesto varas dstrbuones en el ontexto de los modelos de V para modelar la estadísta ondonal de los oefentes obtendos al proyetar mágenes naturales sobre un onjunto de funones base ortogonales (Shwartz y Smonell, 00; Wanwrght et al., 00). De los dos modelos que hemos onsderado, aquí nos entraremos en el gaussano de Shwartz y Smonell (00). La fdp gaussana es la dada por la Euaón 4.3. Nótese que ( a + j b ), donde a y {b j } ( j) son parámetros lbres, es la varanza de la fdp j j ondonal gaussana de meda nula. Como ya hemos dho, esta fdp es oherente on la observaón empíra de que la desvaón estándar de ree on el valor absoluto de los oefentes venos { j } (j ). Los parámetros a y {b j } ( j) se estman según el método desrto en el Apartado 4.. S haemos =, e j = b j ( j) y e = 0, el exponente de la Euaón 4.3 se d a onverte en la defnón de la normalzaón dvsva exepto por una onstante multplatva. De heho, esta es la normalzaón ad ho, que utlza dretamente los parámetros del modelo gaussano, a y b j ( j), omo parámetros de la normalzaón. En el apítulo anteror ha quedado demostrado que esta eleón ad ho de parámetros elmna teóramente las dependenas estadístas entre las respuestas normalzadas r y los oefentes lneales de entrada { j } (j ), pero no entre las respuestas normalzadas. En efeto, s evaluamos las ondones de mínmo para estos valores de los parámetros: IM ( r, r,..., r n ) d E r [ elemento ( ) + ] 0 de Id E R (6.8) j IM ( r, r,..., rn ) r [ elemento ( ) ] de Id E R + + E 0 (6.9) ej ( ) + r elementoj de Id R E IM r, r,..., r ( e n ) 0 (6.0)

129 6. Estudo teóro 03 Las Euaones 6.8 y 6.9 son sólo aproxmadamente ero para el aso de mágenes naturales. Nótese que on mágenes naturales p(r,r,,r n ) tende a mostrar un fuerte po en el orgen. Por eso podemos aproxmar los valores esperados por los valores en el orgen. Esto expla los buenos resultados numéros presentados en la lteratura, que muestran una fuerte reduón de la IM uando se usa esa eleón de parámetros. Sn embargo es mportante no olvdar que ésta es sólo una aproxmaón y que esta eleón de parámetros en general no es la soluón de la Euaón 6.5. Observando el sgno de las dervadas parales de la IM (Euaón 6.8 y 6.9), se espera que los valores óptmos sean y e j b j ( j). Por otro lado, la eleón de los parámetros onsderada, en partular e = 0, esto es, elmnar el propo oefente lneal del vendaro, no es oherente on algunos datos fsológos expermentales, lo que lmta la plausbldad bológa del modelo. En la práta, la IM de las respuestas normalzadas, IM(r, r,, r n ), no depende del valor de los parámetros e de la normalzaón dvsva (puede demostrarse que d a IM ( r, r,..., r e n ) = 0, para ualquer estadísta de las entradas lneales), de forma que el valor de estos parámetros es totalmente arbtraro Condón de uas-óptmo En el apartado anteror hemos vsto que la eleón de parámetros d = y e j = b j ( j), nsprada en un modelo gaussano, es una soluón aproxmada, que puede alularse fálmente, de la Euaón 6.5, tal omo se ha demostrado empíramente (Shwartz y Smonell, 00; Valero y Navarro, 003d) y hemos omprobado en el apítulo anteror. Aquí aproveharemos este heho. La dea bása es smplfar la Euaón 6.5 suponendo que las fdp de las respuestas no-lneales proporonadas por la soluón exata pueden aproxmarse por aquellas orrespondentes a la soluón aproxmada. Esto sgnfa que podemos aproxmar p(r ) partularzando su defnón en la Euaón 6.7 para el aso en el que = y e j = b j ( j), es der: d a a p( r ) = πr ( re ) 3 exp r re (6.)

130 04 Capítulo 6. Esquema uas-óptmo Esta aproxmaón ajusta muy ben los datos reales, omo puede omprobarse por ejemplo alulando la dstana KL entre los hstogramas reales y las orrespondentes fdp dsretzadas (ver Apartado 6.3). Con esta aproxmaón, la Euaón 6.5 se onverte en: n n r r k k { d E log + log( det[ Id R E] ) (6.), e j } = arg max 3 { d, e j } k = ( rk ekk ) k = rk ekk que se resuelve muho más efentemente, ya que elmna la neesdad de estmar las fdp margnal de las respuestas no-lneales. Es nteresante haer notar que para mágenes naturales, el valor de las respuestas normalzadas r es próxmo a ero (las fdp margnal tenden a mostrar un fuerte po en ero), lo ual mpla que det[id-r E] puede aproxmarse por el produto de los elementos de la dagonal prnpal de la matrz: ( - r e ) ( - r e )... ( - r n e nn ). Y operando en la Euaón 6., llegamos a: { r d, e j } = arg max E = { d, e j } log r e r e = arg mn E { d, e j } log( d + ej j ) + j d + ej j j r (6.3) Las Euaones 6.3 y 4.5 son equvalentes, lo que sgnfa que on estas aproxmaones llegamos de nuevo a la soluón aproxmada vsta en el Apartado 6... Esto es otra prueba más de que la Euaón 6. es una buena aproxmaón de la Euaón 6.5, es der, de la soluón general del problema de obtener ndependena estadísta máxma medante una normalzaón dvsva de los oefentes lneales. 6. Implementaón Intentar resolver dretamente la Euaón 6. no es muy efente, debdo prnpalmente al determnante que aparee, uyo álulo mpla un elevado oste omputaonal. Una soluón más efente puede obtenerse aplando una aproxmaón de Taylor al log-determnante (Marus y Mn, 99; Martn, 993), s ben exsten otras posbles aproxmaones omo la aproxmaón de Chebyshev (Abramowtz y Stegun, 97):

131 6. Implementaón 05 log q k tr ( [ ] ) [ ( R E) ] det R E Id (6.4) k k = donde tr [] representa la funón traza. Uno o dos térmnos (q = o q = ) en la Euaón 6.4 suelen ser sufentes para onsegur una aproxmaón razonable del log-determnante, ya que los elementos de la matrz R E son habtualmente muho menores que uno para mágenes naturales (nótese que en una aproxmaón en sere de Taylor, el error ntrodudo es del msmo orden de magntud que el prmer térmno no onsderado). De este modo, el problema numéro se vuelve muho más abordable. Los resultados del Apartado 6.3 se han obtendo de nuevo usando el onjunto de entrenamento de la Fgura 4. ( Boats, Elane, Goldhll, Lena, Peppers, y Salboat ). Éste es un onjunto redudo pero representatvo, on varedad de mágenes, por lo que reemos que los resultados son sufentemente generales. El álulo de los parámetros óptmos de la normalzaón dvsva puede onsderarse omo un proeso de adaptaón, de modo que s el onjunto de entrenamento fuera más homogéneo, serían de esperar nluso mejores resultados, esto es, una IM más próxma a ero. La etapa lneal para obtener los oefentes de entrada es la msma que en el apítulo anteror y onsstó en aplar una desomposón wavelet ortogonal on uatro nveles basada en fltros de Daubehes de orden 4 (db8), esto es, on 4 momentos evanesentes y 8 oefentes (Daubehes, 99). Esta desomposón da lugar a subbandas (horzontal, vertal y dagonal para ada una de las 4 esalas) además de un anal paso bajo adonal. La estadísta ondonal de los oefentes resultantes se ajustó on el modelo gaussano de la Euaón 4.3. Los parámetros de dho modelo se alularon para ajustar los hstogramas usando la esperanza matemáta de la Euaón 4.5 on todos los oefentes de las 6 mágenes del onjunto de entrenamento, pero ndependentemente para ada subbanda de la prámde wavelet. Tanto en el modelo gaussano omo en la normalzaón dvsva, hemos utlzado un vendaro de oefentes { j } (j ) adyaentes al oefente entral a lo largo de las uatro dmensones (8 en un uadrado en el espao D, además de venos adyaentes en freuena y en orentaón). Para resolver los orrespondentes problemas de mnmzaón, se utlzó un método de búsqueda lneal mponendo además el aráter postvo de los parámetros lbres del modelo, a y {b j } ( j), para mejorar la onvergena.

132 06 Capítulo 6. Esquema uas-óptmo Una vez heho el ajuste paramétro de los hstogramas ondonales, podemos alular los parámetros aproxmadamente óptmos (uas-óptmos) de la normalzaón dvsva usando la Euaón 6. (el log-determnante lo aproxmamos por una sere de Taylor de orden, según la Euaón 6.4). Tal omo omentamos en el apartado anteror, la IM de las respuestas normalzadas no depende del valor de los parámetros e de la normalzaón, de modo que estos parámetros pueden fjarse a ualquer valor (a ero por ejemplo, por smpldad). La búsqueda lneal de los parámetros uas-óptmos se na on la soluón aproxmada de Shwartz y Smonell (00) (Apartado 6..): d =, e j = b j ( j) y e = 0, donde y b j ( j) son los parámetros, alulados a prevamente, del modelo gaussano de la estadísta ondonal de los oefentes lneales. Las Fguras 6., 6. y 6.3 muestran los valores de los parámetros de la normalzaón dvsva para todas las subbandas. Como uno esperaría (ver Apartado 6..), los valores uas-óptmos umplen que: y e j b j ( j). a d a 6.3 Resultados Cuando aplamos la normalzaón dvsva on los parámetros uas-óptmos resultantes, obtenemos respuestas smlares a las de la Fgura 6.4b. Intutvamente, la transformaón no-lneal tene el efeto de haer más aleatora la representaón de magen on objeto de redur las dependenas estadístas entre los oefentes perteneentes a un msmo elemento estrutural. En otras palabras, el efeto de la normalzaón dvsva es seleonar aquellos oefentes que permten desrbr las estruturas de la magen de la manera más efente, de una manera smlar al proeso de dspersón en aquellos modelos basados en un onjunto de funones base sobreompleto y por tanto no-ortogonal (ver por ejemplo Olshausen y Feld, 997). La Fgura 6.5 muestra hstogramas ondonales de dos muestras espaalmente adyaentes que permten observar laramente la progresva ndependena estadísta onseguda al aplar suesvamente la transformaón lneal y no-lneal. El hstograma (a) orresponde a dos píxeles adyaentes p y p, en la magen orgnal. La pendente aproxmadamente gual a del hstograma onfrma la fuerte orrelaón entre los píxeles, mentras que el progresvo ensanhamento del hstograma nda la exstena de dependenas estadístas de más alto orden. La transformada wavelet elmna la orrelaón muy efazmente. Como podemos ver en el hstograma (b), donde y j son oefentes wavelet de Daubehes, ahora la pendente es prátamente gual a ero. Sn embargo, esta transformaón lneal no puede elmnar las dependenas estadístas de más alto orden, omo nda la forma de pajarta del

133 6.3 Resultados 07 0,00 (a) 0,07 0,0 0,07 0,00 0,09 0,09 0,05 0,07 0,0 0,07 0,03 0,59 0,05 (b) 0,05 0, 0,06 0,00 0, 0, 0,0 0,06 0, 0,05 0,0 0,4 0,07 () 0,05 0, 0,06 0,00 0,3 0,3 0,00 0,06 0,3 0,05 0,0 0,8 0,06 (d) 0,05 0,5 0,07 0,00 0,3 0, 0,0 0,06 0,6 0,06 0,00,6 Fgura 6.: Valores de los parámetros de la normalzaón dvsva para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 8 parámetros espaales. Los parámetros en freuena están dspuestos vertalmente, y horzontalmente los dos parámetros en orentaón. El valor de se muestra debajo, dentro de la elpse punteada. d

134 08 Capítulo 6. Esquema uas-óptmo 0,00 (a) 0,05 0,09 0,05 0,03 0,09 0,09 0,03 0,05 0,09 0,05 0,04 0,90 0,05 (b) 0,05 0, 0,05 0,0 0, 0, 0,03 0,05 0, 0,05 0,0 0,7 0,07 () 0,05 0,4 0,05 0,0 0, 0,3 0,0 0,05 0,4 0,05 0,0 0, 0,08 (d) 0,08 0,5 0,05 0,0 0,0 0, 0,0 0,04 0,5 0,08 0,00 0,6 Fgura 6.: Valores de los parámetros de la normalzaón dvsva para las subbandas vertales de las dferentes esalas.

135 6.3 Resultados 09 0,00 (a) 0,05 0,0 0,06 0,03 0,08 0,08 0,0 0,06 0,0 0,06 0,03,3 0,04 (b) 0,05 0,09 0,06 0,0 0,09 0,0 0,0 0,06 0,0 0,06 0,05 0,6 0,08 () 0,04 0, 0,06 0,0 0,0 0,0 0,00 0,06 0, 0,04 0,05 0,08 0, (d) 0,05 0, 0,06 0,0 0,0 0, 0,00 0,07 0, 0,06 0,00 0,58 Fgura 6.3: Valores de los parámetros de la normalzaón dvsva para las subbandas dagonales de las dferentes esalas.

136 0 Capítulo 6. Esquema uas-óptmo (a) (b) Fgura 6.4: (a) Desomposón de Daubehes y (b) no-lneal basada en la normalzaón dvsva, de la magen Lena.

137 6.3 Resultados p 00 (a) p j 0 (b) j r () r (d) r j r j Fgura 6.5: Hstogramas ondonales de (a) dos píxeles venos p y p j (p j es el veno nferor dereho de p ), (b) dos oefentes wavelet y j, y dos respuestas no-lneales r y r j, en el aso () aproxmado y (d) uas-óptmo on e = 0, de la magen Lena. La subbanda onsderada es sempre la subbanda vertal de la esala más baja.

138 Capítulo 6. Esquema uas-óptmo hstograma. Los dos últmos hstogramas son hstogramas ondonales después de la normalzaón dvsva. Así el hstograma () muestra la dependena estadísta entre dos respuestas normalzadas r y r j, uando usamos dretamente los parámetros del modelo estadísto gaussano omo parámetros de la normalzaón dvsva, esto es, uando usamos la soluón aproxmada de Shwartz y Smonell (00). Fnalmente, el hstograma (d) muestra la dependena estadísta entre r y r j uando usamos nuestra aproxmaón uas-óptma on e = 0. Estos dos últmos hstogramas ondonales son muy semejantes y en ambos asos, las dependenas estadístas entre dos muestras son prátamente nulas tras la normalzaón, omo se dedue del heho de que los hstogramas son aproxmadamente ndependentes del valor de la abssa. No obstante, omo veremos segudamente, la IM es generalmente menor uando aplamos nuestra aproxmaón uas-óptma. El efeto de la normalzaón dvsva sobre las fdp margnal se lustra en la Fgura 6.6. Como puede verse, las fdp margnal de las respuestas no-lneales p(r ) tenen mayor urtoss que las orrespondentes fdp margnal de las entradas lneales p( ). Además, es mportante haer notar que la expresón aproxmada usada en nuestro método (Euaón 6.) ajusta perfetamente las fdp margnal de las respuestas no-lneales resultantes p(r ), lo ual es una prueba de la valdez de dha aproxmaón. La Tabla 6. muestra algunas meddas de dependena estadísta en térmnos de la IM, para las mágenes del onjunto de entrenamento. Coherentemente on la Fgura 6.5, la IM es elevada en el domno de la magen (píxeles p). La IM es muho menor en el domno wavelet (oefentes lneales ) después de elmnarse básamente las orrelaones lneales. Fnalmente la normalzaón dvsva (respuestas normalzadas r) todavía redue más la IM, que alanza así valores muy próxmos a ero. Las dos olumnas de la dereha de la tabla permten omparar la IM obtenda on la soluón aproxmada y on nuestra soluón on e = 0. Como puede verse, nuestra soluón en general proporona mejores resultados (esto es, una IM menor), s ben la soluón aproxmada tambén proporona resultados muy satsfatoros. De heho, las dferenas entre los dos asos son pequeñas. Los resultados numéros onsttuyen la prueba empíra de la valdez tanto de la formulaón teóra omo de los proedmentos numéros. Por otro lado, los resultados numéros undos a los resultados teóros ndan que hemos llegado muy era del mínmo de la IM, esto es, a la normalzaón dvsva óptma adaptada para onsegur la máxma ndependena estadísta entre las respuestas orrespondentes al onjunto de entrenamento. No hemos poddo demostrar que el mínmo sea ero, y de heho, tras reunr estos resultados y onsderaones, reemos que esto es así porque

139 6.3 Resultados 3 p( r ) p( ) H H = 0,0649 Fgura 6.6: fdp margnal de los oefentes wavelet y de las respuestas no-lneales r, en la subbanda vertal de la esala más baja de la magen Lena. Con x s está representada la aproxmaón r onsderada para la fdp margnal de las respuestas no-lneales: p( r ) exp. H es la πr H entropía relatva H (dstana KL) entre el hstograma de las respuestas no-lneales y la aproxmaón, dvdda entre la entropía del hstograma H. dho mínmo en general es dstnto de ero. En otras palabras, la normalzaón dvsva reduría fuertemente las dependenas estadístas, pero sn onsegur elmnarlas ompletamente (seguría habendo algunas dependenas resduales de alto orden). Para mejorar realmente los resultados, una manera sería usar un modelo más exato para apturar las propedades estadístas de los oefentes lneales. Aquí hemos usado un modelo gaussano, pero seguramente exsten otros modelos que proporonan un mejor ajuste. Además de utlzar un modelo estadísto dferente, es muy posble que una formulaón más elaborada de la normalzaón dvsva mejoraría sgnfatvamente los resultados. Sn embargo, el uso de modelos y formulaones más

140 4 Capítulo 6. Esquema uas-óptmo elaborados tene el nonvenente de que se perde la elegana y senllez del presente método. Tenendo en uenta la elevada efena alanzada, queda poo margen de mejora, y ésta además probablemente sea a osta de un onsderable nremento de la omplejdad. De heho, nluso partendo de este modelo y formulaón senllos, hemos tendo que haer aproxmaones para poder llegar a un problema de optmzaón abordable numéramente. Tabla 6.: IM entre dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ), entre los oefentes wavelet resultantes y j, y entre las respuestas normalzadas r y r j en el aso aproxmado (A) y en el aso uas-óptmo (CO) on e = 0. La últma olumna muestra tambén la dferena relatva de la IM en el aso uas-óptmo respeto a la del aso aproxmado. La subbanda onsderada es sempre la vertal de la esala más baja. IM( p, p j ) IM(, j ) IM( r, r j ) (A) IM( r, r j ) (CO) Boats,075 0,736 0,0 0,0090 (-6 %) Elane,4450 0,0480 0,006 0,0098 (-8 %) Goldhll,340 0,0980 0,09 0,0 (+ %) Lena,4364 0,78 0,03 0,00 (- %) Peppers,577 0,086 0,003 0,0097 (-6 %) Salboat,340 0,64 0,0099 0,000 (+ %) Además de proporonar oefentes prátamente ndependentes, la normalzaón dvsva óptma tene otra mportante propedad, a saber, que es nvertble (exepto por los sgnos que obvamente deben almaenarse). Esto es así porque en teoría podemos reuperar los oefentes lneales de entrada al uadrado a partr de las respuestas normalzadas r y los parámetros de la normalzaón dvsva d y {e j }. Así,

141 6.3 Resultados 5 smplemente operando en la defnón de la normalzaón dvsva y utlzando notaón matral, se llega a la sguente expresón: r d rd = ( Id R E) (6.5) n rn d n Como ambas etapas, lneal y no-lneal, del esquema basado en la normalzaón dvsva son nvertbles (s guardamos los sgnos de los oefentes lneales), es posble reuperar la magen de entrada a partr de su desomposón no-lneal, que por tanto onsttuye una representaón ompleta de mágenes. Una representaón ompleta de mágenes on oefentes estadístamente ndependentes, tendría numerosas aplaones en análss y tratamento de mágenes (restauraón, síntess, fusón, odfaón y ompresón, regstro, et.). El heho de que la normalzaón dvsva pueda nvertrse abre nteresantes posbldades en este sentdo. Esquemas smlares (Smonell, 997; Malo, Ferr, Navarro y Valero, 000) ya se han usado on éxto en análss y tratamento de mágenes.

142

143 Capítulo 7 Esquema aproxmado on vendaro extenso En el apítulo anteror se ha optmzado la normalzaón dvsva para un vendaro redudo de sólo elementos adyaentes. Sn embargo, s queremos aplar el esquema de representaón a obtener desrptores (estadístamente ndependentes) de estruturas relevantes de las mágenes, neestamos un vendaro mayor, ya que estas estruturas pueden ser extensas, dando lugar a dependenas de mayor extensón. Pero el heho de onsderar más venos aumenta onsderablemente la omplejdad y oste omputaonal. En este sentdo, la prnpal novedad que se ntrodue en este apítulo está en la forma de fjar los pesos de la normalzaón dvsva: ada peso se fja al valor de la IM del orrespondente par de oefentes lneales. Esta forma de obtener los valores de los parámetros es muho más efente y permte por tanto onsderar un onjunto mayor de oefentes venos, y por tanto generalzar el esquema. El esquema no-lneal resultante permte extraer los eventos vsuales sgnfatvos, estadístamente ndependentes, de las mágenes. En un artíulo reente, Hoyer y Hyvärnen (00) usaron un maro alternatvo para mostrar ómo las respuestas de las élulas omplejas de V podrían representarse de manera dspersa medante una apa neuronal de más alto orden, dando lugar a odfaón de ontornos y ampos reeptvos lmtadores ( endstopped ). El ontendo de este apítulo apareó prnpalmente en la sguente publaón: Valero, Navarro, ter Haar Romeny y Florak (003). 7. Implementaón El esquema que se propone aquí sólo amba on repeto a los anterores en que utlza un número sgnfatvamente mayor de venos (y por tanto más oefentes e j ). Con objeto de palar el gran nremento de oste omputaonal, aquí se propone un nuevo 7

144 8 Capítulo 7. Esquema aproxmado on vendaro extenso método de estmaón de los oefentes basado en la IM entre los pares de venos onsderados. La etapa lneal es de nuevo una desomposón wavelet ortogonal on uatro nveles basada en fltros de Daubehes de orden 4 (db8), y en la etapa no-lneal seguremos onsderando el modelo gaussano para la estadísta de los oefentes wavelet de las mágenes naturales. En el modelo gaussano y {b j } ( j) son parámetros lbres uyo valor puede alularse usando estmaón de máxma verosmltud, tal omo hmos en los apítulos anterores: a { a, b j } = arg { a mn E (7.), b j + log( a + } b ) j j a + bj j j j donde E denota valor esperado. Sn embargo, estudando las dependenas estadístas entre oefentes en espao, freuena espaal y orentaón, se llega a la onlusón de que en prmera aproxmaón éstas se onentran sobre todo en un vendaro de oefentes relatvamente pequeño, pero sgnfatvamente mayor que los adyaentes onsderados hasta ahora (ver Fgura 4.5), por lo que aquí onsderaremos omo entorno espaal un uadrado de 5 x 5. Como las dferentes estruturas de la magen pueden dar lugar a nterrelaones entre todas las subbandas, onsderamos las subbandas. Esto da lugar a un vendaro de 300 elementos, esto es, 99 { j } (j ) venos de a lo largo de las uatro dmensones (un uadrado 5 x 5 en el espao D por ada una de las subbandas). Una manera alternatva de determnar qué oefentes se nluyen en el onjunto ondonal { j } (j ), es obtener el onjunto de oefentes venos a ntrabanda e nterbanda que mnmza la dstana KL entre la fdp ondonal de los oefentes wavelet y el modelo estadísto gaussano de dha fdp (Bugross y Smonell, 999). Dado el elevado oste omputaonal de alular los 300 oefentes on el método anteror, aquí se apla un método muho más efente. Una vez elegdo el onjunto ondonal (vendaro), los parámetros (no-negatvos) del modelo gaussano a y {b j } ( j), se fjan de la sguente manera. En lugar de utlzar la Euaón 7., por motvos de efena omputaonal, a se fja a un valor pequeño fjo (0,) y los parámetros {b j } ( j) se substtuyen por la IM del orrespondente par de oefentes y j, alulada ndependentemente para ada una de las subbandas de la prámde

145 7. Implementaón 9 wavelet on todos los oefentes de la magen natural de entrada. Esta forma de fjar el valor de los parámetros tene sentdo, ya que a es básamente una onstante regularzadora para evtar dvdr por ero, y uanto más fuerte es la dependena estadísta entre dos oefentes dados, mayor es el parámetro b j orrespondente. De este modo, el álulo de los parámetros se smplfa bastante, ya que los parámetros b j se fjan de uno en uno alulando la orrespondente IM, en lugar de resolver el problema de mnmzaón on 300 parámetros defndo por la Euaón 7.. Como ejemplo, la Fgura 7. muestra los valores resultantes de los parámetros {b j } ( j) para la subbanda vertal de la esala más baja de la magen Lena. En general, los valores {b j } ( j) son muho menores que uno, sendo los valores más altos los orrespondentes a aquellos oefentes venos en espao, orentaón y esala on una mayor dependena estadísta respeto al oefente. Fgura 7.: Parámetros {b j } ( j) para la subbanda vertal de la esala más baja de la magen Lena. Las 4 esalas están dspuestas vertalmente (la esala más fna arrba), y horzontalmente las 3 orentaones (horzontal, vertal y dagonal, de zquerda a dereha). Una vez ajustado el modelo, el sguente paso es obtener los parámetros de la normalzaón dvsva. Tenemos la alternatva de la soluón aproxmada ad ho (Capítulo 5) que onsste en usar dretamente los parámetros del modelo, o la óptma (Capítulo 6). Como ya hemos mostrado, la eleón ad ho de parámetros =, e = 0 y e j = b j, donde a d a y b j son los parámetros del modelo estadísto gaussano, es una soluón aproxmada que da unos resultados numéros prátamente guales que los de la soluón óptma. Además, s partularzamos la fdp margnal de las respuestas

146 0 Capítulo 7. Esquema aproxmado on vendaro extenso normalzadas p(r ) para ese aso, se obtene una fdp on elevada urtoss, lo que mpla que el ódgo resultante es dsperso: r = p( r ) exp πr (7.) Por todo ello aquí se ha adoptado por mplementar la soluón ad ho, por su senllez y buenos resultados, dejando omo trabajo futuro, la mplementaón del esquema uas-ompleto del apítulo anteror. 7. Resultados Con objeto de lustrar las araterístas del esquema que aabamos de presentar, vamos a mostrar algunos resultados on varas mágenes de prueba estándar. Cuando aplamos el esquema anterormente desrto a mágenes naturales, obtenemos representaones smlares a las de la Fgura 7.. En esta fgura se representa a la zquerda la magen ompleta y a la dereha el detalle que se va a analzar (en este aso el perfl del ala del sombrero). En fla superor (a) se muestra la magen, en la entral (b) el anal wavelet (oefentes lneales) de alta freuena y orentaón vertal, y en la de abajo (), el resultado de la normalzaón dvsva on vendaro extenso mplementada en este apítulo. Como ya hemos vsto en los apítulos anterores, la transformaón no-lneal tene el efeto de haer más aleatora la representaón de magen al redurse las dependenas estadístas entre oefentes perteneentes al msmo elemento estrutural. En otras palabras, el efeto de la normalzaón dvsva es seleonar aquellos oefentes que desrben más efentemente una erta estrutura de la magen. Sn embargo, al haber onsderado un vendaro más extenso, se mantenen mejor ertas estruturas. En la Fgura 7. podemos ver ómo ha quedado patente y aslado del resto el borde vertal de la pamela. La Fgura 7.3 muestra tres hstogramas ondonales de dos muestras venas en espao e lustra la progresva ndependena estadísta onseguda on la aplaón suesva de la transformaón lneal (wavelet) y no-lneal (normalzaón dvsva). Así, el hstograma (a) orresponde a dos píxeles adyaentes p y p j (p j es el veno nferor dereho de p ) de la magen orgnal. La pendente aproxmadamente gual a del hstograma, muestra la fuerte orrelaón que exste entre los píxeles. El hstograma (b) orresponde a los oefentes wavelet y j. Esta transformaón lneal no puede

147 7. Resultados (a) (b) () Fgura 7.: Subbanda vertal de la esala más baja de la desomposón (b) de Daubehes y () nolneal basada en la normalzaón dvsva, de la magen Lena (a). elmnar las dependenas estadístas de alto orden, omo demuestra la forma de pajarta del hstograma. Fnalmente, el hstograma () es el hstograma ondonal de las dos respuestas adyaentes de salda r y r j. Con la normalzaón, prátamente se han elmnado las dependenas estadístas, omo se omprueba al ver que el hstograma ondonal resultante es aproxmadamente ndependente del valor de la abssa. La Fgura 7.3 muestra tambén los valores orrespondentes de la IM, para dar una dea numéra de la dependena estadísta. Coherentemente on los hstogramas de la Fgura 7.3, la IM es elevada, alrededor de,5, en el domno de la magen. La IM es muho menor en el domno wavelet, tras elmnar las orrelaones lneales. Fnalmente, la normalzaón dvsva todavía redue más la IM, que alanza un valor muy próxmo a ero. De nuevo, el esquema propuesto es robusto en el sentdo de que los resultados no

148 Capítulo 7. Esquema aproxmado on vendaro extenso (a) IM =,55 (b) IM = 0,3 () IM = 0,03 Fgura 7.3: Hstogramas ondonales y valores de IM de (a) dos píxeles venos p y p j (p j es el veno nferor dereho de p ), (b) los oefentes wavelet y j, y () las respuestas no-lneales r y r j, de la magen Lena. La subbanda onsderada es la subanda vertal de la esala más baja. dependen sgnfatvamente de la desomposón lneal ortogonal (wavelet) elegda, del modelo de la estadísta ondonal de los oefentes lneales, del onjunto de entrenamento de mágenes naturales, de los errores de redondeo (por ejemplo al alular los parámetros), y n squera de la magen natural de entrada partular. La Tabla 7. lustra la robustez del esquema referda a la ndependena de los resultados

149 7. Resultados 3 respeto de los valores de los parámetros y de la magen de entrada partular. En onreto, la Tabla 7. muestra valores de IM para 5 mágenes de prueba estándar ( Boats, Elane, Goldhll, Peppers, y Salboat ). Como puede verse, nluso usando los parámetros alulados prevamente para la magen Lena, las respuestas normalzadas son más ndependentes estadístamente que los orrespondentes oefentes wavelet, para ualquera de las 5 mágenes. Tabla 7.: IM entre dos oefentes wavelet venos y j ( j es el veno nferor dereho de ), y entre las orrespondentes respuestas normalzadas r y r j (usando los valores de los parámetros alulados on la magen Lena ), para 5 mágenes de prueba estándar. La subbanda onsderada es sempre la subbanda vertal de la esala más baja. IM(, j ) IM( r, r j ) Boats 0,8 0,06 Elane 0,05 0,04 Goldhll 0,0 0,03 Peppers 0,0 0,05 Salboat 0,3 0,05 El efeto de la normalzaón dvsva sobre las fdp margnal se lustra en la Fgura 7.4. Como puede verse, de nuevo la fdp margnal de las respuestas no-lneales p(r ) tene una mayor urtoss, esto es, tene un po más fuerte en ero, que la fdp margnal de las entradas lneales p( ). Además, podemos observar que s multplamos las respuestas no-lneales por una erta onstante k, la fdp margnal resultante p(r = k r ) se orresponde perfetamente on la Euaón 7., lo ual es oherente on la suposón IM(, j ) k b j ( j) usada mplítamente en la mplementaón del esquema.

150 4 Capítulo 7. Esquema aproxmado on vendaro extenso (a) (b) Fgura 7.4: (a) fdp margnal de los oefentes wavelet y de las respuestas no-lneales r, en la subbanda vertal de la esala más baja de la magen Lena. (b) fdp margnal de las respuestas no-lneales r tras multplarlas por una erta onstante k. Con x s está representada la fdp r = p( r ) exp. πr Estos resultados onsttuyen una prueba empíra de la valdez de los proedmentos numéros utlzados, y muestran que un ódgo ortal estadístamente ndependente y dsperso permte una muy efente representaón de las estruturas que apareen on más freuena en las mágenes naturales. Resumendo, esta segunda parte de la Tess, se ha dedado al desarrollo y estudo teóro, mplementaón y obtenón de resultados, de la normalzaón dvsva. La transformaón ompleta, on su parte lneal y no-lneal, da lugar a una representaón de la magen en la que las respuestas son (prátamente) estadístamente ndependentes entre sí. En los uatro apítulos de esta parte, se han do planteando, prmero los modelos estadístos de la estadísta de los oefentes wavelet de mágenes naturales y la normalzaón dvsva omo medo para ndependzar las respuestas; segundo el estudo teóro, mplementaón y análss del método ad ho, on vendaro restrngdo a muestras; terero dado que teóramente el método ad ho no es óptmo, se ha desarrollado un método optmzado, s ben en la práta los resultados obtendos son sólo lgeramente mejores; uarto, fnalmente se ha realzado una mplementaón más general para un vendaro extenso de 300 elementos, en uya optmzaón se han utlzado métodos alternatvos de muho menor oste omputaonal, dando lugar a una representaón on gran potenal de aplaón en tareas de análss de magen y vsón artfal. Para muhas aplaones en vsón esto es sufente, pero para muhas otras (odfaón, et.) es neesaro nvertr la transformaón para reuperar la señal, lo que será el objeto de la terera parte de la Tess.

151 Parte III: Inversón de la transformaón y aplaones

152

153 Capítulo 8 Esquema dretamente nvertble Con este apítulo omenzamos la terera parte de esta Tess que trata de la nversón de la transformaón y de dos aplaones prátas de nterés: defnón de una métra pereptual de aldad de magen (Capítulo 9), e norporaón de la normalzaón dvsva a un ode JPEG 000 (Capítulo 0). En su forma más general, la normalzaón dvsva tene el nonvenente de que su nversón requere nvertr una matrz muy grande, lo ual es nestable numéramente ( ll-posed ), e nluso la nversón no sempre está garantzada. El problema de la nversón ya se ha tratado (Malo, Ferr, Navarro y Valero, 000; Malo, Navarro, Epfano, Ferr y Artgas, 000). En este apítulo presentamos una soluón efente a este problema, onsstente en modfar (lo menos posble) el esquema de representaón de mágenes para que la normalzaón dvsva sea fálmente nvertble. Este esquema abre por tanto las puertas a las aplaones prátas en análss y tratamento de mágenes de la normalzaón dvsva, algunas de las uales se mostrarán en los sguentes apítulos. En su mayor parte, el ontendo de este apítulo se publó en: Valero, Smonell y Navarro (003). 8. Problemas de la nversón en los esquemas generales Como ya hemos menonado, la normalzaón dvsva, además de proporonar oefentes prátamente ndependentes, tene la mportante propedad de que teóramente es nvertble, en el sentdo de que es posble reuperar la magen de entrada a partr de su desomposón no-lneal, s tomamos la preauón de guardar los sgnos de los oefentes lneales que se perden al elevar al uadrado (ver Euaón 4.8). En onreto, la etapa lneal (desomposón en una base ompleta ortogonal) de estos esquemas es sempre nvertble y la etapa no-lneal tambén lo es en erto sentdo, 7

154 8 Capítulo 8. Esquema dretamente nvertble ya que en teoría podemos reuperar los oefentes lneales de entrada al uadrado a partr de las respuestas normalzadas r y los parámetros de la normalzaón dvsva d y {e j }. Smplemente operando en la defnón de la normalzaón dvsva y utlzando notaón matral, se llega a la sguente expresón analíta: r d r d = ( Id R E) (8.) n rn d n S ambas etapas, lneal y no-lneal, de los esquemas basados en la normalzaón dvsva son nvertbles, es posble reuperar la magen de entrada a partr de su desomposón no-lneal, que por tanto onsttuye una representaón ompleta de mágenes, on todas las onseuenas prátas que esto onlleva. Sn embargo, la nversón numéra de la normalzaón dvsva mostrada en la Euaón 8. presenta una sere de problemas que lmtan su utldad práta y que están relaonados on el álulo de la matrz (Id - R E) -. El prmero y más mportante es que la exstena de la nversa no está garantzada, ya que no está garantzado que la matrz (Id - R E) sea nvertble, esto es, puede darse el aso de que el determnante de la matrz (Id - R E) valga ero o un valor próxmo a ero, de forma que no sea posble el álulo de la nversa. Relaonado tambén on el valor de este determnante, está el problema de la nestabldad de la nversón. Así, s el determnante de la matrz (Id - R E) tene un valor pequeño, pequeñas varaones en el valor de las respuestas normalzadas r pueden dar lugar a grandes varaones en el valor de los oefentes lneales, lo ual es un sero problema en aquellas aplaones que ntroduen errores en los desrptores (por ejemplo, la uantzaón). Por otro lado, el álulo de la nversa es muy ostoso omputaonalmente, debdo a que es neesaro alular ada vez la nversa de la matrz (Id - R E), que es una matrz de dmensón muy elevada. Además, aunque la matrz (Id - R E) es habtualmente dspersa, on la mayoría de sus oefentes guales a ero, su nversa, (Id - R E) -, en general no lo es, lo que supone una mayor arga omputaonal al realzar la multplaón de matres de la Euaón 8.. En resumen, la nversón analíta de la normalzaón dvsva en los esquemas generales vstos hasta ahora, presenta una sere de problemas que lmtan su utldad

155 8. Problemas de la nversón en los esquemas generales 9 práta, dervados sobre todo del heho de que la matrz (Id - R E) - puede no estar defnda adeuadamente y de que s lo está, tene una elevada dmensón y en general no es dspersa. No obstante, en el aso de mágenes naturales, los parámetros que defnen la normalzaón dvsva óptma o ben son nulos o ben tenen un valor próxmo a ero, y las orrespondentes respuestas normalzadas presentan una dstrbuón estadísta on una elevada urtoss, esto es, on un fuerte po en ero y una larga ola, lo que atenúa en parte estos problemas, pero sn elmnarlos por ompleto. De heho, esto ha permtdo aplar on relatvo éxto otras estrategas de nversón numéra de la transformaón (Malo, Ferr, Navarro y Valero, 000; Malo, Navarro, Epfano, Ferr y Artgas, 000), por ejemplo basadas en el álulo del gradente de la transformaón e ntegraón por pasos, aunque resultan poo robustas ante la presena de rudo. 8. Esquema dretamente nvertble El esquema propuesto en este apítulo onsste en aplar algunas modfaones a la normalzaón dvsva para haerla nvertble de una forma dreta y senlla. En este esquema la nversón resulta ser muy senlla y admte una mplementaón teratva por nveles muy efente, al msmo tempo que permte una reonstruón perfeta. En ontrapartda, el esquema tene menor plausbldad bológa y los oefentes resultantes son menos ndependentes estadístamente que en los asos anterores. Las modfaones más esenales son de dos tpos. La prmera que tene que ver on el problema de mantener el sgno, onsste en utlzar la raz uadrada de la expresón de normalzaón, evtando la no-lnealdad expansva (es der, no eleva al uadrado el oefente) y la retfaón, on lo que mantenemos la nformaón del sgno. Así la nueva normalzaón dvsva vendrá dada por: r = d + ej j j (8.) Esta euaón es por tanto dferente de los modelos de las respuestas de neuronas ortales, en los que el uadrado (no-lnealdad expansva y retfaón) eran araterístas esenales. La normalzaón dvsva óptma sgue sendo aquella defnda por el valor de los parámetros (onstante y pesos {e j }) que mnmza el valor de la IM de las respuestas normalzadas, es der, que mnmza la dependena estadísta entre las msmas para un onjunto de mágenes naturales. Se puede d

156 30 Capítulo 8. Esquema dretamente nvertble demostrar que en este aso, omo en asos anterores, una soluón on un sufente grado de aproxmaón es: =, e j = b j ( j) y e = 0, esto es, adoptar dretamente los parámetros del modelo gaussano, la normalzaón dvsva. d a a y b j ( j), omo parámetros de La otra modfaón, que es muy mportante para faltar la nversón, es que la normalzaón dvsva sólo va a onsderar venos espaales perteneentes a esalas superores, de forma que dentro de una determnada esala de la prámde, la transformaón es una mera normalzaón, que, al ser ndependente de los elementos de la esala a reonstrur, se nverte on una senlla multplaón. Esta smplfaón tene dos desventajas. La prmera es que omo la normalzaón se hae onsderando venos de esalas anterores, on el objeto de nvertr la transformaón sempre debe quedar una esala resdual que no se normalza. En segundo lugar, el no onsderar venos espaales de la msma esala lmta el efeto de ndependzaón estadísta onsegudo. 8.3 Implementaón El esquema dretamente nvertble tene la msma estrutura que los esquemas vstos en apítulos anterores y, por tanto, onsta de una desomposón lneal seguda de una etapa no-lneal basada en la normalzaón dvsva. A dferena de los apítulos anterores, el trabajo realzado en este apítulo se ha llevado a abo en olaboraón on Eero Smonell quen tenía espeal nterés en mplementar la etapa lneal utlzando sus fltros QMF smétros on 9 oefentes (Smonell y Adelson, 990), los uales están muy relaonados on las wavelets (aproxmadamente son fltros wavelet), tal omo vmos en el Capítulo. Las funones base de esta transformaón lneal están loalzadas en espao, orentaón y freuena espaal, lo que da lugar a 9 subbandas (horzontal, vertal y dagonal por ada una de las 3 esalas onsderadas aquí) además de un anal paso bajo adonal. El heho de utlzar aquí una desomposón lneal dferente de la basada en fltros de Daubehes, aparte de las ventajas de utlzar fltros smétros que ya omentamos en el Capítulo, es sobre todo para haer notar que puede utlzarse ualquer desomposón lneal ortogonal omo prmera etapa de nuestros esquemas. Como sempre, el prmer paso es ajustar la estadísta gaussana de las respuestas lneales. Al haber modfado los fltros usados, hay que realular los parámetros. La Fgura 8. muestra (a) un hstograma ondonal típo de dos oefentes QMF de una magen natural, que se ompara on (b) el de un esquema redundante basado en fltros

157 8.3 Implementaón 3 de Gabor. Una vez más, el valor esperado de la ordenada del hstograma es aproxmadamente ero (por tanto la ovaranza es tambén aproxmadamente ero), lo ual nda que los oefentes QMF están deorrelados. Reordemos que esto es una dferena mportante entre las transformaones ortogonales y las no-ortogonales, ya que en estas últmas los oefentes próxmos están orrelados y por tanto el valor esperado de la ordenada del hstograma ondonal no es ero sno que ree lnealmente on la abssa, tal omo puede observarse en la Fgura 8.b que orresponde a una prámde de Gabor no-ortogonal (Nestares et al., 998). Del msmo modo, la forma de pajarta del hstograma ondonal nda que los oefentes no son estadístamente ndependentes, sno que la varanza de uno depende del valor del otro. (a) (b) Fgura 8.: Hstogramas ondonales de dos oefentes venos ( j es el veno nferor de ) en la subbanda vertal de la esala más baja (la más fna) de la prámde (a) QMF y (b) de Gabor, de la magen estándar Ensten. Como sabemos, esta forma araterísta de los hstogramas ondonales se mantene para una gran varedad de mágenes y dferentes pares de oefentes. Además, esta fgura es prátamente gual a las mostradas en apítulos anterores, lo que demuestra que esta forma de hstograma es una propedad esenal de las mágenes naturales que no depende de la base ortogonal de funones elegda. Como en apítulos anterores, estos hstogramas se han ajustado al modelo gaussano. Los parámetros lbres del modelo y {b j } ( j), se obtenen usando estmaón de máxma verosmltud a partr de todos los oefentes QMF de las 6 mágenes del onjunto de entrenamento (Fgura 4.) pero ndependentemente para ada subbanda de la prámde QMF. Tanto en el modelo gaussano omo en la normalzaón dvsva, onsderamos oefentes { j } (j ) adyaentes a a lo largo de las uatro dmensones, tal omo hemos desrto en el apartado anteror (ver Fgura 8.). Se ha utlzado un método de búsqueda lneal para resolver los a

158 3 Capítulo 8. Esquema dretamente nvertble orrespondentes problemas de mnmzaón, mponendo que los valores de los parámetros lbres fueran postvos para mejorar la onvergena. Como ya hemos menonado, la araterísta fundamental de la etapa no-lneal es el vendaro partular onsderado. Como puede verse en la Fgura 8., onsderamos oefentes { j } (j ) adyaentes a a lo largo de las uatro dmensones (9 venos en un uadrado en el espao D, en orentaón y en freuena espaal). Pero a dferena del esquema de apítulos anterores, en el que el vendaro estaba entrado en el oefente, es mportante señalar que on objeto de faltar la nversón aquí onsderamos sólo venos perteneentes a nveles más altos de la prámde. De esta forma podemos r nvrtendo la transformaón no-lneal por nveles de manera muy senlla. Así, para reuperar un nvel de la prámde lneal smplemente obtenemos los valores de normalzaón a partr de los nveles ya reuperados y los multplamos por los orrespondentes oefentes no-lneales. Obvamente en este esquema la esala más alta no se normalza, ya que no exsten esalas superores on las que poder normalzar. Por tanto, además de tener la araterísta de proporonar oefentes prátamente ndependentes, el esquema desrto es fálmente nvertble. Como ambas etapas, lneal y no-lneal, del esquema de representaón de mágenes son nvertbles, es posble reuperar una magen de entrada a partr de su desomposón no-lneal. Fgura 8.: Desomposón QMF de la magen Lena y vendaro onsderado en la etapa no-lneal del esquema dretamente nvertble de representaón de mágenes.

159 8.4 Resultados Resultados En este apartado mostramos resultados obtendos usando nuestro onjunto de entrenamento de ses mágenes ( Boats, Elane, Goldhll, Lena, Peppers, y Salboat ). El prmer resultado son los parámetros de ajuste al modelo gaussano. Tanto en el modelo gaussano omo en la normalzaón dvsva, onsderamos oefentes { j } (j ) adyaentes a a lo largo de las uatro dmensones, tal omo hemos desrto en el apartado anteror (ver Fgura 8.). Las Fguras 8.3, 8.4 y 8.5 muestran los valores de los parámetros del modelo estadísto gaussano para todas las subbandas. Por otro lado, para mplementar de forma rápda y senlla la normalzaón dvsva hemos utlzado la eleón ad ho (ver Capítulo 5), es der usar dretamente los valores de ajuste del modelo gaussano omo parámetros de la normalzaón: d =, e j = b j ( j) y e = 0. Cuando aplamos el esquema que aabamos de desrbr, se obtenen representaones smlares a las de la Fgura 8.6. Como puede verse, la transformaón no-lneal sgue tenendo el efeto de haer más aleatora la representaón de la magen on objeto de redur las dependenas estadístas entre oefentes perteneentes a un msmo elemento estrutural, s ben este efeto es un poo menor que en otros de nuestros esquemas, por no nlur el vendaro espaal de la msma esala. La Fgura 8.7 muestra dos hstogramas ondonales de dos muestras adyaentes en espao, e lustra la ndependena estadísta onseguda al aplar la transformaón no-lneal. Así, el hstograma ondonal (a) orresponde a dos oefentes QMF y j. ( j es el veno nferor dereho de ). Esta transformaón lneal no elmna las dependenas estadístas de más alto orden, omo nda la forma de pajarta del hstograma. El hstograma ondonal (b) orresponde a las dos respuestas de salda r y r j. Como puede verse, las dependenas estadístas a la salda se reduen onsderablemente, s ben la forma de pajarta no desaparee ompletamente, en este aso debdo a que hemos relajado dos de las araterístas esenales de la normalzaón no-lneal: no elevamos al uadrado las respuestas, y no onsderamos los venos espaales de la msma esala que la respuesta lneal que se normalza. La Tabla 8. ompara los valores de IM obtendos en los dos asos, para las 6 mágenes del onjunto de entrenamento. S omparamos el nuevo esquema smplfado dretamente nvertble (olumna A) on el esquema más general, que además usa un vendaro más general, desrto en el apítulo anteror (olumna B), a

160 34 Capítulo 8. Esquema dretamente nvertble (a) 0,0 0,04 0,03 0,00 0,04 0, 0,08 0,50 0,0 0,03 0,0 0,00,34 (b) 0,0 0,04 0,04 0,00 0,06 0, 0, 0,7 0,0 0,05 0,0 0,0 0,47 () 0,0 0,09 0,0 0,00 0,05 0,5 0,4 0,8 0,0 0,05 0,0 0,00 0,9 Fgura 8.3: Valores de los parámetros del modelo estadísto gaussano para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 9 parámetros espaales. Los parámetros en orentaón están dspuestos horzontalmente, y vertalmente el parámetro en esala. El valor de se muestra debajo, dentro de la elpse punteada. a

161 8.4 Resultados 35 (a) 0,0 0,06 0,0 0,0 0,05 0,5 0,04 0,34 0,04 0, 0,0 0,0,47 (b) 0,00 0,06 0,0 0,0 0,04 0,9 0,04 0,33 0,03 0,3 0,0 0,0 0,39 () 0,00 0,07 0,00 0,0 0,04 0,5 0,05 0,38 0,0 0,4 0,0 0,00 0,08 Fgura 8.4: Valores de los parámetros del modelo estadísto gaussano para las subbandas vertales de las dferentes esalas.

162 36 Capítulo 8. Esquema dretamente nvertble (a) 0,03 0,06 0,04 0,00 0,05 0, 0,05 0,00 0,04 0,06 0,0 0,00 3,6 (b) 0,0 0,06 0,0 0,00 0,06 0,0 0,05 0,00 0,03 0,06 0,0 0,0 0,66 () 0,0 0,06 0,03 0,0 0,09 0,6 0,05 0,00 0,0 0,09 0,0 0,00 0,0 Fgura 8.5: Valores de los parámetros del modelo estadísto gaussano para las subbandas dagonales de las dferentes esalas.

163 8.4 Resultados 37 Fgura 8.6: Desomposón no-lneal basada en la normalzaón dvsva de la magen Lena. (a) (b) Fgura 8.7: Hstogramas ondonales de (a) dos oefentes QMF y j ( j es el veno nferor dereho de ) y (b) dos respuestas no-lneales r y r j, de la magen Salboat. La subbanda onsderada es la subbanda vertal de la esala más baja. vemos que nuestro esquema proporona resultados lgeramente peores (los oefentes no-lneales resultantes son un poo más dependentes estadístamente, oherentemente on la Fgura 8.7). No obstante, los valores son del msmo orden de magntud y se mantenen próxmos a ero. Es der, la nvertbldad senlla y dreta de este esquema

164 38 Capítulo 8. Esquema dretamente nvertble tene un pequeño oste en uanto a una efetvdad nferor en la ndependzaón de las respuestas, aunque se mantene en el msmo orden de magntud. Tabla 8.: IM entre dos oefentes QMF venos y j ( j es el veno nferor dereho de ), y entre las orrespondentes respuestas normalzadas r y r j, para las 6 mágenes del onjunto de entrenamento. La subbanda onsderada es sempre la vertal de la esala más baja. La olumna A orresponde al esquema desrto en este apítulo y la olumna B orresponde a un esquema que usa un vendaro más general (un vendaro de oefentes adyaentes a lo largo de las uatro dmensones: 8 venos en un uadrado en el espao D, en orentaón y en freuena espaal) on oefentes que perteneen no sólo a nveles más altos de la prámde QMF sno tambén al msmo nvel y a nveles más bajos. IM(, j ) IM( r, r j ) (A) IM( r, r j ) (B) Boats 0,8 0,05 0,03 Elane 0,05 0,03 0,0 Goldhll 0,0 0,04 0,03 Lena 0, 0,03 0,03 Peppers 0,09 0,04 0,03 Salboat 0, 0,04 0,03 El esquema propuesto, omo se está vendo on las dferentes versones mplementadas a lo largo de la Tess, es robusto en el sentdo de que los resultados no dependen sgnfatvamente de la desomposón lneal ortogonal, del modelo de la estadísta ondonal de los oefentes lneales, del onjunto de entrenamento de mágenes naturales, de los errores de redondeo al alular los parámetros, de la magen natural de entrada, y n squera de la versón del esquema utlzada. Este nuevo esquema smplfado mantene las propedades esenales a pesar de haber relajado muy sgnfatvamente araterístas esenales de la normalzaón

165 8.4 Resultados 39 dvsva teóra, mostrando una erta robustez nluso frente a ambos en la propa formulaón. Este esquema no-lneal de representaón de mágenes es dretamente nvertble, por lo que puede ser muy útl en numerosas aplaones de análss y tratamento de mágenes, tales omo restauraón, síntess, fusón, odfaón y ompresón, regstro, et., debdo a que puede nvertrse muy efentemente y a la gran mportana que tene en esas aplaones la ndependena estadísta entre oefentes. En los sguentes dos apítulos se muestran dos de estas aplaones.

166

167 Capítulo 9 Métra pereptual En muhas aplaones de tratamento de mágenes, pueden aproveharse las propedades del SVH para mejorar los resultados desde el punto de vsta de la aldad vsual. En las últmas tres déadas, se han realzado onsderables esfuerzos para desarrollar métodos objetvos de evaluaón de la aldad de magen, que tengan en uenta las araterístas propas del SVH. El elemento omún de todos estos métodos es un modelo omputaonal subyaente de la vsón humana. En este apítulo, presentamos una métra pereptual de dstorsón de magen basada en los modelos del órtex vsual prmaro (V) que hemos vsto en apítulos anterores. La métra pereptual es smlar a la propuesta por Teo y Heeger (994) e nluye una etapa de fltrado lneal seguda por una normalzaón dvsva que mplementa un meansmo de ontrol de ganana. La normalzaón dvsva, omo sabemos, permte modelar algunos omportamentos no-lneales de las neuronas de V. La prnpal dferena es que en nuestro aso, sguendo los últmos modelos de V, la normalzaón dvsva es más general (no onsdera sólo respuestas venas en orentaón sno tambén en espao y esala) y además está adaptada a la estadísta de las mágenes naturales. La expresón estadísta resultante para fjar estos parámetros es oherente on la hpótess aeptada de que los sstemas sensorales están adaptados a las señales a las que están expuestos, y además se ha utlzado ad ho en la lteratura. Los resultados muestran que la métra propuesta ajusta muy ben (sólo lgeramente peor que la métra de Teo y Heeger, 994) datos empíros obtendos en expermentos de enmasaramento de ontraste. La dferena esenal y novedad de nuestra aportaón es que no hemos ajustado ad ho los parámetros del modelo para reprodur los datos expermenales, sno que hemos mantendo nuestro rtero de adaptaón a la estadísta de las mágenes naturales, muho más omplejas que las smples franjas snusodales (freuenas puras) utlzadas en los expermentos. 4

168 4 Capítulo 9. Métra pereptual Parte del ontendo de este apítulo se ha publado en Valero, Navarro y ter Haar Romeny (004). 9. Introduón: defnones y estado del arte Las métras pereptuales onsttuyen métodos objetvos para determnar las dferenas pereptuales entre dos mágenes, por ejemplo entre una orgnal y otra dstorsonada, basados sobre todo en la uantfaón de la vsbldad de los errores (dferenas) entre la magen dstorsonada y una magen de referena, usando para ello propedades onodas del SVH. Estas métras de aldad de magen que utlzan la magen orgnal (sn dstorsón) para ompararla on la magen dstorsonada, se denomnan on referena ompleta ( full-referene ) y son las más freuentes y de las que nos ouparemos en este apítulo. Las mágenes dgtales están sujetas a una ampla varedad de dstorsones sufrdas durante su adqusón, tratamento, ompresón, almaenamento, transmsón y reproduón, que dan lugar a degradaones de su aldad vsual. En aquellas aplaones en las que las mágenes van a ser vstas por personas, el úno método orreto de uantfar la aldad vsual de la magen es la evaluaón subjetva. Sn embargo, en la práta, la evaluaón subjetva requere demasado tempo y es dfultosa y ara. De ahí que se nvestgue en métodos objetvos para obtener meddas uanttatvas que permtan preder la aldad de magen perbda, lo ual es una tarea bastante dfíl, ya que la aldad perbda depende de múltples fatores tales omo la dstana a la magen, el tamaño de la pantalla, la resoluón, el brllo, el ontraste, el olordo y la naturaldad, entre otros. Son numerosas las aplaones de adqusón y tratamento de mágenes que pueden optmzarse utlzando una medda de la aldad vsual, ya que muhas de estas aplaones se basan en meddas de dstorsón. Algunos ejemplos son: ompresón de mágenes, algortmos de reduón de olor ( dtherng ), representaón en pantalla plana y dseño de mpresoras. En todas estas aplaones, el objetvo es reprodur felmente la magen, de forma que se pareza lo más posble al orgnal. Por otro lado, las herramentas de medda de la aldad vsual de magen dependen del estado del arte del modelado del SVH. Probablemente la medda de la aldad vsual, esto es, la medda de la aldad perbda para una erta magen o seuena de mágenes, sea la aplaón más dreta de los modelos de vsón el tratamento de mágenes, puesto que las propedades y lmtaones del SVH determnan la vsbldad de las dstorsones y por tanto, la aldad perbda.

169 9. Introduón: defnones y estado del arte 43 Por todo lo expuesto, la medda de la aldad pereptual de la magen no es una aplaón más, sno que tene una espeal relevana en tratamento de mágenes y modelado del SVH en general y, en partular, en el ontexto de esta Tess. La métra de aldad de magen on referena ompleta más senlla y más extendda en tratamento de magen y vídeo, es el error uadráto medo (Mean Squared Error o MSE), que es el valor medo de las dferenas de ntensdad de los píxeles al uadrado entre la magen dstorsonada I y la de referena Ĩ. S las mágenes tenen X x Y píxeles, entones la expresón del MSE es la sguente: MSE = [ I( x, y) I ~ ( x, y) ] X Y (9.) x y Muy relaonada on el MSE, otra métra es la relaón señal a rudo po (Peak Sgnal-to-Nose Rato o PSNR), que en debelos se defne omo: m PSNR = 0 log 0 (9.) MSE donde m es el valor máxmo que puede tomar un píxel (p.ej., 55, en mágenes de 8 bts). Nótese que el MSE y la PSNR están defndos para nformaón de lumnana; en uanto ntervene el olor, ya no exste auerdo aera de ómo alular estas magntudes. El MSE y la PSNR son tan populares porque son senllas de alular, tenen un sgnfado físo laro, y, matemátamente hablando, son muy adeuadas en el ontexto de la optmzaón. La prnpal ventaja de estas dos métras es su faldad de uso, ya que no requeren nnguna nformaón aera de las ondones de vsonado, no se adaptan al ontendo loal de la magen y los álulos son muy senllos y rápdos. Por otro lado, mnmzar el MSE es equvalente a haer una estmaón de máxma verosmltud onsderando que los errores son ndependentes y sguen una dstrbuón gaussana. Sn embargo, tambén tenen un sero nonvenente y es que no son una buena medda de la aldad vsual perbda (ver p.ej. Grod, 993; Teo y Heeger 994; Eskoglu y Fsher, 995; Ekert y Bradley, 998; Wnkler, 999; Wang et al., 00). Como están basadas en una omparaón píxel a píxel de las mágenes, son una aproxmaón exesvamente grosera de la dstorsón o aldad perbda por observadores humanos. Así por ejemplo, en ertas stuaones puede mejorarse la aldad de magen subjetva añadendo rudo y por tanto reduendo la PSNR. Además,

170 44 Capítulo 9. Métra pereptual la vsbldad de las dstorsones depende en gran medda del ontendo de la magen, propedad que se onoe omo enmasaramento. Las dstorsones son on freuena muho más molestas en las regones relatvamente homogéneas de una magen que en las regones texturadas o on muha atvdad, efeto que no onsderan las métras basadas en dferenas de píxeles. Por lo tanto, la aldad perbda de dos mágenes on la msma PSNR puede ser de heho muy dferente. N squera el MSE ponderado pereptualmente proporona predones fables de la aldad vsual para dferentes mágenes, lo que demuestra que las meddas de error basadas en píxeles no son adeuadas para determnar dha aldad uando se trabaja on dferentes esenas y tpos de dstorsón. Es por todo esto que para obtener métras fables es mpresndble tener en uenta el modo en el que el SVH proesa la nformaón vsual y así, en las últmas tres déadas, se han realzado grandes esfuerzos para desarrollar métodos de determnaón de la aldad de magen basados en el SVH. Al evaluar la aldad de una magen, ésta últma puede onsderarse omo la suma de una señal de referena no-dstorsonada y una señal de error. Una hpótess amplamente aeptada es que la pérdda de aldad pereptual está dretamente relaonada on la vsbldad de la señal de error. La mayoría de los métodos de determnaón de la aldad pereptual de las mágenes tratan de pesar los dferentes aspetos de la señal de error en funón de su vsbldad, determnada ésta a partr de meddas psofísas en humanos o meddas fsológas en anmales. Esta forma de abordar el problema fue propuesta nalmente por Mannos y Sakrson (974) y ha sdo extendda posterormente por muhos otros nvestgadores. La Fgura 9. muestra un sstema genéro de determnaón de la aldad de magen basado en la sensbldad vsual al error (Wang et al., 004). La mayoría de las métras pereptuales sguen un esquema smlar, s ben dferen en los detalles. Las etapas del esquema son las sguentes:. Preproesamento. Esta etapa realza típamente una sere de operaones básas para elmnar dstorsones onodas de las mágenes que van a ompararse. Prmero, la magen dstorsonada y la de referena se esalan y alnean adeuadamente. Segundo, a vees las mágenes se transforman a un espao de olor más adeuado para el SVH. Terero, las métras pueden neestar onvertr los valores dgtales de los píxeles almaenados, en valores de lumnana de la pantalla de vsualzaón, medante transformaones nolneales puntuales. Cuarto, puede aplarse un fltrado paso bajo que smule la PSF (Pont Spread Funton) de la ópta del ojo. Fnalmente, la magen de

171 9. Introduón: defnones y estado del arte 45 referena y la dstorsonada deben onvertrse a undades de ontraste para smular la adaptaón a la luz. Fgura 9.: Sstema genéro de determnaón de la aldad de magen basado en la sensbldad al error. Nótese que el fltrado CSF puede mplementarse en una etapa aparte (omo se muestra) o ben dentro de la etapa de normalzaón del error. (Wang et al., 004).. Fltrado CSF. Como ya vmos en el Capítulo 3, la CSF desrbe lo sensble que es el SVH a las dferentes freuenas espaales y temporales que están presentes en los estímulos vsuales. Algunas métras de la aldad de magen nluyen una etapa que pondera la señal según esta funón (típamente mplementada on un fltro lneal que aproxma la respuesta en freuena de la CSF). Reentemente, sn embargo, se tende a mplementar la CSF omo un fator de normalzaón tras la desomposón en anales. 3. Desomposón en anales. Habtualmente, las mágenes se desomponen en subbandas (onodas omo anales en la lteratura de psofísa) on dferentes freuenas espaales y temporales así omo dferentes orentaones. Mentras que algunas métras mplementan sofstadas desomposones en anales relaonadas on las respuestas de las neuronas del órtex vsual prmaro, muhas otras usan transformaones más senllas tales omo la DCT o transformadas wavelet separables. 4. Normalzaón del error. En esta etapa, se alula para ada anal el error (dferena) entre la desomposón de la magen de referena y la de la magen dstorsonada, y se normalza según un erto modelo de enmasaramento, que tene en uenta el heho de que la presena de una omponente en la magen redue la vsbldad de otras omponentes próxmas en espao, tempo, freuena espaal y orentaón. Este meansmo de normalzaón pondera la señal de error en ada anal según un umbral de vsbldad que varía espaalmente. El umbral de vsbldad en ada punto se obtene a partr de la energía de los oefentes de la magen de referena y/o

172 46 Capítulo 9. Métra pereptual de la magen dstorsonada en un vendaro (que puede nlur oefentes adyaentes en el espao, del msmo anal o ben de otros anales) y la sensbldad base para el anal. De este modo, el error queda expresado en térmnos de mínmas dferenas pereptbles (Just Noteable Dfferene o JND). Algunos métodos onsderan tambén el efeto de la saturaón de la respuesta al ontraste. 5. Suma de errores La últma etapa ombna las señales de error de toda la magen a lo largo de las dferentes respuestas y anales, para obtener así un úno valor. Típamente, esto se realza usando la norma de Mnkowsk: β β, k M = error l (9.3) l k donde error l,k es el error normalzado orrespondente al oefente k del anal l, y β es una onstante normalmente entre y 4. La suma de Mnkowsk puede realzarse prmero en espao (índe k) y luego en freuena (índe l) o a la nversa, on alguna no-lnealdad entre ambas o on dferentes exponentes β. Tambén puede usarse un mapa espaal que ndque la mportana relatva de las dferentes regones, para poder haer así una ponderaón espaalmente varante. Revsemos ahora brevemente algunas de las métras pereptuales propuestas en la lteratura. Revsones más exhaustvas pueden enontrarse en Ahumada (993), Ekert y Bradley (998), y Pappas y Safranek (000). Las prmeras métras pereptuales desomponían la magen en un úno anal, esto es, modelaban el SVH omo un fltro espaal uyas araterístas estaban defndas por la CSF y la detetabldad se determnaba aplando un umbral a la magen fltrada. Mannos y Sakrson (974) propuseron la prmera métra pereptual, en un ntento de norporar araterístas del SVH a las métras de aldad de magen. En onreto estos autores onsderaron dos aspetos ben onodos de la perepón vsual, a saber, la adaptaón a la lumnana y la CSF, que araterzaron a partr de expermentos psofísos de vsbldad de franjas snusodales. Así, tras una no-lnealdad, las dos mágenes de entrada eran fltradas según la CSF, defnéndose la dstorsón omo el valor uadráto medo de las dferenas entre las mágenes fltradas. Esta métra, debdo sobre todo a que utlza un úno anal y a que no norpora enmasaramento de ontraste, no prede orretamente la aldad de magen en muhas runstanas, pero

173 9. Introduón: defnones y estado del arte 47 fue la prmera en reonoer la mportana de aplar las enas de la vsón al tratamento de mágenes. Métras más reentes on un solo anal son las de Saghr et al. (989), Nll y Bouzas (99) y Ahumada (996). Graas a una sere de extensones y mejoras, este tpo de métras se usa todavía hoy en día por su smpldad y efena omputaonal, a pesar de sus lmtaones a la hora de preder la aldad de magen. Por ejemplo, estas métras no son adeuadas uando se trabaja on mágenes más omplejas y, a dferena de las métras multanal que veremos a ontnuaón, no son apaes de reprodur los resultados empíros de los expermentos de enmasaramento y adaptaón a patrones. Las métras pereptuales multanal están basadas en la teoría multrresoluón de la vsón y utlzan un onjunto de anales dferentes en lugar de uno sólo. De esta forma, ada banda de freuenas espaales es proesada por un anal ndependente y la CSF vene a ser la envolvente de la sensbldad en estos anales. La deteón se produe uando la señal ontenda en ualquer banda alanza un erto valor umbral. El desarrollo de las métras pereptuales multanal ulmnó a prnpos de los 90, on la aparón de dos métras basadas en datos psofísos y fsológos de la vsón temprana: el Predtor de Dferenas Vsuales (Vsual Dfferenes Predtor o VDP) de Daly (993) y el Modelo Sarnoff de Dsrmnaón Vsual (Vsual Dsrmnaton Model o VDM) de Lubn (993). Estas métras fueron las prmeras en proporonar una adeuada predón de la vsbldad de las dstorsones en torno al umbral vsual. La estrutura de las métras de Daly y de Lubn es bastante smlar, ya que ambas modelan el SVH omo una sere de etapas lneales y no-lneales, entre las que se enuentran: un fltrado según la CSF, una desomposón en subbandas orentadas de freuena on un anho de banda de una otava, enmasaramento de ontraste, álulo de las dstanas pereptuales entre las desomposones de las mágenes, y suma de errores a lo largo de las bandas de freuena. El resultado de ambas métras es un mapa de dferenas vsbles que nda, para ada píxel de las mágenes de entrada, la probabldad de que una dferena en ese píxel entre las dos mágenes, sea apreable. Nnguna de estas dos métras pereptuales nluye enmasaramento entre orentaones (para mplementar el enmasaramento de ontraste sólo utlzan la energía ontenda en una banda on una orentaón dada) n tampoo entre posones espaales adyaentes. Del msmo modo, la suma de errores para obtener el mapa de dferenas vsbles se realza a lo largo de los anales de freuena y no a lo largo de la dmensón espaal. Una métra muy nteresante, y en la que está basada la métra que presentamos en este apítulo, es la de Teo y Heeger (994). La métra de Teo y Heeger está nsprada

174 48 Capítulo 9. Métra pereptual en las propedades de las respuestas de las neuronas del órtex vsual prmaro (V) así omo en la psofísa de la deteón de patrones espaales. Estos dos aspetos son muy relevantes para el desarrollo de métras de la aldad pereptual de mágenes. Téngase en uenta que, omo sabemos, la regón V es la enargada de transmtr la nformaón vsual al resto de regones erebrales mpladas en la vsón, de modo que dos mágenes pareerán déntas s dan lugar a respuestas déntas en todas las neuronas de V. Por otro lado, una métra que pueda preder orretamente la deteón de patrones espaales es muy útl para las aplaones de tratamento de mágenes. En onreto, la métra de Teo y Heeger está basada en el meansmo de ontrol de ganana de ontraste observado en las élulas smples del órtex vsual (Albreht y Gesler, 99; Heeger, 99a, 99b), que hae que las respuestas neuronales estén dentro del rango dnámo permtdo al msmo tempo que onserva la nformaón global sobre el patrón. En la métra, este meansmo está mplementado on una normalzaón dvsva en la que, tras una no-lnealdad expansva, la respuesta de ada neurona se dvde entre una suma nhbtora de respuestas de otras neuronas. La medda de dstorsón se alula a partr de las respuestas normalzadas resultantes on una smple norma del error. Una araterísta mportante de esta métra es que el enmasaramento no depende de la energía ontenda en una úna banda, sno tambén de la energía en bandas on dferentes orentaones. Los modelos del ontrol de ganana de ontraste han llegado a ser bastante populares y han sdo generalzados en los últmos años (Watson y Solomon, 997; Graham y Sutter, 000). Estos modelos pueden preder orretamente la elevaón del umbral de deteón de ontraste, esto es, la dsrmnaón de ontraste para una señal, típamente una snusode o una funón de Gabor, en presena de una másara (señal enmasarante) del msmo tpo pero on dferente freuena, fase o ontraste. Una de las métras pereptuales más reentes y ompletas es la propuesta por Westen et al. (995). La métra norpora un fltrado según la CSF, adaptaón a la lumnana smlar a la de Pel (990), una desomposón en múltples bandas orentadas de freuena, enmasaramento de ontraste omo Daly (993), y suma de errores utlzando la métra de Mnkowsk, prmero a lo largo de bandas de freuena on la msma orentaón, después a lo largo de bandas de freuena on dstnta orentaón y fnalmente a lo largo del espao. Una dferena mportante de esta métra respeto a las métras anterores es que en la suma de errores utlza exponentes dferentes para las dferentes orentaones, lo que está en onsonana on los resultados de algunos expermentos de enmasaramento de ontraste. Más reentemente, Bradley (999) propuso una métra smlar a la de Daly (993) on la

175 9. Introduón: defnones y estado del arte 49 dferena de que utlzó transformadas wavelet sobreompletas y tambén on muestreo ríto. De este modo, pudo omprobar que las transformadas wavelet sobreompletas proporonan predones más fables que las transformadas wavelet on muestreo ríto y llegó a la onlusón de que los prnpales problemas de estas últmas son el solapamento entre anales de freuena adyaentes, que da lugar a alasng en las subbandas, y la falta de nvaranza a traslaón. En resumen, las métras pereptuales propuestas hasta la feha tenen por lo general una sere de araterístas omunes. Estas métras norporan un fltrado CSF y adaptaón a la lumnana, on dferenas poo sgnfatvas. Luego mplementan una desomposón en freuena multanal on anho de banda fjo o ben en otavas, que separa por ompleto las dferentes orentaones o ben mezla la nformaón de las dagonales a 45º y 35º. En general estas métras no tenen en uenta las preferenas de los observadores por enma de los umbrales de vsbldad. Las dferenas fundamentales suelen estar en la mplementaón del enmasaramento de ontraste y en la forma de sumar los errores a lo largo del espao y la freuena. Esta varedad de propuestas refleja el heho de que no exste auerdo aera de uál es el mejor modelo psofíso para estos dos fatores pereptuales. Deantarse por una u otra métra es dfíl, ya que exsten poos estudos omparatvos que hayan nvestgado la apadad de predón de unas métras en relaón a la de las otras. Esto se debe a que la mplementaón de las métras es a menudo ompleja y además es muy ostoso valdarlas psofísamente. En este apítulo, presentamos una métra pereptual de la dstorsón de magen smlar a la propuesta por Teo y Heeger (994). Tres son las aportaones (dferenas) más mportantes de nuestra métra on respeto a la de Teo y Heeger: prmero, nuestra normalzaón dvsva onsdera no sólo respuestas venas en orentaón sno tambén en espao y esala; segundo, las respuestas venas, tras elevarse al uadrado, no se suman dretamente sno que prmero se multplan por unos ertos pesos; y terero, los parámetros lbres de la normalzaón dvsva están adaptados a la estadísta de las mágenes naturales en lugar de fjarse ad ho medante ajuste dreto a datos psofísos de expermentos de enmasaramento. A pesar de que nuestra normalzaón no es ad ho, es der, no está optmzada para reprodur estos resultados expermentales, es apaz de reprodur muy ben (lgeramente peor que la métra de Teo y Heeger, y muho mejor que otras métras pereptuales más senllas) datos psofísos relaonados on el enmasaramento de una funón de Gabor en presena de franjas snusodales.

176 50 Capítulo 9. Métra pereptual 9. Formulaón e mplementaón Tal omo se muestra en la Fgura 9., la métra pereptual on referena ompleta que aquí proponemos onsta de las sguentes tres etapas. 9.. Etapa lneal Hasta ahora habíamos vendo utlzando wavelets ortogonales de Daubehes, salvo en el apítulo anteror, donde usamos una desomposón aproxmadamente ortogonal basada en fltros QMF smétros on 9 oefentes (Smonell y Adelson, 990), que son smlares a wavelets, pero tenen ventajas para mplementar modelos vsuales. Dado que Teo y Heeger (994), utlzaron fltros QMF, hemos optado por usarlos tambén en este apítulo, lo que nos faltará una omparaón dreta on los resultados de estos autores. Las funones base de esta transformaón lneal están loalzadas en espao, orentaón y freuena espaal, dando lugar a subbandas (horzontal, vertal y dagonal por ada una de las 4 esalas onsderadas aquí) además de un anal paso bajo adonal. Imagen Representaón No-lneal Deomposón QMF Normalzaón Dvsva Orgnal + e r = d j j j Suma de errores (suma de Mnkowsk) Deomposón QMF Normalzaón Dvsva r r = k r r Dstorsonada = d + e r j j j Fgura 9.: Esquema general de la métra pereptual. Los parámetros lbres están señalados on runferenas de línea dsontnua.

177 9. Formulaón e mplementaón Etapa no-lneal La etapa no-lneal onsste básamente en la normalzaón dvsva que se ha vendo desarrollando a lo largo de la Tess. Reordemos aquí su expresón: + r = d ej j j (9.4) Es der, las respuestas de la etapa lneal, se elevan al uadrado y después se dvden entre una suma ponderada de respuestas al uadrado en un vendaro en espao, orentaón y esala (j ), más una onstante d (Smonell and Shwartz, 999). Reordemos tambén que esta normalzaón es un buen modelo de las respuestas de las neuronas de V, por lo que para estableer una métra pereptual nos basaremos en estas respuestas r. { j } Utlzaremos de forma arbtrara una undad, o esalado de las respuestas, gual al umbral de vsbldad de una dstorsón en la magen. Es der, fjamos a el umbral a partr del ual una dstorsón es vsble. Entones la dstorsón mínma pereptble será: = d + j e j j (9.5) Esta expresón nos va a permtr relaonar el modelo de normalzaón dvsva on un modelo de las dstorsones mínmas pereptbles ontnuaón esta dea.. Vamos a desarrollar a Como ya hemos heho en otras oasones, partmos de la fdp ondonal p( { j }) de un oefente lneal (respuesta a un fltro QMF) de una magen natural, dados los otros oefentes venos al uadrado (j ). Como sempre, modelamos esta fdp ondonal on una fdp gaussana de meda nula y una varanza σ que no es onstante, sno que depende de los oefentes al uadrado (j ). Usando el teorema del ambo de varable (Papouls, 99) podemos obtener la fdp p( { j }) (ver Fgura 9.3): { j } { j }

178 5 Capítulo 9. Métra pereptual p( { j }) exp σ = π σ (9.6) Dado que la varable es dereente, tal y omo puede aprearse en la Fgura 9.3b. S haemos la hpótess de que para ada valor de, esta expresón tene la forma de una exponenal, onodos los oefentes venos al uadrado } (j ), la dstorsón mínma pereptble vene dada por { j el tamaño del ntervalo smétro entrado en en el que la ntegral de la fdp p( { j }) vale un erto valor p fjo (ver Fgura 9.3), entones operando puede demostrarse que tene la sguente expresón: p = + σ z s + y σ = + p y z + Φ σ s (9.7) on y = y donde Φ( ) es la funón de dstrbuón de probabldad gaussana on desvaón estándar undad y z( ) su funón reíproa. En otras palabras, la Euaón 9.7 proporona para ada valor de, el valor que lleva asoada una probabldad de error p, esto es, una probabldad p de que la varable aleatora esté en el ntervalo [ -, + ] y por tanto su valor sea ndstnguble del valor entral, suponendo que la fdp ondonal p( { j }) es una gaussana de meda nula y varanza σ. S fjamos el valor de la onstante p a 0,5, puede demostrarse que el valor medo de a lo largo de en nuestro modelo es σ. La Fgura 9.4 lustra gráfamente este resultado. Esto sgnfa, tenendo en uenta lo que djmos antes, que s el modelo de propuesto es orreto, entones una buena eleón del valor de los parámetros de la normalzaón dvsva (onstante d y pesos {e j }, j ) es aquella que hae que

179 9. Formulaón e mplementaón 53 (a) (b) Fgura 9.3: fdp ondonal (a) p( { j }) y (b) p( { j }). p( { j }) es una gaussana de meda nula y varanza σ. p( }) se obtene a partr de p { }) utlzando el teorema del ambo de varable. { j ( j Fgura 9.4: Representaón gráfa del modelo para la dstorsón mínma pereptble, fjado p = 0,5. ( d + j e j j gual a ( d + e j j ). ) j sea un buen estmador de σ. Es mportante haer notar que esta eleón del valor de los parámetros es presamente la eleón ad ho propuesta por Shwartz y Smonell (00) para reprodur las respuestas de las élulas smples del órtex vsual prmaro. Ésta es la eleón de parámetros que hemos estudado en el Capítulo 5, y aplado de nuevo en apítulos sguentes. Reordemos que en esa eleón ad ho se modelaba p( { j }) omo una gaussana de meda nula y varanza

180 54 Capítulo 9. Métra pereptual De esta forma, ha quedado establedo un mportante nexo de unón entre los modelos fsológos, estadístos y pereptuales, basados en la normalzaón dvsva, del órtex vsual prmaro (V), de tal manera que tres faetas de la perepón vsual (a saber, el ontrol de ganana del ontraste, la adaptaón a la estadísta de las mágenes naturales, los fenómenos de enmasaramento), y su relaón on la métra pereptual, quedarían unfadas en torno a la normalzaón dvsva. No obstante, este resultado teóro se basa en ertas hpótess que hay que verfar omprobando que el modelo es apaz de preder los resultados expermentales (Apartado 9.3) Suma de errores La últma etapa onsste en aplar la métra en sí. En la lteratura se suele aplar una suma de Mnkowsk, on exponente que puede varar entre y 4. En nuestro aso, dado que las respuestas son estadístamente ndependentes, o dho de otro modo, ada neurona responde a un evento vsual ndependentemente de las neuronas venas, podemos suponer una métra Eulídea, es der, exponente : r = k r (9.8) Por tanto, la dstorsón se alula omo la suma del error uadráto entre el onjunto de las respuestas normalzadas (no-lneales) de la magen de referena y el de las orrespondentes respuestas no-lneales de la magen dstorsonada. A ada neurona se le apla un peso k que permte ajustar la ganana de los dstntos anales y que suele usarse para mponer la respuesta global dada por la CSF. 9.3 Resultados Para valdar la métra pereptual utlzamos los datos empíros usados por Teo y Heeger (994), obtendos a su vez por Foley y Boynton (994) en sus expermentos de enmasaramento de ontraste. Tal omo se muestra en la Fgura 9.5, en estos expermentos la tarea es detetar un patrón de franjas snusodales superpuesto a otro patrón del msmo tpo que atúa omo másara, es der, que en general dfulta la deteón del estímulo. En onreto, los patrones enmasarantes son franjas snusodales de los por grado de ampo vsual y dferentes orentaones (0º;,5º;,5º; 45º y 90º). El patrón es una funón de Gabor orentada vertalmente on los por grado y grado de anhura /e horzontal y vertal. Dos mágenes se presentan

181 9.3 Resultados 55 smultáneamente a 6 m del observador. A un lado se muestra la másara en soltaro y al otro lado la superposón del estímulo a detetar y la másara. El observador debe dedr s las dos mágenes son guales o dferentes. Las orrespondentes mágenes dgtales pueden rearse muy fálmente utlzando el programa Dsrm de Landy (003). Funón de Gabor ( los por grado y anhura /e vertal y horzontal de grado) Enrejado snusodal ( los por grado) Señal enmasarada + Señal enmasarante Señal enmasarante Conjunto de entrenamento 6 m d k, {e { j Usando estmaón de máxma verosmltud: { d, e j } = arg mn E + log( d + { d, e j ) ej j } d + e j j j j j } Valor esperado r = Fgura 9.5: Expermentos de enmasaramento de ontraste utlzados para ajustar las gananas k de la etapa de suma de errores y valdar la métra pereptual. Nuestras mágenes de entrada serán exatamente estos estímulos (es der, reproduremos exatamente el expermento), aplando la métra defnda en la Euaón 9.8, para dedr s las mágenes (másara sóla o másara más estímulo) son guales o dferentes. El umbral de dsrmnaón lo fjamos arbtraramente a. A dferena de Teo y Heeger, en lugar de busar los parámetros que mejor ajustan los datos expermentales, nosotros adaptamos la normalzaón dvsva a la estadísta de las mágenes naturales de nuestro onjunto de entrenamento on ses mágenes naturales en blano y negro de 5 x 5 píxeles ( Boats, Elane, Goldhll, Lena, Peppers, y Salboat ) (Fgura 4.). Estas mágenes son omplejas y poo tenen que ver on las mágenes de freuenas puras usadas en el expermento (franjas snusodales o funones de Gabor). Como en asos anterores, hemos onsderando un vendaro { j } (j ) de oefentes (ver Capítulos 5 y 6) al uadrado adyaentes a a lo largo de las uatro dmensones (8 en un uadrado en el espao D, en orentaón y en esala) y usamos estmaón de máxma verosmltud en ada subbanda de la prámde QMF ndependentemente (la prámde QMF es la úna dferena on respeto a los Capítulos 5 y 6, donde se usaron wavelets de Daubehes).

182 56 Capítulo 9. Métra pereptual Por otro lado, las gananas k de la Euaón 9.8 se ajustan para reprodur la CSF, es der, se ajustan a datos psofísos, mantenéndose una ganana onstante para ada subbanda de la prámde QMF. La Fgura 9.6 muestra los resultados para una señal enmasarante vertal (por tanto a 0º). Como puede verse, el ajuste de los datos psofísos es muy bueno. Nuestra métra proporona resultados muho mejores que otras métras pereptuales más senllas omo la métra SFUM (Sngle Flter, Unform Maskng) de Ahumada (996) que se nluye en la fgura y sólo lgeramente peores que la métra de Teo y Heeger (el error uadráto medo del ajuste es en nuestro aso,07, frente a 0,85 en el aso de la métra de Teo y Heeger) a pesar de que ésta últma está adaptada ad ho para ajustar estos msmos datos, mentras que la nuestra no. -5 Contraste umbral de la señal enmasarada (db) Modelo SFUM Métra pereptual Modelo de Teo y Heeger Datos psofísos Contraste de la señal enmasarante (db) Fgura 9.6: Resultados de nuestra métra pereptual, la métra de Teo y Heeger (994) y la métra SFUM (Ahumada, 996), para una señal enmasarante vertal. Las urvas en línea ontnua representan el ontraste umbral de la señal enmasarada predho por la métra orrespondente. Los datos empíros están representados on írulos. La Fgura 9.6 sólo muestra los resultados para estímulos vertales. Hay que señalar, que mentras que los resultados para los ángulos de 0º y,5º son exelentes, el ajuste

183 9.3 Resultados 57 no es tan bueno para los otros ángulos. Esto se debe al relatvamente amplo anho de banda en orentaón de los QMF (ver Teo y Heeger, 994). Una araterísta mportante de los datos de enmasaramento de ontraste es la presena (o ausena) de un valle (tambén llamado bañera en la lteratura) que nda que para un erto rango de ontrastes la señal enmasarante tene el efeto de faltar la deteón de la señal enmasarada (el ontraste umbral mínmo se enuentra a la dereha de -40 db en la Fgura 9.6). La no-lnealdad partular usada en nuestra métra pereptual (Euaón 9.4) permte ajustar el valle bastante ben, lo que no ourre on otras funones no-lneales (por ejemplo, smplemente tomando la raíz uadrada en la Euaón 9.4). Por otro lado, el vendaro onsderado en la normalzaón dvsva ontene oefentes lneales de la magen orrespondentes a dferentes posones, orentaones y esalas, lo que permte mplementar numerosos meansmos de enmasaramento ntra e nterbanda, a dferena de otras métras smlares. Fnalmente, hay que der que aunque los buenos resultados mostrados orresponden a datos psofísos tomados de los expermentos lásos de enmasaramento de ontraste, son de esperar nluso mejores resultados en expermentos más realstas on estímulos naturales, debdo a las araterístas propas de la métra pereptual presentada. De heho, la aportaón más novedosa de este apítulo ha sdo demostrar que un esquema adaptado a la estadísta de mágenes naturales, es der, omplejas en uanto a su estrutura y ontendo freuenal, es apaz de preder resultados expermentales on un tpo de mágenes muy smple (freuenas puras) y que dsta muho de los estímulos naturales. Presamente, uno de los grandes retos en tratamento de mágenes hoy en día es dar on una métra que pueda preder la aldad vsual de las mágenes naturales de estrutura ompleja. Pero para ello, todavía deberán realzarse de manera sstemáta muhos más expermentos psofísos (espealmente de enmasaramento) on mágenes naturales.

184

185 Capítulo 0 Inorporaón de la normalzaón dvsva al JPEG 000 El estándar de ompresón de mágenes JPEG 000 es el suesor de JPEG, ntrodudo en 99 y uno de los de más éxto hasta la feha. Más que ntrodur mejoras en el estándar anteror, el estándar JPEG 000 mplementa una forma ompletamente nueva de omprmr mágenes basada en la transformada wavelet, en lugar de la transformada dsreta del oseno (DCT) usada anterormente. La DWT tene varas araterístas que la haen espealmente adeuada para ompresón de mágenes. Así por ejemplo, la DWT es nherentemente multrresoluón y además, al ser una transformaón global, deorrela en mayor medda la magen y elmna los artefatos de bloque nluso on tasas de ompresón elevadas. El SVH juega un papel fundamental en la aldad fnalmente perbda de las mágenes omprmdas, y es por ello que es mportante aprovehar los onomentos dsponbles sobre perepón vsual en los sstemas de ompresón de mágenes. El estándar JPEG 000 nluye varas herramentas que permten aprovehar ertas araterístas del SVH, tales omo la sensbldad al ontraste, la sensbldad al olor y los efetos de enmasaramento vsual. El onjunto de herramentas vsuales del estándar JPEG 000 es muho más amplo que el del estándar JPEG y omo onseuena de esto, para una msma tasa bnara, las mágenes JPEG 000 tenen mejor aldad vsual que las mágenes JPEG. Sn embargo, las herramentas de optmzaón vsual de JPEG 000 son todavía versones smplfadas de los modelos más reentes del tratamento vsual humano. Así por ejemplo, en la Parte del estándar JPEG 000 está prevsta la aplaón de una no-lnealdad a los oefentes wavelet, antes de la uantzaón, on objeto de aprovehar las propedades de enmasaramento del SVH. La versón más ompleta se realza en dos etapas: la prmera es puntual y onsste en elevar a una erta potena los oefentes wavelet orgnales. En la segunda, extendda, se normalza ada resultado por un fator de enmasaramento que 59

186 60 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 es funón de las ampltudes (tras la deodfaón) de algunos oefentes venos. El vendaro ausal onsderado ontene únamente oefentes de la msma banda, dentro de una ventana N x N entrada en el propo oefente (dho oefente no está nludo en el vendaro) y que, sguendo el orden de reorrdo de muestras establedo, apareen antes que el oefente entral. El vendaro debe además respetar las fronteras de bloque, s así se espefa en el odfador. Es obvo que este enmasaramento puntual-extenddo presenta grandes semejanzas on la normalzaón dvsva planteada y estudada en esta Tess. En este apítulo mplementamos la normalzaón dvsva en el estándar JPEG 000 y omparamos los resultados obtendos. Como nuestra representaón no-lneal de mágenes proporona desrptores más ndependentes estadístamente y más relevantes desde el punto de vsta pereptual, que la transformaón lneal (wavelet), abe esperar que proporone mejores resultados en ompresón. Además, al mplementar de forma general el enmasaramento puntual-extenddo propuesto en la Parte del estándar JPEG 000, onsegumos tambén una optmzaón vsual. En efeto, los resultados de ompresón son prometedores y muestran que la representaón no-lneal puede mejorar la aldad pereptual de las mágenes omprmdas. 0. Introduón: el estándar JPEG 000 Hoy en día, los estándares para la representaón y el nterambo efentes de mágenes dgtales son esenales, debdo a la enorme antdad de mágenes que se manejan. Uno de los estándares on más éxto hasta la feha, es el JPEG, desarrollado por el Jont Photograph Experts Group. Desarrollado tambén por dho grupo, el estándar JPEG 000 es el suesor del JPEG y se reó on el doble objetvo de resolver algunos problemas del estándar JPEG, y proporonar araterístas nuevas que no ofreía dho estándar. En onreto, el estándar JPEG 000 debía:. Permtr una ompresón efente on y sn pérddas dentro de un msmo maro unfado de odfaón.. Proporonar una aldad superor de magen, tanto objetva omo subjetva, para tasas de ompresón elevadas. 3. Soportar un formato de fhero más flexble y araterístas adonales omo la odfaón de regones de nterés. 4. Evtar una exesva omplejdad omputaonal y unos requermentos exesvos de memora.

187 0. Introduón: el estándar JPEG Por tanto, on la reaón del estándar JPEG 000 se perseguía proporonar no sólo una ompresón más efente omparada on la del estándar JPEG, sno tambén una nueva forma de representar y odfar mágenes on una sere de araterístas postvas, que pudera ser útl en gran varedad de aplaones exstentes y emergentes de ompresón de mágenes. Para onsegur estas araterístas, el estándar JPEG 000 hae uso de algunos de los más reentes avanes en ompresón de mágenes. Por ejemplo, la DCT por bloques, de baja omplejdad y on poos requermentos de memora, del JPEG se susttuyó por la DWT sobre toda la magen. La DWT proporona una representaón multrresoluón de la magen, al msmo tempo que mejora la efena de la ompresón debdo a sus buenas propedades de ompataón de la energía y de deorrelaón. Además pueden usarse fltros DWT on oefentes enteros para omprmr on y sn pérddas. Por otro lado, la uantzaón se realza utlzando un uantzador unforme on una zona muerta entral (de tamaño dos vees el paso del uantzador) y los planos de bts se odfan usando un odfador artméto bnaro adaptado al ontexto y on estmaón de probabldad, onodo omo odfador MQ, en lugar de un odfador Huffman. Esta odfaón por planos de bts es esalable según la relaón señal a rudo (Sgnal-to-Nose Rato o SNR) y además permte omprmr de forma que el tamaño fnal del fhero sea menor que un valor dado. Los planos de bts de ada subbanda se odfan en bloques retangulares ndependentes y en tres pasadas, lo que permte un mayor ontrol de la tasa bnara, aeso aleatoro espaal paral, ertas manpulaones geométras, y una sntaxs muy flexble, además de mejorar la resstena frente a errores. Fnalmente, el uso de un sstema de oordenadas de referena falta ertas operaones en el domno de la magen omprmda, tales omo reortes, rotaones en múltplos de 90º, volteos, et. El estándar JPEG 000 se ompone de ses partes. La Parte defne el sstema de odfaón báso, que, a pesar de su reduda omplejdad, es sufente para el 80% de aplaones. Las Partes a 6 desrben extensones de la tenología de ompresón y del formato de fhero, que pueden ser neesaras en ertas aplaones on requermentos espeífos. A dferena de lo que ourre on la Parte, las ténas desrtas en las Partes a 6 suelen estar sujetas al pago de derehos y en general, las mágenes odfadas usando dhas ténas no pueden deodfarse on el deodfador báso. Exsten varos artíulos exelentes en la lteratura (Marelln et al., 000; Ebrahm et al., 000; Santa-Cruz y Ebrahm, 000; Gormsh et al., 000; Chrstopoulos et al., 000; Rabban y Josh, 00) sobre el estándar JPEG 000, además de un lbro

188 6 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 (Taubman y Marelln, 00) que desrbe todos los aspetos ténos. Nosotros nos lmtaremos a desrbr muy brevemente el ode JPEG 000 báso y algunas de las herramentas de optmzaón vsual que se ofreen omo una extensón del estándar. 0.. El ode JPEG 000 El ode JPEG 000 está basado en las ténas wavelet de odfaón en subbandas y permte omprmr on y sn pérddas usando el msmo esquema de ompresón. En partular, está muy nfludo por el esquema EBCOT (Embedded Blok Codng wth Optmzed Trunaton) de Taubman (000). Para onsegur una odfaón efente on y sn pérddas, el ode utlza ben una transformaón no-reversble de real a real o ben una transformaón reversble de entero a entero, respetvamente. Los oefentes de la transformaón se odfan por planos de bts. En partular, la odfaón en entropía se realza utlzando el odfador MQ del estándar JBIG, que es un odfador artméto bnaro adaptado al ontexto. La estrutura general del ode JPEG 000 báso, se muestra en la Fgura 0.a. Supongamos que tenemos una magen on una o más omponentes. S P es el número de bts por muestra en una erta omponente, el rango dnámo nomnal de los valores de las muestras es [- P-, P- - ] o ben [0, P - ], dependendo de s las muestras tenen sgno o no. El proeso de odfaón tene lugar omo sgue (Adams y Kossentn, 000):. Transformaón multomponente. Prmeramente, s los valores de las muestras son sn sgno, entones se les resta P- antes de ualquer otra operaón. Segudamente, s la magen tene tres omponentes, el odfador puede aplar ualquera de las dos transformaones multomponente dsponbles. El objetvo de esta transformaón es onvertr la magen, dada habtualmente en el espao de olor RGB, al espao de olor YCrCb. En el aso de odfaón on pérddas, la transformaón empleada (llamada ICT) es no-reversble y de real a real, mentras que en el aso de odfaón sn pérddas, la transformaón (llamada RCT) es reversble y de entero a entero.. Transformada wavelet. Oponalmente, puede aplarse una transformada wavelet a ada omponente. Todas las transformadas wavelet dsponbles están basadas en banos de fltros D on dos anales, de modo que para tratar los datos D es neesaro aplar las transformaones D separadamente en ada dmensón. Como las señales de entrada tenen tamaño fnto, se onsderan extensones smétras de las msmas. En el aso on pérddas, la transformada

189 0. Introduón: el estándar JPEG wavelet que se utlza (la transformada 9/7 de Antonn et al., 99) es noreversble y de real a real. En el aso sn pérddas, sn embargo, se utlza una transformada reversble de entero a entero (la transformada 5/3 de Calderbank et al., 998). La Fgura 0. muestra los oefentes de los fltros D que utlzan estas dos transformadas wavelet. Fgura 0.: Code JPEG 000. Estrutura del (a) odfador y (b) deodfador. (Adams y Kossentn, 000). Fgura 0.: Coefentes del fltro paso bajo (h 0 ) y paso alto (g 0 ) de las transformadas wavelet bortogonales 9/7 y 5/3. (Usevth, 00). 3. Cuantzaón. Los oefentes de la transformada wavelet se uantzan on un uantzador esalar on zona muerta, uyos parámetros pueden varar dependendo de la subbanda partular. En el aso de odfaón sn pérddas, el salto del uantzador debe fjarse a, esto es, no se realza nnguna uantzaón.

190 64 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG Codfaón de nvel. Los oefentes uantzados orrespondentes a ada subbanda se dvden en bloques de tamaño fjo (típamente 64 x 64) que se odfan ndependentemente usando odfaón por planos de bts. La odfaón por planos de bts funona omo sgue. Cada bloque de oefentes uantzados se trata omo s fuera una pequeña magen, de forma que se odfa un plano de bts ada vez, empezando por el plano más sgnfatvo. En total, por ada plano de bts se realzan tres pasadas, que dan lugar a tres subplanos de bts. Éstas tres pasadas son las sguentes: ) Sgnfaón. En esta pasada se odfa el bt orrespondente de todas aquellas muestras todavía no lasfadas omo sgnfatvas, que durante el tratamento del plano de bts atual se onsderan sgnfatvas medante una predón. S una muestra pasa a ser sgnfatva, su sgno se odfa tambén en esta pasada. ) Refnamento. En esta pasada se odfa el sguente bt más sgnfatvo de aquellas muestras lasfadas omo sgnfatvas durante el tratamento del anteror plano de bts. ) Barrdo. Fnalmente, en esta pasada se odfa el bt orrespondente de todas aquellas muestras todavía no lasfadas omo sgnfatvas y que en la pasada de sgnfaón no se onsderaron sgnfatvas. S una muestra pasa a ser sgnfatva, su sgno se odfa tambén en esta pasada. Los símbolos generados por el odfador de planos de bts se odfan on un odfador artméto bnaro adaptatvo (el odfador MQ empleado en el estándar JBIG). Oponalmente, algunos de los símbolos produdos durante el tratamento de los planos de bts menos sgnfatvos pueden pasar dretamente a la sguente etapa sn pasar por el odfador artméto. 5. Codfaón de nvel. Fnalmente, en esta últma etapa se odfa la salda de la etapa anteror junto on nformaón aera de qué subplanos de bts se nlurán para ada bloque, y el orden de aparón de dhos subplanos en el resultado fnal. S la odfaón es sn pérddas, deben nlurse todos los subplanos de bts, mentras que s la odfaón es on pérddas, por lo general sólo se nluye un subonjunto de los msmos. El ontrol de tasa bnara se realza elgendo el paso del uantzador, así omo el onjunto de subplanos de bts que se nlurán en el resultado fnal de la odfaón. Análogamente, la estrutura del deodfador JPEG 000 báso es la que se muestra en la Fgura 0.b. El proeso de deodfaón onsta tambén de no etapas

191 0. Introduón: el estándar JPEG que van nvrtendo las operaones realzadas durante la odfaón. Estas no etapas son las sguentes:. Deodfaón de nvel. Prmeramente, a partr de la nformaón odfada de entrada, se obtenen los subplanos de bts de los dferentes bloques. Exepto en el aso sn pérddas, en general sólo se puede reuperar un subonjunto de los planos de bts orgnales.. Deodfaón de nvel. Segudamente, los planos de bts se deodfan para obtener los orrespondentes oefentes wavelet uantzados. En el aso on pérddas, obvamente, los oefentes uantzados obtendos son sólo una aproxmaón de los oefentes uantzados orgnales, ya que durante la odfaón, en general, no se nluyen todos los subplanos. 3. Deuantzaón. A partr de los valores uantzados se obtenen los oefentes wavelet aproxmados. Nótese que en el aso sn pérddas esta etapa no es neesara. 4. Inversón de la transformada wavelet. A ontnuaón se apla la orrespondente transformada wavelet nversa a ada una de las omponentes. 5. Inversón de la transformaón multomponente. Fnalmente, s es neesaro, se apla la transformaón multomponente nversa. Por otro lado, s los valores de las muestras de una omponente dada son sn sgno, entones hay que sumarles P- para así reuperar el rango dnámo nomnal orgnal. En el aso on pérddas, se realza además una operaón de reorte sobre los valores de las muestras para garantzar que no están fuera del rango permtdo. Aunque el ode JPEG 000 báso es muy versátl, exsten ertas aplaones que requeren araterístas adonales. Es por esto que, omo ya hemos dho, el estándar defne numerosas extensones del ode báso, tales omo: la posbldad de dvdr la magen en regones on forma arbtrara que pueden solaparse; transformaones adonales ntraomponente (p.ej., transformaones en subbandas basadas en fltros y árboles de desomposón arbtraros, y que aplan fltros dferentes en la dreón horzontal y vertal) y tambén entre omponentes (p.ej., transformaones en subbandas multdmensonales); transformaones solapadas; métodos adonales de uantzaón, omo por ejemplo la uantzaón odfada Trells; odfaón mejorada de regones de nterés, on una forma explíta de espefar la forma de la regón de nterés y el valor arbtraro del desplazamento; y extensones del formato de fhero que soportan espaos de olor adonales y doumentos ompuestos. El estándar JPEG 000 tambén defne una sere de herramentas oponales de

192 66 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 optmzaón vsual, de las que nos ouparemos más en detalle en el sguente subapartado, por estar relaonadas on nuestro esquema. 0.. Optmzaón vsual en el estándar JPEG 000 Es obvo que el SVH juega un papel fundamental en la aldad fnal perbda de las mágenes omprmdas, por lo que es mportante que los esquemas de ompresón aprovehen al máxmo los onomentos exstentes sobre la perepón vsual. El objetvo persegudo al norporar un modelo del SVH a un esquema de ompresón de mágenes es mnmzar el mpato vsual (vsbldad) de las dstorsones, de modo que se onsga la mejor aldad vsual posble para una tasa de ompresón dada. Dentro de un esquema de ompresón de mágenes, el modelo del SVH puede nflur sobre todo en el dseño de la transformaón de magen y en el ontrol de tasa y dstorsón, ya que por un lado, la representaón de la magen debe tener sgnfado pereptual y por otro, es neesaro medr y ontrolar la vsbldad de las dstorsones debdas a la ompresón. El odfador JPEG 000 es básamente un odfador de planos de bts que se apla a una representaón wavelet. Cada subbanda se dvde en bloques que se odfan ndependentemente y así aparee el onepto de apas de aldad abstrata, que permte optmzar (atendendo a la tasa bnara y la dstorsón) tras la ompresón, el orden en el que los flujos parales de bts de ada bloque se dsponen en el flujo fnal resultante. Esta estrutura falta la norporaón de herramentas de optmzaón vsual al sstema de ompresón, lo que hae posble elmnar redundana pereptual además de redundana estadísta de la magen de entrada. Por tanto, es posble utlzar un modelo del SVH para nflur en el flujo de bts, de manera que la nformaón vsualmente más relevante se odfque en prmer lugar. Este enfoque además sólo afeta al odfador, de modo que no es neesaro aumentar la omplejdad del deodfador. El estándar JPEG 000 nluye una sere de herramentas que pueden usarse para optmzar pereptualmente el resultado de la ompresón. No obstante, estas herramentas en general no están atvadas por defeto y además es el usuaro fnal el que debe proporonar los parámetros del SVH que requera su mplementaón. Por esta razón, estas herramentas de optmzaón vsual no se utlzan on freuena y se suele optar por utlzar el ode báso. A ontnuaón se desrben algunas de estas herramentas, en onreto aquellas que tenen que ver on la sensbldad al ontraste y el enmasaramento vsual (Zeng et al., 000):

193 0. Introduón: el estándar JPEG Ponderaón vsual de freuenas. Una estratega de optmzaón vsual habtual en ompresón es haer uso de la CSF, que araterza la sensbldad del SVH en funón de la freuena espaal. La CSF puede utlzarse por tanto para determnar la presón relatva neesara para odfar ada freuena espaal. Normalmente, uando se trabaja on transformadas wavelet dsretas, se onsdera un úno peso CSF por ada subbanda, para smplfar la mplementaón. El estándar JPEG 000 proporona dos formas de norporar el onjunto de pesos CSF. Una manera es modfando el valor del paso del uantzador, que se transmte explítamente para ada subbanda. Este método tene el nonvenente de que no es váldo para el aso sn pérddas, ya que en ese aso no se realza uantzaón. Otra manera de norporar los pesos es modfar el orrespondente fator de ponderaón de dstorsón utlzado en la optmzaón de tasa bnara y dstorsón. Esta es una forma muy efetva de ontrolar la mportana relatva de nlur mayor o menor número de planos de bts de ada bloque en el flujo bnaro fnal, y además tene la ventaja de que puede utlzarse en ompresón sn pérddas. Por otro lado, JPEG 000 tambén permte la mplementaón de la ponderaón vsual progresva, que onsste en aplar dferentes onjuntos de pesos CSF según el rango en el que esté la tasa bnara.. Enmasaramento vsual. El enmasaramento vsual es un fenómeno pereptual por el ual los artefatos quedan amuflados loalmente por la propa magen. La magen atúa por tanto omo una señal de fondo que redue la vsbldad de las dstorsones ntrodudas durante la ompresón. Este efeto puede aproveharse para mejorar la aldad vsual. La Parte del estándar JPEG 000 defne, omo posbles extensones, los tres tpos de enmasaramento que a ontnuaón se ndan, de los uales el terero es la ombnaón de los dos prmeros: ) Autoenmasaramento (puntual). Este tpo de enmasaramento es equvalente a una uantzaón no-unforme de los oefentes wavelet orgnales, en la que los oefentes on mayor ampltud se uantzan más groseramente. En la práta, el autoenmasaramento se mplementa elevando los oefentes wavelet a una erta potena antes de uantzarlos unformemente. Este enmasaramento preserva ben las texturas fnas y por eso es adeuado en mágenes fotográfas de alta aldad que ontenen rostros. No obstante, tambén presenta algunos problemas, espealmente on los bordes abruptos, uando se trabaja on tasas bnaras bajas.

194 68 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 ) Enmasaramento por vendaro (extenddo). En esta forma de enmasaramento, la dstorsón de ada oefente se pondera por un fator de enmasaramento vsual que es una funón genéra de los oefentes venos. El efeto de enmasaramento vsual se tene en uenta por tanto tras la ompresón, en la métra de dstorsón usada en la optmzaón de tasa y dstorsón. Un nonvenente es que el ajuste es espaalmente más grosero que en el aso anteror, ya que lo que se ontrola es el trunado de ada bloque. El enmasaramento por vendaro preserva ben los bordes on alto ontraste, pero tende a haer desapareer las texturas fnas. Tambén puede presentar problemas on las mágenes pequeñas, al estar basado en bloques. Sn embargo, resulta muy adeuado para mágenes grandes on ontendo dverso. ) Enmasaramento general (puntual-extenddo). El enmasaramento puntual extenddo es una ombnaón de las dos formas de enmasaramento anterores. Así, prmeramente los oefentes orgnales, en valor absoluto, se elevan a una erta potena, multplándose el resultado por el sgno orrespondente. En un segundo paso, el resultado anteror se normalza por un fator de enmasaramento vsual que es funón de las ampltudes de los oefentes venos. Numéramente: r = sgno( ) + d j ˆ e j α β (0.) donde d es un fator de normalzaón, e es el tamaño del vendaro ausal, y ĉ j son los oefentes venos uantzados. Los parámetros β y e permten ontrolar el grado de enmasaramento produdo por el vendaro. Tras esta operaón, los oefentes r resultantes se uantzan unformemente, de forma que el resultado es equvalente a una uantzaón adaptatva oefente a oefente. La prnpal ventaja de este método es que dstngue aquellos oefentes de gran ampltud perteneentes a un borde, de aquellos que forman parte de una regón más ompleja, omo por ejemplo una textura. Esta araterísta garantza una buena aldad vsual de los bordes sobre fondos homogéneos, lo que on freuena es un fator fundamental de la aldad global perbda. El enmasaramento puntual

195 0. Introduón: el estándar JPEG extenddo, al ser una ombnaón de autoenmasaramento y enmasaramento por vendaro, reúne las buenas araterístas de ambos tpos de enmasaramento. Las dferentes herramentas de optmzaón vsual pueden ombnarse para obtener una mejor aldad vsual. Según se ha observado en mágenes omplejas de ontendo dverso, la mejora vsual onseguda puede suponer un ahorro de hasta un 50% en la tasa bnara. Es mportante señalar la gran smltud entre la expresón de la Euaón 0. y la de nuestra normalzaón dvsva. En ambos asos, tenemos una no-lnealdad expansva (potenaón) y una normalzaón dvsva dependente de un erto vendaro. Por tanto, exsten enormes smltudes entre el esquema de representaón propuesto en esta Tess y el del estándar JPEG 000. En ambos, la parte lneal es una transformaón lneal wavelet multesala, mentras que la parte no-lneal puede ompatblzarse muy ben omo veremos en el apartado sguente, donde se presenta un esquema de ompresón basado en el estándar JPEG 000 que mplementa ténas de optmzaón pereptual y estadísta haendo uso de la normalzaón dvsva. 0. Esquema no-lneal ompatble on JPEG 000 En este apartado se ntroduen las modfaones neesaras para adaptar nuestro esquema de representaón de mágenes al estándar JPEG 000. Dado que en ompresón es mpresndble nvertr la transformaón, partremos onretamente del esquema dretamente nvertble del Capítulo 8. No obstante, on objeto de llevar a abo una omparaón lo más dreta posble, se van a mplementar dos versones: una versón lneal que orresponderá on el ode JPEG 000 báso, y una versón nolneal que onsta exatamente de la msma etapa lneal seguda de la normalzaón dvsva. 0.. Etapa lneal La etapa lneal se ha modfado para que sea exatamente la del estándar, que es una desomposón wavelet aproxmadamente ortogonal de uatro nveles, basada en el bano de fltros de punto flotante de Daubehes (9, 7) (ver Antonn et al., 99). La transformada 9/7 es de número real a número real y no permte una reonstruón perfeta, por lo que sólo puede utlzarse para ompresón on pérddas. Hemos mplementado esta transformada, ya que de las dos soportadas por el ode JPEG 000

196 70 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 báso (la otra es la transformada 5/3 que es no-lneal, de entero a entero y on reonstruón perfeta), ésta es la que permte trabajar on números reales. 0.. Etapa no-lneal La etapa no-lneal onsste en una normalzaón dvsva en la que las respuestas de la etapa lneal de fltrado preva se dvden entre la raíz uadrada de una suma ponderada de respuestas venas en espao, orentaón y esala al uadrado d onstante : { j }, más una sgno( ) = d + ej r j j (0.) Esta expresón se obtene elevando al uadrado la del esquema dretamente nvertble (Capítulo 8), pero preservando la nformaón de sgno para que sga sendo nvertble. Además, esta expresón es ompatble on la prevsta en el estándar JPEG 000 (Euaón 0.). Como ya hemos vsto en apítulos anterores, para ndependzar estadístamente las respuestas, podemos usar los parámetros (según el modelo gaussano) de la fdp ondonal d a de los oefentes wavelet lneales: =, e j = b j ( j) y e = 0. Dado que en JPEG 000 se usa una transformada wavelet algo dstnta de las usadas en apítulos anterores, es neesaro realular el valor de los parámetros d y {e j } para la transformada 9/7. Como sempre, los fjamos para ada subbanda, utlzando estmaón de máxma verosmltud on nuestro onjunto de mágenes naturales ( Boats, Elane, Goldhll, Lena, Peppers, y Salboat ). p( { j }) Un aspeto mportante de la etapa no-lneal es el vendaro partular onsderado. Como hemos dho, nos basamos en el esquema dretamente nvertble, es der, onsderamos oefentes { j } (j ) adyaentes a a lo largo de las uatro dmensones (9 venos en un uadrado en el espao D, en orentaón y en freuena espaal). Todos los venos perteneen a nveles superores de la prámde lneal de modo que la transformaón no-lneal puede nvertrse fálmente nvel a nvel (para reuperar un nvel de la prámde lneal obtenemos los valores de normalzaón a partr de nveles que ya se han reuperado y los multplamos por los orrespondentes

197 0. Esquema no-lneal ompatble on JPEG oefentes normalzados). Obvamente la esala más alta no se normalza, ya que no exsten esalas superores on las que poder normalzar. Las Fguras 0.3, 0.4 y 0.5 muestran los valores de los parámetros del modelo estadísto gaussano para todas las subbandas de la transformada 9/7. Como era de esperar, los valores de los parámetros son muy paredos a los que obtuvmos en el Capítulo 8 para la prámde QMF. La Tabla 0. muestra la IM resultante para las ses mágenes del onjunto de entrenamento. Como puede verse, la normalzaón dvsva hae que dsmnuya sgnfatvamente la IM, por lo general hasta un valor próxmo a ero, lo que nda que las respuestas normalzadas son prátamente ndependentes. Tabla 0.: IM entre dos oefentes wavelet venos y j ( j es el veno nferor dereho de ), y entre las orrespondentes respuestas normalzadas r y r j, para las 6 mágenes del onjunto de entrenamento. La subbanda onsderada es sempre la vertal de la esala más baja. IM(, j ) IM( r, r j ) Boats 0,7 0,04 Elane 0,05 0,04 Goldhll 0,09 0,04 Lena 0, 0,04 Peppers 0,08 0,04 Salboat 0, 0,05

198 7 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 (a) 0,0 0,04 0,03 0,00 0,05 0,3 0,0 0,49 0,0 0,03 0,0 0,00,6 (b) 0,0 0,03 0,03 0,00 0,07 0,5 0,5 0,3 0,00 0,05 0,0 0,0 0,55 () 0,0 0,08 0,0 0,00 0,05 0,9 0,7 0,30 0,0 0,04 0,0 0,00 0,0 Fgura 0.3: Valores de los parámetros del modelo estadísto gaussano para las subbandas horzontales de las dferentes esalas ( a orresponde a la freuena más alta y d a la más baja). Los valores sombreados orresponden a los 9 parámetros espaales. Los parámetros en orentaón están dspuestos horzontalmente, y vertalmente el parámetro en esala. El valor de se muestra debajo, dentro de la elpse punteada. a

199 0. Esquema no-lneal ompatble on JPEG (a) 0,0 0,07 0,0 0,0 0,05 0,7 0,04 0,3 0,04 0,3 0,0 0,0,4 (b) 0,00 0,06 0,0 0,0 0,04 0,4 0,03 0,35 0,03 0,5 0,03 0,0 0,48 () 0,00 0,08 0,00 0,0 0,03 0,8 0,03 0,39 0,03 0,6 0,0 0,00 0,09 Fgura 0.4: Valores de los parámetros del modelo estadísto gaussano para las subbandas vertales de las dferentes esalas.

200 74 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 (a) 0,03 0,07 0,05 0,00 0,06 0, 0,06 0,00 0,04 0,07 0,03 0,00 3,55 0,0 0,06 0,0 (b) 0,00 0,06 0, 0,06 0,00 0,04 0,06 0,03 0,0 0,75 () 0,0 0,06 0,0 0,00 0,09 0,30 0,06 0,0 0,0 0,0 0,0 0,00 0,3 Fgura 0.5: Valores de los parámetros del modelo estadísto gaussano para las subbandas dagonales de las dferentes esalas.

201 0.3 Implementaón del esquema de ompresón Implementaón del esquema de ompresón Con objeto de omparar la efena de odfaón, se ha mplementado tanto el esquema lneal basado en la transformada 9/7, omo la versón que nluye la etapa nolneal adaptada a la estadísta de las mágenes naturales, que se apla tras la transformada 9/7. Ambas versones se han mplementado en un ode JPEG 000 smplfado. El ode tene la msma estrutura que el ode báso de la Parte del estándar JPEG 000 (ver Apartado 0..). Básamente, la odfaón es omo sgue (la deodfaón es ompletamente análoga y esenalmente onsta de las etapas nversas que se reorren en orden tambén nverso):. La magen de entrada es preproesada para ajustar el rango dnámo nomnal de las muestras (se resta P- a ada muestra, donde P es el número de bts por muestra).. Se realza la transformaón ntraomponente, que onsta sempre de una etapa lneal, la transformada 9/7. Aquí usamos la mplementaón de la transformada 9/7 del programa JasPer (Adams y Kossentn, 000). La versón no-lneal nluye además la normalzaón dvsva. 3. Cuantzaón. Fjamos el paso del uantzador a, de forma que en la práta no hay uantzaón. 4. Codfaón de nvel. Cada subbanda se dvde en bloques de tamaño 64 x 64, ada uno de los uales se odfa ndependentemente. La odfaón se realza utlzando un odfador de planos de bts. Hemos mplementado una versón smplfada en la que se realza sólo una pasada por ada plano de bts (no hay subbaplanos de bts por tanto), reorréndose las muestras en un orden fjo omo sgue (ver Fgura 0.6): el bloque se dvde en franjas horzontales, on una anhura nomnal de uatro muestras, que se reorren de arrba abajo; dentro de un franja, las olumnas se reorren de zquerda a dereha y dentro de una olumna, las muestras se reorren de arrba a abajo. El sgno de ada muestra se odfa on un úno símbolo bnaro, justo después de su bt más sgnfatvo. El proeso de odfaón de planos de bts genera una seuena de símbolos que se odfan entrópamente. En partular, el odfador de entropía utlzado es un odfador artméto bnaro adaptatvo senllo (Moffat et al., 998; Moffat, 999). Todos los planos de bts del bloque se

202 76 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 odfan en una úna palabra de ódgo (esto es lo que en el estándar JPEG 000 se denomna termnaón por segmento). Fgura 0.6: Orden de reorrdo de muestras dentro de un bloque de odfaón. 5. Codfaón de nvel. La nformaón odfada se agrupa en undades de datos llamadas paquetes. Cada paquete onsta de una abeera y un uerpo. La abeera nda qué planos de bts se han nludo en el paquete (sólo neestamos almaenar el número máxmo de planos de bts de ada bloque, ya que los planos nludos son sempre los más sgnfatvos y además usamos una representaón de punto fjo on 3 bts tras el punto demal), y el uerpo ontene el resultado de la odfaón de dhos planos. En la odfaón de nvel se realza el ontrol de la tasa bnara medante la seleón del onjunto de planos de bts que se nlurán en el resultado de la odfaón. El odfador onoe la ontrbuón a la tasa bnara de ada plano de bts, así omo la reduón de dstorsón asoada. Usando esta nformaón, el odfador puede nlur los planos de bts que permten una mayor reduón de la dstorsón por undad de nformaón, hasta ompletar la tasa bnara espefada. Este método es muy flexble y permte el uso de dferentes métras de dstorsón. Nosotros, en partular, hemos usado dos métras de dstorsón dferentes: la lása PSNR, y la métra pereptual que presentamos en el apítulo anteror. La odfaón de nvel es la prnpal fuente de pérddas de nformaón dentro del esquema de ompresón, ya que en general se desartan algunos planos de bts. Para evtar que al nvertr la transformaón no-lneal los errores se propaguen de unas subbandas a otras, en el denomnador de la normalzaón dvsva (Euaón 0.) pueden usarse los valores de los oefentes wavelet una vez deodfados, en lugar de los valores orgnales.

203 0.4 Estudo omparatvo Estudo omparatvo En este apartado ompararemos de forma pormenorzada, sobre un ejemplo onreto, las versones lneal y no-lneal de nuesta mplementaón del ode JPEG 000 smplfado. Como ya hemos dho, ambas versones omparten la etapa lneal, y la dferena está en que a la versón no-lneal se le añade, antes de la uantzaón, la etapa de normalzaón dvsva. Esta omparaón dreta nos permtrá aprear las dferenas fundamentales entre ambos esquemas de representaón. Al msmo tempo tendremos oportundad de revsar desde una perspetva dferente algunos de los oneptos mportantes presentados en esta Tess, lo que nos servrá omo reaptulaón. Como magen de entrada, onsderaremos el fragmento de 8 x 8 píxeles que se muestra en la Fgura 0.7, de la magen Baboon en blano y negro y on 8 bpp. El heho de utlzar un fragmento de dho tamaño es por smpldad, ya que de este modo sólo se neesta un bloque por subbanda (reuérdese que el tamaño de los bloques es 64 x 64 muestras, presamente el tamaño de las subbandas de más altas freuenas espaales uando la magen de entrada tene 8 x 8 píxeles). Fgura 0.7: Fragmento de la magen Baboon utlzado omo entrada del ode JPEG 000 smplfado Estudo monoanal Inalmente, entraremos nuestro estudo en una subbanda en partular de las dos representaones, lneal y no-lneal, de la magen de entrada. En onreto, mentras no se dga otra osa, onsderaremos la subbanda vertal de la esala más baja (la de mayor freuena espaal). Todo lo que dgamos se umple gualmente para las otras subbandas, así que no estamos perdendo generaldad al haer esta eleón.

204 78 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG 000 Comenemos observando en la Fgura 0.8 el aspeto de las dos representaones onsderadas. Como puede verse, la transformada wavelet onserva gran parte de la estrutura global de la magen orgnal (esto es, la magen todavía es reonoble a grandes rasgos), mentras que la representaón no-lneal es más aleatora (tene un aspeto más rudoso) y sn una estrutura aparente. Esto, omo sabemos, lustra el heho de que la transformaón no-lneal elmna dependenas estadístas entre los oefentes que la transformaón lneal no es apaz de elmnar. Así por ejemplo, s alulamos la IM entre un oefente y su veno nferor dereho dentro de la subbanda, obtenemos 0,43 para la transformada wavelet y 0,6 para la transformaón no-lneal, esto es, los oefentes normalzados son más estadístamente ndependentes que los oefentes wavelet. (a) (b) Fgura 0.8: Subbanda vertal de la esala más baja de (a) la transformada 9/7 y (b) la representaón nolneal, del fragmento de la magen Baboon. Tambén es mportante omparar las fdp de los oefentes en uno y otro aso. Tal omo puede observarse en la Fgura 0.9, nluso después de fjar la desvaón estándar a 5 en ambos asos, las fdp resultantes son bastante dferentes. Así, en el aso no-lneal la fdp tene un fuerte po en ero y olas más largas, esto es, presenta una mayor urtoss. Numéramente, el valor de la urtoss pasa de,9 a 85,80 al aplar la normalzaón. El omportamento estadísto de los oefentes es por tanto muy dferente: mentras que los oefentes wavelet presentan una dstrbuón aproxmadamente gaussana (la urtoss de una gaussana es 0 por defnón), los oefentes normalzados sguen una dstrbuón on una urtoss elevada, lo que da lugar a un ódgo muho más dsperso. Esto, omo veremos, es muy nteresante en ompresón de mágenes.

205 0.4 Estudo omparatvo p(r) p() Fgura 0.9: fdp de los oefentes wavelet y los oefentes normalzados r, en la subbanda onsderada, tras fjar las desvaones estándar a 5. Convene aquí haer un nso para resaltar el papel que juega la no-lnealdad partular utlzada, en la forma de la fdp de los oefentes normalzados resultantes. Basta por ejemplo tomar la raíz uadrada de la no-lnealdad orgnal (esto es, r = / d + ej j ), para que los nuevos oefentes normalzados presenten una j fdp sn demasada urtoss, muy smlar a la de los oefentes wavelet (ver Fgura 0.0). Este últmo ejemplo resulta doblemente nteresante, ya que, omo omentamos en el apítulo anteror, esa no-lnealdad partular además reprodue peor los datos psofísos de enmasaramento de ontraste, lo que, a la vsta de lo dho, podría deberse a que no permte modelar onvenentemente el aráter dsperso del ódgo utlzado por el órtex vsual. Por otro lado, los valores altos de la transformaón no-lneal no se orresponden exatamente on las msmas posones de la magen que los de la transformada wavelet. Esto puede verse en la Fgura 0. en la que se muestran las posones sobre la magen en la que se enuentran el 5% de los valores más altos de los oefentes wavelet ( x ) y normalzados ( o ) de la subbanda onsderada. La dea subyaente es que la normalzaón dvsva seleona aquellos oefentes de una subbanda más relevantes desde el punto de vsta pereptual, y que además odfan ertos eventos de la magen de entrada mejor que los oefentes de las otras subbandas.

206 80 Capítulo 0. Inorporaón de la normalzaón dvsva al JPEG p() p(r) Fgura 0.0: fdp de los oefentes wavelet y los oefentes normalzados r (alulados aquí según la expresón: r = / d + e ), en la subbanda onsderada, tras fjar las desvaones estándar a 5. j j j Fgura 0.: Posones sobre la magen en las que se enuentran el 5% de los valores más altos de los oefentes wavelet ( x ) y normalzados ( o ) de la subbanda onsderada. Como los bloques se odfan por planos de bts, es mportante analzar tambén por planos de bts el omportamento de ambas representaones de la magen. Como puede verse en la Fgura 0. y la Fgura 0.3, las dferenas entre ambas representaones tambén son notables por planos de bts. Así por ejemplo, s nos fjamos en los bts más

Medición de la creatividad bajo la visión del ingeniero

Medición de la creatividad bajo la visión del ingeniero Medón de la reatvdad bajo la vsón del ngenero l modelo de Redelnghuys (1997ª, 1997b), es otra propuesta que busa medr la reatvdad en el proeso y se desarrolla espeífamente alrededor del tema de la reatvdad

Más detalles

Tema 2.2 TEORÍA DE LA ESTIMACIÓN

Tema 2.2 TEORÍA DE LA ESTIMACIÓN ema. EORÍA DE LA ESIMACIÓ Febrero-Mayo 006 IDICE.. IRODUCCIÓ.. ESIMACIÓ DE MÁXIMA VEROSIMILIUD (ML)..3 ESIMACIÓ BAYESIAA..4 PROBLEMAS DE LA DIMESIOALIDAD - AÁLISIS DE COMPOEES PRICIPALES (PCA) - AÁLISIS

Más detalles

Figura 77. Tabla de los costes de transporte de la operativa actual según las dos metodologías.

Figura 77. Tabla de los costes de transporte de la operativa actual según las dos metodologías. 6. CONCLUSIONES: VALORACIONES DE LOS COSTES DE TRANSPORTE: Reogemos aquí de nuevo los resultados de la valoraón de los ostes de transporte de la operatva atual obtendos a través de las dos metodologías

Más detalles

CÁLCULO DE APROXIMACIÓN A CRÍTICO. Orso J. A. (1) Facultad de Ciencias Exactas, Ingeniería y Agrimensura (UNR) CNEA

CÁLCULO DE APROXIMACIÓN A CRÍTICO. Orso J. A. (1) Facultad de Ciencias Exactas, Ingeniería y Agrimensura (UNR) CNEA ÁLULO DE APROXIMAIÓN A RÍTIO Orso J. A. ( Faultad de enas Exatas, Ingenería y Agrmensura (UNR NEA RESUMEN La posón de la barra de ontrol para la ondón del estado ríto de un reator nulear depende de muhos

Más detalles

UN POCO DE HISTORIA Prof. Teuvo Kohonen UN POCO DE HISTORIA

UN POCO DE HISTORIA Prof. Teuvo Kohonen UN POCO DE HISTORIA Self-Organzng Maps 1. Defnón.. Un poo de hstora. CONTENIDO 3. Desrpón del algortmo. L. Pablo Sergo Garía 4. Ejemplos en ejeuón. 5. Problemas 6. Aplaones. DEFINICIÓN El SOM es un algortmo para vsualzar

Más detalles

V. Materiales y Métodos. Castro (2002). Las propiedades de la corriente de alimentación se presentan en la tabla 2.

V. Materiales y Métodos. Castro (2002). Las propiedades de la corriente de alimentación se presentan en la tabla 2. V. Materales y Métodos 5.1 Caso de Estudo Para probar el algortmo a desarrollar se utlzará el aso de estudo utlzado por Jménez y Castro (2002). Las propedades de la orrente de almentaón se presentan en

Más detalles

Teorema de Clausen von Staudt. Congruencias de Kummer. Primos irregulares

Teorema de Clausen von Staudt. Congruencias de Kummer. Primos irregulares Teorema de Clausen von Staudt. Congruenas de Kummer. Prmos rregulares Alexey Beshenov (adadr@gmal.om 7 de Marzo de 2017 Denomnadores de B (el teorema de Clausen von Staudt Teorema. Para todo 2 par se tene

Más detalles

Producto F1 F2 F3 F4 F5 F6 A B C Capacidad

Producto F1 F2 F3 F4 F5 F6 A B C Capacidad PROBLEMA: PRODUCCIÓN DE TRES PRODUCTOS (PRODUCTION OF THREE PRODUCTS) Una ompañía fabra una gama de tres produtos, A, B y C, en ses dferentes fatorías. Los ostes untaros de fabraón de ada produto y las

Más detalles

Soluciones Hoja 2: Relatividad (II)

Soluciones Hoja 2: Relatividad (II) Soluones Hoja 2: Relatdad II Dos naes espaales déntas y, on longtud en reposo l km, aanzan paralelas la una a la otro on elodades /2 y /4, respetamente, on respeto a un sstema de referena neral S Inalmente,

Más detalles

Introducción a la Química Computacional

Introducción a la Química Computacional Introduón a la Químa Computaonal TEORÍA ORBITALES MOLECULARES DE HÜCKEL EXTENDIDA (EHT) Reservados todos los derehos de reproduón. Lus A. Montero Cabrera, Unversdad de La Habana, Cuba, 010. Introduón a

Más detalles

TEMA 6: INTERDEPENDENCIA COMPETENCIA

TEMA 6: INTERDEPENDENCIA COMPETENCIA TEMA 6: INTERDEPENDENCIA ESTRATEGICA Y MODELOS DE COMPETENCIA. Competena en antdades: Modelos de Cournot. La ompetena perfeta omo límte de ompetena en antdades entre gran número de empresas. Competena

Más detalles

Vaporización y condensación parcial de equilibrio

Vaporización y condensación parcial de equilibrio Vaporaón y ondensaón paral de equlbro El separador flash en equlbro es el más senllo de los proesos de etapas de equlbro on el que se puede enontrar un dseñador. Aún uando ntervene solamente una etapa,

Más detalles

TEMA 1. MÉTODOS APROXIMADOS PARA EL CÁLCULO DE OPERACIONES DE SEPARACIÓN DE MEZCLAS MULTICOMPONENTES

TEMA 1. MÉTODOS APROXIMADOS PARA EL CÁLCULO DE OPERACIONES DE SEPARACIÓN DE MEZCLAS MULTICOMPONENTES Unversdad de Alante. Dpto. Ingenería Químa Amplaón de Operaones de Separaón.. Métodos apromados TEMA. MÉTODOS APROXIMADOS PARA EL CÁLCULO DE OPERACIONES DE SEPARACIÓN DE MEZCLAS MULTICOMPONENTES. INTRODUCCIÓN

Más detalles

Teoría rigurosa de la dispersión de haces gaussianos por una rejilla con sustrato metálico

Teoría rigurosa de la dispersión de haces gaussianos por una rejilla con sustrato metálico Superfes y Vaío 7(), 7-3, marzo de 004 Soedad Mexana de Cena de Superfes y de Vaío Teoría rgurosa de la dspersón de haes gaussanos por una rejlla on sustrato metálo O. Mata Méndez, Chávez Rvas Departamento

Más detalles

Probabilidad condicional

Probabilidad condicional robabldades y Estadísta Computaón Faultad de Cenas Exatas y Naturales Unversdad de uenos res na M. ano y Elena J. Martínez 00 robabldad ondonal Consderemos una urna que ontene bolllas roas y 5 blanas.

Más detalles

Tema 6. Estadística descriptiva bivariable con variables numéricas

Tema 6. Estadística descriptiva bivariable con variables numéricas Clase 6 Tema 6. Estadístca descrptva bvarable con varables numércas Estadístca bvarable: tpos de relacón Relacón entre varables cuanttatvas Para dentfcar las característcas de una relacón entre dos varables

Más detalles

Equilibrio de Fases y Químico

Equilibrio de Fases y Químico Equlbro de Fases y Químo Mlton Mederos Equlbro de Fases y Químo Mlton Mederos Profesor, Departamento de Fsoquíma, Faultad de Químa Unversdad Naonal Autónoma de Méxo Los apítulos orrespondentes a las prátas

Más detalles

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004) FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Xménez & San Martín, 004) Capítulo. Nocones báscas de álgebra de matrces Fe de erratas.. Cálculo de la transpuesta de una matrz

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información IV. Base de Datos CAPÍTULO IV. MEDICIÓN De acuerdo con Székely (2005), exste dentro del período 950-2004 nformacón representatva a nvel naconal que en algún momento se ha utlzado para medr la pobreza.

Más detalles

Modelos lineales Regresión simple y múl3ple

Modelos lineales Regresión simple y múl3ple Modelos lneales Regresón smple y múl3ple Dept. of Marne Scence and Appled Bology Jose Jacobo Zubcoff Modelos de Regresón Smple Que tpo de relacón exste entre varables Predccón de valores a partr de una

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

Departamento de Señales, Sistemas y Radicomunicaciones Comunicaciones Digitales, junio 2011

Departamento de Señales, Sistemas y Radicomunicaciones Comunicaciones Digitales, junio 2011 Departamento de Señales, Sstemas y Radcomuncacones Comuncacones Dgtales, juno 011 Responder los problemas en hojas ndependentes. No se permte el uso de calculadora. Problema 1 6 p.) En este ejercco se

Más detalles

Posicionamiento puntual preciso con receptores GPS geodésicos

Posicionamiento puntual preciso con receptores GPS geodésicos osonamento puntual preso on reeptores GS geodésos C. Brunn, M. Gende, F. Azplueta Geodesa Espaal y Aeronomía Faultad de Cenas Astronómas y Geofísas Unversdad Naonal de a lata CONICET Argentna Reunón SIRGAS

Más detalles

Laboratorio 9. Equilibrio de distribución de un soluto en solventes inmiscibles

Laboratorio 9. Equilibrio de distribución de un soluto en solventes inmiscibles Laboratoro 9. Equlbro de dstrbuón de un soluto en solventes nmsbles Objetvo Determnar el oefente de dstrbuón de ádo aéto en el sstema agua/loroformo y agua/éter. Además, se determnará la efena de extraón

Más detalles

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso CURSO ITERACIOAL: COSTRUCCIÓ DE ESCEARIOS ECOÓMICOS ECOOMETRÍA AVAZADA Instructor: Horaco Catalán Alonso Modelo de Regresón Lneal Smple El modelo de regresón lneal representa un marco metodológco, que

Más detalles

Estudio de la difusión de calor en sistemas de dos capas de GaAs/GaSb unidos mediante la técnica de fusión

Estudio de la difusión de calor en sistemas de dos capas de GaAs/GaSb unidos mediante la técnica de fusión Superfes y Vao 8, 94-98(999) Soedad Mexana de Cenas de Superfes y de Vaío. Estudo de a dfusón de aor en sstemas de dos apas de GaAs/GaSb undos medante a téna de fusón R. A. Muñoz Hernández y A. Caderón

Más detalles

CAPÍTULO 4 MARCO TEÓRICO

CAPÍTULO 4 MARCO TEÓRICO CAPÍTULO 4 MARCO TEÓRICO Cabe menconar que durante el proceso de medcón, la precsón y la exacttud de cualquer magntud físca está lmtada. Esta lmtacón se debe a que las medcones físcas sempre contenen errores.

Más detalles

Estadísticos muéstrales

Estadísticos muéstrales Estadístcos muéstrales Hemos estudado dferentes meddas numércas correspondentes a conjuntos de datos, entre otras, estudamos la meda, la desvacón estándar etc. Ahora vamos a dstngur entre meddas numércas

Más detalles

REDISTRIBUCIÓN DE RIQUEZA USANDO DERECHOS DE CONSUMO: EL CASO IGUALITARIO 1

REDISTRIBUCIÓN DE RIQUEZA USANDO DERECHOS DE CONSUMO: EL CASO IGUALITARIO 1 REDISTRIBUCIÓN DE RIQUEZA USANDO DERECHOS DE CONSUMO: EL CASO IGUALITARIO 1 Franso Martínez C 2. y Jorge Rvera C 3. Unversdad de Chle Abstrat The fundamental dea of ths paper s the use of a market mehansm

Más detalles

La efectividad de la política fiscal en el Perú:

La efectividad de la política fiscal en el Perú: La efetvdad de la políta fsal en el Perú: 98-26 Waldo Mendoza PUCP y Karl Melgarejo UNALM 2 Cuál es el efeto de la políta fsal sobre el nvel de atvdad eonóma? A nvel teóro, la respuesta depende de los

Más detalles

Tema 1.3_A La media y la desviación estándar

Tema 1.3_A La media y la desviación estándar Curso 0-03 Grado en Físca Herramentas Computaconales Tema.3_A La meda y la desvacón estándar Dónde estudar el tema.3_a: Capítulo 4. J.R. Taylor, Error Analyss. Unv. cence Books, ausalto, Calforna 997.

Más detalles

Un nuevo algoritmo de búsqueda de sistemas de trading bursatil a corto plazo basado en GAPs

Un nuevo algoritmo de búsqueda de sistemas de trading bursatil a corto plazo basado en GAPs Un nuevo algortmo de búsqueda de sstemas de tradng bursatl a orto plazo basado en GAPs Manuel E. Fernández Garía Enrque A. de la Cal Marín Raquel Quroga Garía Dpto. de Informáta Dpto. de Informáta Dpto.

Más detalles

Cálculo y EstadísTICa. Primer Semestre.

Cálculo y EstadísTICa. Primer Semestre. Cálculo y EstadísTICa. Prmer Semestre. EstadísTICa Curso Prmero Graduado en Geomátca y Topografía Escuela Técnca Superor de Ingeneros en Topografía, Geodesa y Cartografía. Unversdad Poltécnca de Madrd

Más detalles

El problema de los matrimonios estables con información incompleta.

El problema de los matrimonios estables con información incompleta. Rev. Cub. Físa vol.3 o. (006) p.80-85 ISS: 053-968. Orgnal paper Revsta Cubana de Físa Calle I o. 30 e/ 5 y 7 Vedado, La Habana. www.fsa.uh.u/bblotea/revubf/ndex.htm El problema de los matrmonos estables

Más detalles

Universidad Nacional del Litoral Facultad de Ingeniería Química. Magister en Matemática

Universidad Nacional del Litoral Facultad de Ingeniería Química. Magister en Matemática nversdad Naonal del toral Faultad de Ingenería Químa Tess presentada omo parte de los requstos para la obtenón del grado aadémo de: Magster en Matemáta Título de la tess Convergena optmzaón global en Programaón

Más detalles

Figura 1

Figura 1 5 Regresón Lneal Smple 5. Introduccón 90 En muchos problemas centífcos nteresa hallar la relacón entre una varable (Y), llamada varable de respuesta, ó varable de salda, ó varable dependente y un conjunto

Más detalles

Medidas de Variabilidad

Medidas de Variabilidad Meddas de Varabldad Una medda de varabldad es un ndcador del grado de dspersón de un conjunto de observacones de una varable, en torno a la meda o centro físco de la msma. S la dspersón es poca, entonces

Más detalles

UNIVERSIDAD POLITÉCNICA DE MADRID

UNIVERSIDAD POLITÉCNICA DE MADRID UNIVERSIDAD POLITÉCNICA DE MADRID DEPARTAMENTO DE INGENIERÍA ELÉCTRICA, ELECTRÓNICA, AUTOMÁTICA Y FÍSICA APLICADA Prátas de Vsón Artal Práta 3 Calbraón de ámaras de vídeo 3.2 Calbraón de ámaras 3 CALIBRACIÓN

Más detalles

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad.

PROYECTO DE TEORIA DE MECANISMOS. Análisis cinemático y dinámico de un mecanismo plano articulado con un grado de libertad. Nombre: Mecansmo: PROYECTO DE TEORIA DE MECANISMOS. Análss cnemátco y dnámco de un mecansmo plano artculado con un grado de lbertad. 10. Análss dnámco del mecansmo medante el método de las tensones en

Más detalles

Operadores por Regiones

Operadores por Regiones Operadores por Regones Fltros por Regones Los fltros por regones ntentan determnar el cambo de valor de un píxel consderando los valores de sus vecnos I[-1,-1] I[-1] I[+1,-1] I[-1, I[ I[+1, I[-1,+1] I[+1]

Más detalles

IMPLEMENTACIÓN PRÁCTICA DE UN BANCO DE FILTROS UNIFORME. S Q Salida del filtro Q h(n) Filtro s(n) Señal L Tamaño de la ventana del filtro 0 # n # L-1

IMPLEMENTACIÓN PRÁCTICA DE UN BANCO DE FILTROS UNIFORME. S Q Salida del filtro Q h(n) Filtro s(n) Señal L Tamaño de la ventana del filtro 0 # n # L-1 IMPEMEACIÓ PRÁCICA DE U BACO DE FIROS UIFORME En este tpo de bancos, la forma de la respuesta espectral de cada uno de los fltros es la msma, y su frecuenca central se raparte de manera unforme en el espectro:

Más detalles

PROBLEMAS RESUELTOS ÁLGEBRA LINEAL Tema 2. Espacios Vectoriales TEMA: MATRIZ DE TRANSICIÓN Y VECTOR DE COORDENADAS

PROBLEMAS RESUELTOS ÁLGEBRA LINEAL Tema 2. Espacios Vectoriales TEMA: MATRIZ DE TRANSICIÓN Y VECTOR DE COORDENADAS PROLEMS RESUELTOS ÁLGER LINEL Tema. Espaos Vetorales TEM: MTRIZ DE TRNSICIÓN Y VECTOR DE COORDENDS Problema : Sean las bases y de un espao vetoral defndo sobre los números omplejos:, 0,,,, {( ) ( )} (,,

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

2. EL TENSOR DE TENSIONES. Supongamos un cuerpo sometido a fuerzas externas en equilibrio y un punto P en su interior.

2. EL TENSOR DE TENSIONES. Supongamos un cuerpo sometido a fuerzas externas en equilibrio y un punto P en su interior. . EL TENSOR DE TENSIONES Como se explcó prevamente, el estado tensonal en un punto nteror de un cuerpo queda defndo por 9 componentes, correspondentes a componentes por cada una de las tensones nternas

Más detalles

ESTADÍSTICA. Definiciones

ESTADÍSTICA. Definiciones ESTADÍSTICA Defncones - La Estadístca es la cenca que se ocupa de recoger, contar, organzar, representar y estudar datos referdos a una muestra para después generalzar y sacar conclusones acerca de una

Más detalles

Determinación de los tiempos en el Hidrograma Unitario Geomorfológico de Depósitos y Canal.

Determinación de los tiempos en el Hidrograma Unitario Geomorfológico de Depósitos y Canal. IV Jornadas de Ingenería del Agua La preptaón y los proesos erosvos Córdoba, 1 y de Otubre 15 Determnaón de los tempos en el Hdrograma Untaro Geomorfológo de Depóstos y Canal. Goñ, M., Gmena, F.N., López,

Más detalles

) para toda permutación (p p 1 p

) para toda permutación (p p 1 p 09 Elena J. Martínez do cuat. 004 Análss de la varanza de dos factores El problema anteror consderaba la comparacón de muestras para detectar dferencas entre las respectvas poblacones. En el modelo de

Más detalles

Aprendizaje neuronal aplicado a la fusión de colecciones multilingües en CLIR

Aprendizaje neuronal aplicado a la fusión de colecciones multilingües en CLIR Aprendzaje neuronal aplado a la fusón de oleones multlngües en CLIR Mª Teresa Martín Valdva Unversdad de Jaén Av. Madrd 37, 23071 mate@ujaen.es L. Alfonso Ureña López Unversdad de Jaén Av. Madrd 37, 23071

Más detalles

Laboratorio 9. Equilibrio de distribución de un soluto en solventes inmiscibles

Laboratorio 9. Equilibrio de distribución de un soluto en solventes inmiscibles Laboratoro 9. Equlbro de dstrbuón de un soluto en solventes nmsbles Objetvo Determnar el oefente de dstrbuón de ádo aéto en el sstema agua/loroformo y agua/éter. Además, se determnará la efena de extraón

Más detalles

4.- Métodos gráficos rigurosos de diseño para operaciones de separación por etapas de equilibrio: Rectificación de sistemas binarios y extracción de

4.- Métodos gráficos rigurosos de diseño para operaciones de separación por etapas de equilibrio: Rectificación de sistemas binarios y extracción de 4.- Métodos gráfos rgurosos de dseño para operaones de separaón por etapas de equlbro: Retfaón de sstemas bnaros y extraón de sstemas ternaros 33 4. Métodos Gráfos Rgurosos de Dseño para Operaones de

Más detalles

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Tabla de contendos Ap.A Apéndce A: Metodología

Más detalles

Teoría de Sistemas y Señales

Teoría de Sistemas y Señales Teoría de Sstemas y Señales MODULACIÓN DE ONDA CONTINUA NB: El ontendo de este apunte es una traduón al Castellano de parte del Capítulo 3 de Communaton Systems by Smon Haykn, 3rd. Edton, Wley & Sons,

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Redes de Neuronas: Preparacón de datos para el aprendzaje y meddas de evaluacón 1. Preparacón de datos Característcas de los datos

Más detalles

SISTEMAS DE ECUACIONES DIFERENCIALES

SISTEMAS DE ECUACIONES DIFERENCIALES DIVISIÓN DE CIENCIAS FÍSICAS Y MATEMÁTICAS DTO. TERMODINÁMICA Y FENÓMENOS DE TRANSFERENCIA MÉTODOS AROXIMADOS EN ING. QUÍMICA TF-33 SISTEMAS DE ECUACIONES DIFERENCIALES Esta guía fue elaborada por: rof.

Más detalles

Técnicas de tratamiento de señal y comunicaciones

Técnicas de tratamiento de señal y comunicaciones Esuela Téna Superor de Ingenería de Teleomunaón Máster en Ingenería de Teleomunaón Ténas de tratamento de señal y omunaones 5 Transmsón en anales on desvanementos Tx d d Rx =d / José Tomás Entrambasaguas

Más detalles

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica? Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento

Más detalles

TIPOS DE FLUJO. Tomaremos para analizar

TIPOS DE FLUJO. Tomaremos para analizar IPOS E FLUJO Muhos sstemas de utldad práta nvoluran flujos bdmensonales, lo ual torna ompleja la resoluón matemáta de la stuaón, por ello se plantearon asos límte de omportamento de flujo: FLUJO IVISCIO

Más detalles

Universidad Diego Portales Facultad de Economía y Empresa

Universidad Diego Portales Facultad de Economía y Empresa Unversdad Dego Portales Profesor: Carlos R. Ptta Hasta este momento nos hemos enfocado en juegos en los cuales cualquer nformacón que es conocda por un jugador es conocda por todos los demás (es decr,

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa. MEDIDA DE DIPERIÓ A. Una pregunta muy partcular que se puede hacer a una dstrbucón de datos es de qué magntud es es la heterogenedad que se observa. FICHA º 18 Las meddas de dspersón generalmente acompañan

Más detalles

Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados

Análisis de la relación precio marginal y demanda de electricidad mediante conglomerados X ongreso de Ingenería de Organzaón Valena, 7 y 8 de septembre de 2006 Análss de la relaón preo margnal y demanda de eletrdad medante onglomerados Andrés Ramos 1, Gonzalo ortés 1, Jesús Mª Latorre 1, Santago

Más detalles

SEMANA 13. CLASE 14. MARTES 20/09/16

SEMANA 13. CLASE 14. MARTES 20/09/16 SEMAA 3. CLASE. MARTES 20/09/6. Defncones de nterés.. Estadístca descrptva. Es la parte de la Estadístca que se encarga de reunr nformacón cuanttatva concernente a ndvduos, grupos, seres de hechos, etc..2.

Más detalles

SEGUNDA PARTE RENTAS FINANCIERAS

SEGUNDA PARTE RENTAS FINANCIERAS SEGUNDA PARTE RENTAS FINANCIERAS 5 INTRODUCCIÓN A LA TEORÍA DE RENTAS 5.1 CONCEPTO: Renta fnancera: conjunto de captales fnanceros cuyos vencmentos regulares están dstrbudos sucesvamente a lo largo de

Más detalles

TEMA 5: TRANSPORTE EN ESTADO ESTACIONARIO: RESOLUCIÓN NUMÉRICA DE PROBLEMAS ODE-BVP

TEMA 5: TRANSPORTE EN ESTADO ESTACIONARIO: RESOLUCIÓN NUMÉRICA DE PROBLEMAS ODE-BVP Ingenería Químa Cálulo Avanzado de Proesos Químos. TEMA 5 4º urso. TEMA 5: TRANSPORTE EN ESTADO ESTACIONARIO: RESOLUCIÓN NUMÉRICA DE PROBLEMAS ODE-BVP. PROBLEMAS ODE-BVP: PRESENTACIÓN. CONDICIONES DE INTEGRACIÓN

Más detalles

Control Estadístico de las Mediciones (Aplicación a la calibración de pesas)

Control Estadístico de las Mediciones (Aplicación a la calibración de pesas) Control Estadísto de las Medones (Aplaón a la albraón de pesas) Lus Oar Beerra antago Resuen: En etrología, y en espeal en laboratoros de albraón y pruebas es portante antener bajo ontrol etrológo los

Más detalles

CLAVE - Laboratorio 1: Introducción

CLAVE - Laboratorio 1: Introducción CLAVE - Laboratoro 1: Introduccón ( x )( x ) x ( xy) x y a b a b a a a ( x ) / ( x ) x ( x ) x a b a b a b ab n! n( n 1)( n 2) 1 0! 1 x x x 1 0 1 (1) Smplfque y evalúe las sguentes expresones: a. 10 2

Más detalles

Análisis de Resultados con Errores

Análisis de Resultados con Errores Análss de Resultados con Errores Exsten dos tpos de errores en los expermentos Errores sstemátcos errores aleatoros. Los errores sstemátcos son, desde lejos, los más mportantes. Errores Sstemátcos: Exsten

Más detalles

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES Documento Preparado para la Cámara de Fondos de Inversón Versón 203 Por Rodrgo Matarrta Venegas 23 de Setembre del 204 2 Análss Industral

Más detalles

6 Minimización del riesgo empírico

6 Minimización del riesgo empírico 6 Mnmzacón del resgo empírco Los algortmos de vectores soporte consttuyen una de las nnovacones crucales en la nvestgacón sobre Aprendzaje Computaconal en la década de los 990. Consttuyen la crstalzacón

Más detalles

10. VIBRACIONES EN SISTEMAS CON N GRADOS DE LIBERTAD

10. VIBRACIONES EN SISTEMAS CON N GRADOS DE LIBERTAD 10. VIBRACIONES EN SISEMAS CON N GRADOS DE LIBERAD 10.1. Matrces de rgdez, nerca y amortguamento Se puede demostrar que las ecuacones lneales del movmento de un sstema dscreto de N grados de lbertad sometdo

Más detalles

Propuesta metodológica en el contexto de modelos de función de transferencia con expectativas

Propuesta metodológica en el contexto de modelos de función de transferencia con expectativas Curso 994/95 HUANIDADES Y CIENCIAS SOCIALES ARÍA CANDELARIA GIL FARIÑA Propuesta metodológa en el ontexto de modelos de funón de transferena on expetatvas Dretora CONCEPCIÓN GONZÁLEZ CONCEPCIÓN SOPORTES

Más detalles

VISIÓN POR COMPUTADOR

VISIÓN POR COMPUTADOR Escuela Poltécnca Superor de Elche VISIÓN POR COMPUTADOR Grado en Electrónca y Automátca Industral PRÁCTICAS TITERE Práctca 4: Segmentacón, Localzacón y Reconocmento de Obetos Departamento de Ingenería

Más detalles

TRABAJO DE FIN DE CARRERA

TRABAJO DE FIN DE CARRERA TRABAJO DE FI DE CARRERA TITULO DEL TFC: avegaón en el sstema solar empleando asterodes omo referena TITULACIO: Engnyera Tèna Aeronàuta, espealtat Aeronavegaó AUTOR: José Lus Cha Bermejo DIRECTOR: Jord

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Examen Fnal Pregunta ( punto) Responda brevemente a las sguentes preguntas: a) Cuál es el obetvo en el aprendzae del Perceptron

Más detalles

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D.

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D. CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 0 Ing. Dego A. Patño G. M.Sc, Ph.D. Solucón de la Ecuacón de Estado Solucón de Ecuacones de Estado Estaconaras: Para el caso estaconaro (nvarante en el tempo),

Más detalles

Nº A EVALUACIÓN DE LA NUEVA NORMA ACI 350 EN ESTANQUES SEMIENTERRADOS DE HORMIGÓN ARMADO.

Nº A EVALUACIÓN DE LA NUEVA NORMA ACI 350 EN ESTANQUES SEMIENTERRADOS DE HORMIGÓN ARMADO. Unversdad de Conepón Departamento de Ingenería Cvl Asoaón Chlena de Ssmología e Ingenería Antsísma Nº A1-15. EVAUACIÓN DE A NUEVA NORMA ACI 350 EN ESTANQUES SEMIENTERRADOS DE ORMIGÓN ARMADO. Fernando Yáñez

Más detalles

Generación de e Modelos 3D a Partir de e Datos de e Rango de e Vistas Parciales.

Generación de e Modelos 3D a Partir de e Datos de e Rango de e Vistas Parciales. Generacón de e Modelos 3D a Partr de e Datos de e Rango de e Vstas Parcales. Santago Salamanca Mño Escuela de Ingenerías Industrales Unversdad de Extremadura (UNED, UCLM, UEX) Introduccón (I) Qué es un

Más detalles

Cinemática del Brazo articulado PUMA

Cinemática del Brazo articulado PUMA Cnemátca del Brazo artculado PUMA José Cortés Parejo. Enero 8. Estructura del brazo robótco El robot PUMA de la sere es un brazo artculado con artculacones rotatoras que le proporconan grados de lbertad

Más detalles

Fundamentos económicos y matemáticos para un modelo de equilibrio general computable

Fundamentos económicos y matemáticos para un modelo de equilibrio general computable Fundamentos eonómos y matemátos para un modelo de equlbro general omputable Karna Manrque López Lya Paola Serra Resumen Este artíulo desrbe la forma y la mportana de los Modelos de Equlbro General Computable

Más detalles

Tema 9: Otros temas de aplicación

Tema 9: Otros temas de aplicación Tema 9: Otros temas de aplcacón. Introduccón Exsten muchos elementos nteresantes y aplcacones del Matlab que no se han comentado a lo largo de los temas. Se nvta al lector a que nvestgue sobre ellos según

Más detalles

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias. Estadístca (Q) Dana M. Kelmansky 5 Varables Aleatoras Nos nteresa asgnar probabldades a valores numércos obtendos a partr de fenómenos aleatoros, es decr a varables aleatoras. Por ejemplo, calcular la

Más detalles

Capítulo 11. Movimiento de Rodamiento y Momentum Angular

Capítulo 11. Movimiento de Rodamiento y Momentum Angular Capítulo 11 Movmento de Rodamento y Momentum Angular 1 Contendos: Movmento de rodamento de un cuerpo rígdo. Momentum Angular de una partícula. Momentum Angular de un sstema de partículas. Momentum Angular

Más detalles

DISEÑO SEVERO. PALACIOS C. SEVERO Consultor Metalúrgico. Lima Perú

DISEÑO SEVERO. PALACIOS C. SEVERO Consultor Metalúrgico. Lima Perú DISEÑO SEVERO PALACIOS C. SEVERO Consultor Metalúrgco espc@yahoo.com Lma Perú RESUMEN: Se ha desarrollado un nuevo dseño de mucha utldad para los procesos ndustrales al cual he denomnado Dseño Severo.

Más detalles

Utilizar sumatorias para aproximar el área bajo una curva

Utilizar sumatorias para aproximar el área bajo una curva Cálculo I: Guía del Estudante Leccón 5 Apromacón del área bajo la curva Leccón 5: Apromacón del área bajo una curva Objetvo: Utlzar sumatoras para apromar el área bajo una curva Referencas: Stewart: Seccón

Más detalles

3 LEYES DE DESPLAZAMIENTO

3 LEYES DE DESPLAZAMIENTO eyes de desplazamento EYES DE DESPAZAMIENTO En el capítulo dos se expone el método de obtencón de las leyes de desplazamento dseñadas por curvas de Bézer para mecansmos leva palpador según el planteamento

Más detalles

PLANTEAMIENTO DE PROBLEMAS DE EQUILIBRIO

PLANTEAMIENTO DE PROBLEMAS DE EQUILIBRIO FACUTAD DE QUÍMICA Maestría En Ingenería Químa TERMODINÁMICA QUÍMICA Semestre 00- PANTEAMIENTO DE PROBEMAS DE EQUIIBRIO Un problema de equlbro de fases es aquel en donde dos o más fases están en ontato

Más detalles

Capítulo 11. Movimiento de Rodamiento y Momentum Angular

Capítulo 11. Movimiento de Rodamiento y Momentum Angular Capítulo 11 Movmento de Rodamento y Momentum Angular 1 Contendos: Movmento de rodamento de un cuerpo rígdo. Momentum Angular de una partícula. Momentum Angular de un sstema de partículas. Momentum Angular

Más detalles

MATEMATICA APLICADA A LA ECONOMIA TEORIA DE LAS DECISIONES Y TEORIA DE JUEGOS

MATEMATICA APLICADA A LA ECONOMIA TEORIA DE LAS DECISIONES Y TEORIA DE JUEGOS Prof. Antono Badan MAHAVE PROFESOR EN MAT EMÁT ICA, FÍSICA Y COSMOGRAFÍA, EGRESADO DE LA FACULTAD DE CIENCIAS EXACTAS, FÍSICAS Y AGRIMENSURA DE LA UNIVER SIDAD NACIONAL DEL NORDESTE. Profesor de la Unversdad

Más detalles

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia MAT-3 Estadístca I Tema : Meddas de Dspersón Facltador: Félx Rondón, MS Insttuto Especalzado de Estudos Superores Loyola Introduccón Las meddas de tendenca central son ndcadores estadístcos que resumen

Más detalles

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN COLEGIO IGLÉS DEPARTAMETO IVEL: CUARTO MEDIO PSU. UIDAD: ESTADISTICA 3 PROFESOR: ATALIA MORALES A. ROLADO SAEZ M. MIGUEL GUTIÉRREZ S. JAVIER FRIGERIO B. MEDIDAS DE DISPERSIÓ Las meddas de dspersón dan

Más detalles

Fundamentos de la Visión Tridimensional (3D)

Fundamentos de la Visión Tridimensional (3D) Fundaentos de la Vsón Trdensonal (3D) Adqusón de nforaón 3D Índe detallado (ontnuaón) 8. La atrz fundaental 9. Vsón estereosópa trnoular. Ténas atas de adqusón de ágenes de rango. Trangulaón ata. araterístas

Más detalles

El diodo Semiconductor

El diodo Semiconductor El dodo Semconductor J.I. Hurcán Unversdad de La Frontera Aprl 9, 2012 Abstract Se plantean procedmentos para analzar crcutos con dodos. Para smpl car el trabajo, el dodo semconductor es reemplazado por

Más detalles

CASO PRÁCTICO TEORÍA. 1 i (REGRESIÓN LINEAL CON PESOS ESTADÍSTICOS OBTENIDOS DE RÉPLICAS)

CASO PRÁCTICO TEORÍA. 1 i (REGRESIÓN LINEAL CON PESOS ESTADÍSTICOS OBTENIDOS DE RÉPLICAS) Caso 6: Calbrado para fosfato y predccón nversa 43 Caso 6 : Calbrado para fosfato y predccón nversa (REGRESIÓN LINEAL CON PESOS ESTADÍSTICOS OBTENIDOS DE RÉPLICAS) CASO PRÁCTICO Al hacer calbrados con

Más detalles

Estadísticos muéstrales

Estadísticos muéstrales Estadístcos muéstrales Una empresa dedcada al transporte y dstrbucón de mercancías, tene una plantlla de 50 trabajadores. Durante el últmo año se ha observado que 5 trabajadores han faltado un solo día

Más detalles

Agenda del 17/5/2017

Agenda del 17/5/2017 Agenda del 17/5/2017 Regresón lneal Idea y orgen La geometría de los mínmos cuadrados Los problemas numércos que conducen a malos resultados. Ejemplo real. Mínmos cuadrados no lneales Demostracón de software

Más detalles

0. Introducción. 2. Medida de temperatura y de entropía 3. Máquinas endorreversibles. 5. El ciclod e Diesel 6. El ciclo de Stirling

0. Introducción. 2. Medida de temperatura y de entropía 3. Máquinas endorreversibles. 5. El ciclod e Diesel 6. El ciclo de Stirling 4 roesos ílos 0. Introduón. El lo de arnot. Medda de temperatura y de entropía 3. Máqunas endorreersbles 4. El lo de Otto 5. El lod e Desel 6. El lo de Strlng 7. El proeso de Joule homson 8. El oeente

Más detalles

RESUMEN DE TESIS DOCTORAL. Minería de Texto empleando la Semejanza entre Estructuras Semánticas Text Mining using Comparison of Semantic Structures

RESUMEN DE TESIS DOCTORAL. Minería de Texto empleando la Semejanza entre Estructuras Semánticas Text Mining using Comparison of Semantic Structures RESUMEN DE TESIS DOCTORAL Computaón y Sstemas Vol. 9 Núm., pp. 063-08 005, CIC-IPN, ISSN 405-5546, Impreso en Méxo Mnería de Texto empleando la Semeanza entre Estruturas Semántas Text Mnng usng Comparson

Más detalles

Dr. Pedro Huertas Gallardo. Laboratorio de Acústica Aplicada a la Ingeniería Civil. JORNADA DE INVESTIGACIÓN I+D+I en EDIFICACIÓN.

Dr. Pedro Huertas Gallardo. Laboratorio de Acústica Aplicada a la Ingeniería Civil. JORNADA DE INVESTIGACIÓN I+D+I en EDIFICACIÓN. JORNADA DE INVESTIGACIÓN I+D+I en EDIFICACIÓN. CUENCA 27 DISEÑO DE ABSORBEDORES ACÚSTICOS ACTIVOS MEDIANTE CAVIDADES REALIZADAS EN MADERA DE PINO DE CUENCA PARA REDUCIR EL RUIDO DE RODADURA EN TRAVESIAS

Más detalles

Análisis dinámico tridimensional del sistema catenaria pantógrafo en líneas ferroviarias de Alta Velocidad (350 km/h)

Análisis dinámico tridimensional del sistema catenaria pantógrafo en líneas ferroviarias de Alta Velocidad (350 km/h) Análss dnámo trdmensonal del sstema atenara pantógrafo en líneas ferrovaras de Alta Velodad (35 km/h) Garía de Jalón, Javer. España jgjalon@ets.upm.es Jorreto Maros, Federo. España tef.fjorreto@ets.upm.es

Más detalles