Adaboost con aplicación a detección de caras mediante el algoritmo de Viola-Jones. Trabajo final - Introducción al reconocimiento de patrones

Documentos relacionados
CRÉDITO AGRICOLA. Consideraciones del producto:

TÉCNICAS METAHEURÍSTICAS. ALGORITMOS BASADOS EN NUBES DE PARTÍCULAS

2. Métodos Numéricos Aplicados a Ecuaciones Diferenciales

CRÉDITO PESCA. Consideraciones del producto:

EL METODO PERT (PROGRAM EVALUATION AND REVIEW TECHNIQUE)

Estadística de Precios de Vivienda

Nota de Clase 5 Introducción a modelos de Data Panel: Generalidades

Análisis de supervivencia. Albert Sorribas Grup de Bioestadística I Biomatemàtica Departament de Ciències Mèdiques Bàsiques Universitat de Lleida

Caracterís cas de la Metodología para calcular Rentabilidad Ajustada por Riesgo

9. CIRCUITOS DE SEGUNDO ORDEN LC Y RLC

Tema 5. Análisis Transitorio de Circuitos de Primer y Segundo Orden

Movimiento Rectilíneo Uniformemente Acelerado (MRUA)

FASCÍCULO: MATRICES Y DETERMINANTES

+12V +12V +12V 2K 15V. Problema 2: Determinar el punto de funcionamiento del transistor MOSFET del siguiente circuito: I(mA) D

Introducción a la Teoría de Inventarios

1. MODELOS DE SERIES TEMPORALES UNIECUACIONALES

4o. Encuentro. Matemáticas en todo y para todos. Uso de las distribuciones de probabilidad en la simulación de sistemas productivos

El signo negativo indica que la fem inducida es una E que se opone al cambio de la corriente.

I EJERCICIOS RESUELTOS II EXÁMENES DE ECONOMETRÍA III EXÁMENES DE ECONOMETRÍA EMPRESARIAL IV EXÁMENES DE PRINCIPIOS DE ECONOMETRÍA

INTERPOLACIÓN CURVA DE TASAS DE INTERÉS

TEMA 7 MODELO IS-LM EN ECONOMÍAS ABIERTAS

Santiago, CIRCULAR N. Para todas las entidades aseguradoras y reaseguradoras del segundo grupo

ESTIMACIÓN DE LAS ELASTICIDADES DE LA DEMANDA DE GASOLINA EN EL ECUADOR: UN ANÁLISIS EMPÍRICO

Recuperación de la Información

Determinación Experimental de la Distribución de Tiempos de Residencia en un Estanque Agitado con Pulpa

Ejercicios resueltos y exámenes

Cálculo y Estadística

Curso 2006/07. Tema 9: Modelos con retardos distribuidos (I) 9.1. Análisis de los efectos dinámicos en un modelo con retardos distribuidos

Función Financiera 12/03/2012

NORMAS PARA LA CONSTITUCIÓN DE PREVISIONES PARA RIESGOS CREDITICIOS

Nélida Diaz, Francisco Jiménez y Mauricio López División de Tiempo y Frecuencia. Resumen

CICLO BASICO DE INGENIERIA. Aplicar los conceptos fundamentales relacionados con el algebra matricial y calculo de determinantes.

MEDICIÓN DE LA ACTIVIDAD MINERA EN LA REGIÓN DE ARICA Y PARINACOTA

En España operaron empresas en Ese año se crearon y desaparecieron

5. Los sistemas de pensiones y el ahorro nacional

Estadística de Precios de Suelo

1. CONCEPTOS FUNDAMENTALES Magnitudes eléctricas y unidades 1.2. Componentes, dispositivos y circuitos 1.3. Señales 1.4. Leyes de Kirchhoff

Mecanismos de palanca. Apuntes.

LA INNOVACION EN LA LITERATURA RECIENTE DEL CRECIMIENTO ENDOGENO

ANALISIS DE INDICADORES DE COMERCIO EXTERIOR Y POLÍTICA COMERCIAL

EJERCICIOS: Análisis de circuitos en el dominio del tiempo

MADRID / SEPTIEMBRE99. LOGSE / FÍSICA / ÓPTICA/OPCIÓN A/ CUESTIÓN 3

Algoritmos para la determinación de soluciones en problemas de programación por metas fraccionales. XVII Jornadas ASEPUMA V Encuentro Internacional

METODOLOGÍA ENERGÍA ELÉCTRICA

Consideraciones generales sobre dinámica estructural

Determinantes de los spreads de tasas de los bonos. corporativos: revisión de la literatura

METODOLOGÍA PARA EL CÁLCULO DEL ÍNDICE COLCAP

METODOLOGÍA ENERGÍA ELECTRICA

Tema 2 Circuitos Dinámicos de Primer Orden

Dinero, precios, tasa de interés y actividad económica: un modelo del caso colombiano (1984:I 2003:IV)

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Medida de los radios de curvatura de un espejo cóncavo y otro convexo. Medida de la focal de una lente convergente y otra divergente.

7. CAPACITANCIA E INDUCTANCIA

INDICE DE COSTES DE LA CONSTRUCCIÓN

EFECTOS EN BIENESTAR DE LA REPRESIÓN FINANCIERA * Andrés Arias UCLA. Alberto Carrasquilla Universidad de los Andes

PREDICCIÓN DE VOLATILIDAD CON LOS ÍNDICES DE VOLATILIDAD VIX Y VDAX

Métodos específicos de generación de diversas distribuciones discretas

David Ceballos Hornero Departament de Matemàtica Econòmica, Financera i Actuarial. Universitat de Barcelona ceballos@eco.ub.es

Héctor Maletta. Análisis de panel con variables categóricas

Optimización del balance de carga en circuitos de distribución primaria

Tema 4. Condensadores y Bobinas

MODELO DE UN SISTEMA MRP CERRADO INTEGRANDO INCERTIDUMBRE EN LOS TIEMPOS DE ENTREGA, DISPONIBILIDAD DE LA CAPACIDAD DE FABRICACIÓN E INVENTARIOS

CIRCUITOS CON DIODOS.

SEGURO DE VIDA INDIVIDUAL CON PLAN DE AHORRO PREVISIONAL VOLUNTARIO. Incorporada al Depósito de Pólizas bajo el código POL

Circuitos Rectificadores 1/8

CONSIDERACIONES RESPECTO AL INDICADOR DÉFICIT FISCAL/PIB Juan Carlos Requena I N T R O D U C C I O N

ANÁLISIS DE LOS CAMBIOS EN LA PARTICIPACIÓN LABORAL FEMENINA EN CHILE. Evelyn Benvin y Marcela Perticará ƒ. Resumen

ESTRUCTURA DE LAS SIMILARIDADES

TECNOLOGÍA ELECTRÓNICA TEMA 8 (AMPLIFICADOR OPERACIONAL) EJEMPLOS RESUELTOS

Ser keynesiano en el corto plazo y clásico en el largo plazo*

Convertidores Digital-Analógico y Analógico-Digital

APUNTES CLASES DE PRÁCTICAS ECONOMIA ESPAÑOLA (Y MUNDIAL) CURSO 2010/2011, 2º. CUATRIMESTRE DEPARTAMENTO DE ECONOMÍA UNIVERSIDAD CARLOS III DE MADRID

Determinación del tiempo de deshumidificación en un almacén soterrado en las condiciones climáticas y geohidrológicas de Cuba.

LA MODELIZACIÓN DE PROCESOS

Estimación de una frontera de eficiencia técnica en el mercado de seguros uruguayo

DOCUMENTO DE TRABAJO.

Análisis de la competencia en un mercado mayorista de electricidad: el caso de España

Esa variación puede darse con la magnitud de la velocidad, su dirección y/o su sentido.

SISTEMAS DE ECUACIONES SIMULTANEAS

Manual Metodológico Índice de Costos del Transporte Base 2009 = 100

Macroeconomic Effects of Fiscal Shocks in the European Union: A GVAR Model

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA

ÍNDICES ENCADENADOS DE VOLUMEN: UNA GUÍA PRÁCTICA 8

Distorsiones creadas por la regulación colombiana: El Asset Swap Spread como proxy del Credit Default Swap en el mercado local.

El Método de Monte Carlo para la Solución de la Ecuación de Transporte

Análisis de inversiones y proyectos de inversión

Amplificador Operacional 1/14

En un mercado hay dos consumidores con las siguientes funciones de utilidad:

Ciencia en su PC ISSN: Centro de Información y Gestión Tecnológica de Santiago de Cuba. Cuba

Precios y costes laborales

Medidas de centralización

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

Manual Metodológico del Índice de Remuneraciones (IR) Índice de Costo de Mano de Obra (ICMO) Base anual 2009 = 100

Cinemática del Brazo articulado PUMA

Séptimas Jornadas de Economía Monetaria e Internacional La Plata, 9 y 10 de mayo de 2002

SIGLAS Y NOTACIÓN EMPLEADA

Sostenibilidad de la Política Fiscal: Una Simulación de la Restricción Presupuestaria *

En España operaron empresas en 2014, un 0,4% más que el año anterior. En 2014 se crearon empresas y desaparecieron 277.

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

Transcripción:

Adaboos con aplcacón a deeccón de caras medane el algormo de Vola-Jones rabajo fnal - Inroduccón al reconocmeno de parones ésor Paz Febrero de 2009

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.2 / 44 ÍDICE IRODUCCIÓ... 3 2 Pare : Fundamenos de Adaboos... 4 2. Generaldades sobre boosng... 4 2.2 Boosng y Adaboos... 4 2.2. Inroduccón... 4 2.2.2 Formalzacón del problema... 5 2.2.3 Formalzacón de Boosng... 5 2.3 El Algormo Hedge(β)... 6 2.3. Análss de Hedge(β)... 8 2.4 Marco de rabajo eórco para boosng.... 2.5 Adaboos para 2 clases... 2 2.5. Comparacón con Hedge(β)... 3 2.5.2 Análss de Adaboos para dos clases... 4 3 Pare 2: El deecor de caras de Vola-Jones... 7 3. Inroduccón... 7 3.2 Bases del deecor... 8 3.2. Las caraceríscas... 8 3.2.2 La magen negral... 20 3.2.3 Seleccón de caraceríscas... 2 3.2.4 Resulados de la seleccón y aprendzaje:... 23 3.2.5 Arquecura en cascada... 25 3.3 Enrenameno de la cascada de clasfcadores... 26 3.4 Un smple expermeno... 28 3.5 Resulados... 29 3.5. Daos de enrenameno... 29 3.5.2 Esrucura del deecor... 29 3.6 Proceso de la magen, exploracón y deeccón... 3 3.7 es del ssema... 32 4 Pare 3: Pruebas realzadas... 33 4. Parámeros del clasfcador y caraceríscas de las mágenes de prueba... 33 4.2 Presenacón de resulados... 34 4.3 Conclusones sobre la mplemenacón probada... 43 ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

IRODUCCIÓ El presene rabajo ene por objevo el esudo del algormo Adaboos y su aplcacón en el deecor de caras de Vola-Jones. El documeno se puede dvdr en res pares, la prmera aborda el paper A Decson-heorec Generalzaon of On-Lne Learnng and an Applcaon o Boosng de Freund y Sachapre. La dea denro de esa prmera pare es enender el algormo Adaboos dada su aplcacón en el deecor de Vola-Jones. Para poder enenderlo es necesaro hacer referenca al algormo Hedge(β). Uno de los apores más sgnfcavos del paper, además de los algormos en s, es el análss que los auores hacen de los msmos, donde esablecen un marco eórco, enconrando límes que acoan el error máxmo y mosrando la velocdad de convergenca de cada uno. Por lo ano en esa prmera se presenan ambén las demosracones prncpales, de manera que quede claro el marco eórco y los resulados a los que se llega, más que meramene descrbr los algormos. Solo se llegó hasa el planeo de Adaboos para el caso de dos clases, que es lo necesaro para enender la ulzacón que Vola-Jones hacen del msmo. En el paper se descrben además dos exensones para mulclase y aplcacones a problemas de regresón que son realmene complejas y no son abordadas en ese documeno. La segunda pare recorre el paper Robus real-me Objec Deecon de Vola-jones. Ese paper esa muy ben presenado por lo que es dfícl escapar a manener la esrucura orgnal del msmo. Báscamene se presenan los prncpos sobre los que se basa el deecor. En parcular se desacan las caraceríscas ulzadas, la seleccón de las msmas, el méodo de enrenameno y la arquecura del deecor. Es de desacar que el enfoque de los auores esá pueso más en la velocdad alcanzada por su deecor, la cual va a permr un nuevo mundo de aplcacones (de empo real), que en los índces de deeccón y error, donde ambén alcanza una performance excelene. La ercera pare esa dedcada a pruebas con un deecor smlar al de Vola-Jones, a parr del códgo Malab y C++ de Sreekar Krsnha, donde se mplemena la nerface para el OpenCV's face deecor creado por Raner Lenhar. Se complaron 5 juegos de parámeros dsnos y se aplcó cada uno de esos algormos complados a 20 foos selecconadas. Se mdó el índce de deeccón, el índce de falsos posvos y el empo empleado para cada una de las confguracones. Se presenan los resulados, el análss de algunos falsos posvos y las conclusones sobre esa mplemenacón.

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.4 / 44 2 PARE : FUDAMEOS DE ADABOOS 2. Generaldades sobre boosng El boosng esa nsprado en el algormo de aprendzaje en línea Hedge(β) propueso por Freund y Sachapre. La dea de boosng es generar un clasfcador muy precso a parr de clasfcadores débles. Boosng va a r agregando clasfcadores smples uno a uno y medane una seleccón de las muesras de enrenameno de cada uno de ellos y la consruccón de una combnacón de ellos afecada por pesos en los clasfcadores así enrenados consegurá un clasfcador an precso como queramos. 2.2 Boosng y Adaboos Adaboos por adapave boosng, es un nuevo algormo de boosng presenado por Freund y Sachapre en el paper A Decson-heorec Generalzaon of On-Lne Learnng and an Applcaon o Boosng 2.2. Inroduccón Freund y Sachapre, presenan a parr de un problema ameno el algormo Hedge(β), esudan su desempeño y obenen neresanes límes para el error. Luego presenan el adaboos y encuenran cera forma de dualdad enre ambos algormos que permen enconrar límes para el adaboos a parr de lo que se dedujo para el Hedge(β). El problema presenado por Freund y Sachapre es el clásco problema de ganar dnero aposando en las carreras de caballos. Para consegur eso, un aposador cansado de perder y vendo que sus amgos ganaban, decde recurrr a sus amgos aposadores, pdéndoles que apuesen en su nombre. Decde jugar en cada ocasón una suma consane de dnero. Al prncpo le asgna a cada uno de sus amgos una suma gual de dnero. S el pudera saber de anemano a cual de odos ellos le va a r mejor sn duda le daría a ese para que le maneje odo su dnero. Dado que no es clarvdene decde r reasgnando los monos en cada jugada de manera de obener el mejor resulado posble, de manera que en oda la emporada su resulado se parezca lo mas posble a su amgo con mejor suere. En el paper, Freund y Sachapre descrben un algormo smple para dar solucón a ese problema de asgnacón dnámca y muesran como ése puede ser aplcado a una gran varedad de problemas. La más desacable de esas es quzás el surgmeno del Adaboos. Ese algormo de boosng converrá a un conjuno de clasfcadores débles cuya performance sea apenas por encma de la eleccón al azar, en un clasfcador fuere arbraramene precso. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.5 / 44 2.2.2 Formalzacón del problema Llamemos A al algormo del aposador que podrá elegr enre esraegas posbles, numeraremos esas esraegas,..,. En cada paso =, 2,..., el aposador decde la dsrbucón P sobre las esraegas. Enonces 0 P es el mono asgnado a la esraega y = P =. A su vez, cada esraega sufre alguna pérdda l que esá deermnada por dgamos el enorno adverso. Por lo ano la pérdda sufrda por A es P l = = P l. A esa funcón de pérdda que la podemos nerprear como la pérdda promedo de las esraegas respeco a la eleccón de A, se le llama pérdda de la mezcla. En odo el paper se supone que la perdda l esa acoada enre 0 y. La mea de A, es mnmzar su pérdda acumulada relavo a la pérdda de la mejor esraega posble, eso es mnmzar la pérdda nea: L A mn L donde L A = = P l y L = l =. L A es enonces la pérdda acumulada por el algormo A en las prmeras jugadas. 2.2.3 Formalzacón de Boosng Supongamos que el aposador esa cansado de consular a los experos para decdr las apuesa en cada carrera y decde, crear un algormo de compuacón que predga el ganador de cada carrera, accedendo a la nformacón usual con la que se cuena anes de cada una (carreras ganadas por cada caballo, mejores empos de cada uno, como van las apuesas, ec.). La dea es que el aposador colecconé a ravés del conocmeno de los experos una buena candad de reglas del dedo o reglas gruesas, como por ejemplo: aposar al caballo que ganó recenemene más carreras. Aquí el aposador se enfrena a dos problemas, el prmero como presenarle a los experos un conjuno de carreras que le perma exraer las más provechosas reglas del dedo y segundo como combnarlas en una sola regla que le perma sacar el mayor provecho posble. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.6 / 44 Como ya vmos, boosng refere a producr predccones muy exacas a parr de combnar reglas débles. Formalmene, el booser es provso con un conjuno de enrenameno equeado ( x y ),..., (, ), x n y n donde y es la equea asocada a x. En el ejemplo de las carreras de caballos en la carrera, x podrían ser los daos observables anes de la carrera menras que y podría ser el número del ganador. En cada ronda =, 2,..., el booser dea una dsrbucón D sobre el conjuno de ejemplos y requere (de no mpora donde) una hpóess débl respeco de la dsrbucón según la dsrbucón D. D, eso es que h con error menor que ε h x y ε es gual a la probabldad de que ( ) Vemos que la dsrbucón D especfca la mporanca de cada ejemplo para la acual ronda. Luego de rondas, el booser debe combnar esas hpóess débles en un sola regla de predccón. A dferenca de anerores algormos, Hedge(β) no necesa conocmeno prevo de cuán exacas sean las hpóess débles. En vez de eso, el se adapa a esas precsones y genera una hpóess por mayoría ponderada donde el peso de cada hpóess se corresponde con su exacud. Como se probará mas adelane para problemas bnaros, el error de la hpóess fnal (respeco al conjuno de ejemplos dado) esa acoado por exp(-2 = 2 γ ) donde ε =. 5 γ 0 es el error en la ronda. Enonces, s podemos enconrar esas hpóess, apenas mejor que elegr al azar en forma conssene, ese líme muesra que el error de la hpóess fnal cae exponencalmene rápdo. Queda claro que la precsón de la hpóess fnal mejora, cuando la predccón de cualquera de las hpóess débles mejora. Eso es conraro a los algormos prevos donde la precsón de la hpóess fnal solo dependía de la precsón de la hpóess más débl. A su vez, s odas las hpóess débles enen la msma precsón, la performance de ese nuevo algormo queda muy cerca de la del mejor algormo de boosng conocdo. 2.3 El Algormo Hedge(β) El pseudo códgo para Hedge(β) se muesra en la fgura. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.7 / 44 Fgura.- Pseudo códgo de Hedge(β) para asgnacón on-lne. El algormo manene un vecor de pesos cuyo valor para el empo noamos de la sguene manera W w,..., = w, sempre los pesos son no negavos. Además para = el vecor debe sumar uno, o sea = w =. S supéramos a pror cual es la mejor esraega, le daríamos a esa mas peso, como es de esperar s no enemos conocmeno a pror, le daremos a cada esraega el msmo peso o sea w / =, noemos que los pesos de las sguenes rondas no enen porque sumar uno. El algormo asgna enre las esraegas ulzando el vecor acual de pesos luego de normalzarlo, o sea, en el empo el algormo elje el vecor de dsrbucón P = W = w. Luego que el vecor de pérddas l ha sdo recbdo, el vecor de pesos ulzando la sguene regla: W es acualzado w + = w β l En forma mas general, se puede mosrar que el análss es aplcable con una pequeña modfcacón a la sguene regla de acualzacón: ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.8 / 44 w + = w U β ( l ) Donde U : [ 0,] [ 0,] es cualquer funcón paramerzada por [ 0,] condcón: β β que sasfaga la r β U β ( r ) ( β )r Para odo r [ 0,] 2.3. Análss de Hedge(β) La dea es enconrar los límes superor e nferor para la expresón = mplcan un líme superor para la pérdda oal del algormo. w +, que junos Lema Líme superor, se pude demosrar que para cualquer secuenca del vecor de pérddas l,...,l, ln w = + ( β ) L Hedge ( β ) Para la demosracón se ulza que por concavdad r α ( α) r, para 0 α y [ 0,] r. = w + = = l w β ) = w ( ( β ) l = = w ( ( β ) P l ) la úlma gualdad es debda a la defncón del vecor P. Luego aplcamos repedamene para =,, y enendo en cuena que = w = (porque así se había mpueso) nos queda que: ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.9 / 44 + w ( ( β ) P l ) exp( ( β ) = = = P l ) Eso es dado que x + x e para odo x, y recordando que L = = P l enonces: Con lo que queda demosrado el lema. + ln( w ) = L Hedge( β ) Ecuacón 5 β eorema2 Se puede demosrar que para cualquer secuenca del vecor de pérddas cualquer {,..., } se ene que l,...,l, y para ln( w ) L β ln β L Hedge( β ) Ecuacón 7 y más genércamene que para cualquer conjuno no vacío S {,.., } ln( w ) (ln β )max S S L Hedge( β ) Ecuacón 8 β L Vemos que las 2 expresones son guales s S= { }. La segunda se demuesra en forma senclla dado que: = w + S w + = S L w β S β max L S w ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.0 / 44 Ahora, junando con la ecuacón 5 nos queda prona la demosracón. El líme enconrado por la ecuacón 7 esablece que la performance de Hedge(β) no es mucho peor que la de la mejor esraega para la secuenca dada. La pérdda depende enonces de los pesos ncales y de la eleccón de β. S no enemos nformacón a pror, y omamos odos los pesos ncales guales o sea w / = enonces el líme se rasforma en: L mn L ln(/ β ) + ln β Hedge ( β ) Ecuacón 9 Al depender solo de ln, vemos que el líme es bueno nclusve s es un número grande de esraegas. El líme de la ecuacón 8, que es una generalzacón del líme enconrado en la ecuacón 7, es especalmene aplcable cuando el numero de esraegas es nfno, enonces la sumaoras se pueden rasformar en una negral y el máxmo en supremo. Ese líme se rasforma en: L Hedge ( β ) c mn L + Donde = ln( / ) /( ) a ln c β β y = /( β ) a. Ulzando los resulados de Vovk (referenca ), se puede demosrar que los valores de las consanes a y c alcanzados por el algormo son ópmos. Eleccón de β S ben lo esudado es para un β cualquera, sempre vamos a querer elegr β de manera de maxmzar el conocmeno prevo que engamos acerca del problema específco. Lema 4 Supongamos que ~ 0 L L y que 0 R R ~ ~, omemos = g( L ~ / R) Lln β + R ~ g ( z) = /( + 2 / z ), enonces L + 2LR + R β β donde Ese lema puede ser aplcado a cualquera de los límes enconrados dado que son de la msma forma. Aplcado al líme enconrado en la ecuacón 9, nos queda: ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág. / 44 L L L ~ ( ) mn + 2 ln + ln Hedge β, para β = g( L / ln ) ~ En general se conoce el número de rondas, y lo podemos ulzar como líme superor de la pérdda acumulada para cada esraega L, o sea ~ L = Dvdendo ambos lados enre, obenemos un líme explíco de la asa del promedo de pérdda por ronda del algormo, que se aproxma a la pérdda promedo de la mejor esraega.. L Hedge( β ) mn L + 2L ~ ln ln + Como ~ L, en el peor de los casos la asa de convergenca es del orden de ) / (ln, pero s L ~ es del orden de cerdo, enonces la convergenca será mucho mas rápda, del orden de (ln )/. Para el caso general no se puede mejorar el ermno de consane, lo que da un líme nferor al problema. ~ 2L ln por mas de un facor 2.4 Marco de rabajo eórco para boosng. Sea X el domno, llamaremos concepo a una funcón booleana c : X { 0,} C una clase, será una coleccón de concepos. Se ene acceso a ejemplos equeados de la forma ( c( x) ) cera dsrbucón D fja y no conocda en el domno X. x,, donde x es omado con una La dea es que el algormo de aprendzaje logre, luego de un cero empo generar una hpóess h : X [ 0,]. El valor h(x) puede ser nerpreado como una predccón randómca de la equea de x, que valdrá con probabldad h(x) y 0 con probabldad -h(x). El error de h es el valor esperado de ( h( x) c( x) ), donde x es elegdo según la E x D dsrbucón D. Un weak PAC learnng algorhm, al cual para smplfcar la noacón llamaremos clasfcador débl es aquel que dados ε, δ > 0 y un ejemplo al azar nos da con probabldad -δ una hpóess con error ε / 2 γ con > 0 γ. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.2 / 44 Lo que hace boosng es omar esos clasfcadores débles, llamarlos múlples veces cada vez con dferene dsrbucón sobre X, y fnalmene generar una únca hpóess con la combnacón de las hpóess así generadas. La dea nuva es que se varía la dsrbucón de manera que se ncremene la probabldad de los ejemplos más dfícles, y así oblgar al clasfcador débl a generar nuevas hpóess que engan menor error en esa pare. 2.5 Adaboos para 2 clases El clasfcador débl recbrá ejemplos del po x, y ) elegdo sguendo una dsrbucón P, fja ( pero desconocda. A su vez, en esa versón para dos clases, el conjuno Y solo ene dos posbles equeas = { 0,} Y. Asummos que una secuenca de ejemplos de enrenameno, muesras equeadas, ( y x, ), y ) ( x son elegdas de XxY sguendo la dsrbucón P. Se ulzará boosng para enconrar la hpóess h f que es conssene con la mayoría de los ejemplos, f ( x ) y h = para la mayoría de El algormo Adaboos se muesra en la fgura 2, la mea del algormo es enconrar la hpóess fnal con el menor error relavo, dada la dsrbucón D sobre los ejemplos de enrenameno. A dferenca de la dsrbucón P que es sobre XxY y es dada por la nauraleza, la dsrbucón D es solo sobre las nsancas de los ejemplos de enrenameno, y es conrolada por el clasfcador. A fala de conocmeno prevo, la dsrbucón D será generalmene la dsrbucón unforme, con D()=/. El algormo manene un conjuno de pesos w sobre el conjuno de enrenameno. En cada eracón la dsrbucón P es calculada para normalzar esos pesos. Con esa dsrbucón, se almena al clasfcador débl, que genera una hpóess h que se espera enga poco error sobre esa dsrbucón. Con esa nueva hpóess h, el algormo genera el sguene vecor de pesos + w y el proceso se repe. Luego de eracones, se obene la hpóess fnal h f. Esa salda h f combna las saldas de los clasfcadores débles ulzando voo pesado por mayoría. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.3 / 44 Fgura 2. - algormo Adaboos. El parámero β es elegdo en funcón del errorε y es ulzado para acualzar el vecor de pesos. Es neresane desacar que, el adaboos, ulza la msma regla de combnacón que el mejor algormo conocdo en la prácca y que anes carecía de jusfcacón eórca. 2.5. Comparacón con Hedge(β) Comparando los dos algormos vemos que hay una gran smlud enre ellos, se evdenca una suere de dualdad enre el algormo de asgnacón en línea y el problema del boosng. O sea se puede mapear el problema del boosng en el problema de la asgnacón en línea. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.4 / 44 Podría pensarse nuvamene las esraegas como las hpóess débles, y las rondas como los ejemplos; sn embargo los auores proponen el mapeo nverso, o sea las esraegas con los ejemplos y las rondas se asocan a los clasfcadores débles. Ora dualdad aparece en la defncón del error, dado que para el Hedge(β), la perdda l será pequeña s la -esma esraega se presena como muy acerada en la ronda, menras que para Adaboos la perdda l = h ( x ) y que aparece como pare de la acualzacón de pesos es pequeña s la hpóess sugerda es una mala predccón. La explcacón es que menras para Hedge(β) el peso de una esraega se ncremena en la medda que esa es exosa, para Adaboos el peso asocado a un ejemplo se aumena en la medda de que ese sea mas dfícl de clasfcar. La dferenca écnca más grande enre ambos algormos es que en Adaboos el parámero β ya no es consane sno que vara en cada eracón dependendo del error ε. 2.5.2 Análss de Adaboos para dos clases Es facble analzar el Adaboos ulzando un β fjo y algormo Hedge(β) con lo cual se puede obener un prmer lme para el error (del orden de 2 γ / 2 e ), sn embargo, con el uso mas nelgene del β, se llega con Adaboos a resulados muy superores referdos al líme del error. Empezamos por demosrar el eorema 6: Suponemos que el clasfcador débl, cuando es llamado por Adaboos genera hpóess con error ε = Pr D ε...ε, enonces el error de la hpóess fnal generada por Adaboos [ h ( x ) y ] f, esa acoado por: ε 2 ε ( ε ) = La demosracón se hace medane la adapacón del lema y eorema 2 de la prmera pare: = w + = = w β h ( x y ) = w ( ( β )( h ( x ) y = ( = w )( ( ε )( β )) Combnando ese proceso para odo de a. Obenemos: ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.5 / 44 ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal = = + w )) )( ( ( β ε Ecuacón 6 Luego, la hpóess fnal f h como fue defnda en el algormo comee error en la nsanca s y solo s: 2 / ) ( ) ( = = y x h β β Ecuacón 7 El peso fnal para cualquer nsanca es: = + = y x h D w ) ( ) ( β Ecuacón 8 Luego, combnando la ecuacón 7 y 8 y acoando por la suma de los ejemplos donde la hpóess fnal es ncorreca: 2 / 2 / ) ( : ) ( :. ) ( = = = = + + y x h y x h f f D w w β ε β donde ε es el error en la hpóess fnal. Combnando esa ecuacón con la 6, enemos que: = ) )( ( β β ε ε Como odos lo érmnos son posvos podemos mnmzar, mnmzando cada érmno por separado, lo que calculamos el valor de β. Al dervar e gualar a cero nos

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.6 / 44 queda: β = ε /( ε ). Susuyendo ese valor de β en la ecuacón 20 queda complea la demosracón. Ese error ambén puede ser reescro como: ε 2 = 2 4γ exp KL(/ 2 / 2 γ ) exp 2γ = = = donde KL(aIIb)=a ln (a/b) +(-a) ln ((-a)/(-b)) es la dvergenca de Kullback-Lebler. En el caso de que el error de odas las hpóess se gual a / 2, enonces la expresón se smplfca a: γ ε 2 / 2 2 ( 4γ ) = exp(. KL(/ 2 / 2 γ )) exp( 2γ ) Fnalmene resalemos que: el eorema 6 mplca que en Adaboos el error fnal depende del error de cada una de las hpóess débles, menras en prevos algormos dependía solamene del error máxmo de la hpóess más débl, gnorando las venajas de aquellas que enían menor error. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.7 / 44 3 PARE 2: EL DEECOR DE CARAS DE VIOLA-JOES 3. Inroduccón En el paper Robus real-me Objec Deecon, Paul Vola y Mchel Jones presenan un marco de rabajo para la realzacón de un deecor de objeos vsuales que es capaz de realzar el procesameno de mágenes en forma exremadamene rápda, logrando no obsane una ala asa de deeccón. El rabajo de los msmos, esaba movado en gran pare por la area de realzar un deecor de caras efcene y rápdo. Queda claro que el objevo del deecor es posblar la deeccón de caras sobre vdeo en empo real, sn que para ello sea necesaro la ulzacón de compuadoras especalmene poenes. S ben el reso del arículo esa referdo a la deeccón de caras, se enende que el msmo razonameno es valdo para la deeccón de cualquer objeo. En ese rabajo los auores ermnan dseñando un ssema de deeccón de caras que alcanza nveles, ano de deeccón como de falsos posvos comparables con los mejores hasa ese momeno (referencas 2, 3, 4, 5 y 6), pero con una velocdad de procesameno muy superor. omando como base mágenes de 384 por 288 píxeles, el deecor es capaz de procesar 5 cuadros por segundo (o sea 5 mágenes de 384 por 288 píxeles por segundo), eso operando en un Inel Penum III de 700 Mhz convenconal. Ese deecor rabaja con mágenes en escalas de grses alcanzando buenos resulados, eso lo dferenca de oros que ulzan más nformacón como el color de los píxeles, ec. Esa nformacón podría ser agregada a ese deecor para mejorar más aun su performance. Para los auores hay res conrbucones prncpales que caracerzan a ese deecor, se puede ver que odas ellas esán enfocadas haca la efcenca compuaconal, de manera de aumenar la velocdad y la efcenca. La prmera es la ulzacón (para represenar la magen) de la magen negral; eso perme evaluar de forma muy rápda las caraceríscas ulzadas. o se rabaja enonces con la nensdad de la magen en s, sno que con una represenacón de la msma. La gran venaja es que se pueden calcular las caraceríscas ulzadas en cualquer lugar de la magen y en cualquer escala en el msmo lapso de empo (como veremos mas adelane) y en forma sumamene efcene desde el puno de vsa del gaso compuaconal. La segunda conrbucón es el méodo de consruccón del clasfcador, que se lleva a cabo selecconando un número reducdo de sgnfcavas caraceríscas, ulzando para ello una modfcacón del algormo Adaboos. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.8 / 44 Adaboos, es ulzado ano para selecconar las caraceríscas, como para enrenar los clasfcadores. La ercera conrbucón es el méodo para combnar una sucesón de clasfcadores cada vez más complejos en una esrucura de cascada. La dea es que los clasfcadores más sencllos, de bajo coso compuaconal descaren una gran candad de sub-venanas, dejando así concenrarse a los clasfcadores más complejos en las zonas donde es más promsoro que haya una cara. Ese procedmeno ncremena dráscamene la velocdad del deecor, eso es fácl de nur ya que práccamene odas las sub-venanas que se le presenan al deecor son negavas (o sea que no hay en esa sub-venana una cara). Un sencllo expermeno realzado por los auores, que comenaremos luego, da una dea de hasa que puno eso es así. La versón fnal del deecor de Vola-Jones presenada, esa compuesa por 32 clasfcadores puesos en cascada. En el proceso una magen que es reconocda como una cara necesa alrededor de 80.000 operacones, sn embargo gracas a esa arquecura de cascada el promedo de operacones para una sub-venana es muy bajo. Probado en un dfícl conjuno de daos de prueba que conenía 507 caras y 75 mllones de sub-venanas, la deeccón se llevó a cabo ulzando un promedo de 270 nsruccones de mcroprocesador por cada sub-venana. Ese resulado muesra que ese deecor es a efcenca smlar, 5 veces más rápdo que el consderado mejor hasa ese momeno (Referenca 3). Esa claro que un deecor de esas caraceríscas ene un rango mporane de aplcacones, pues su ala velocdad posbla, por un lado, deeccón en empo real (aplcable en codfcacón de vdeo, ele-conferencas, segumeno de objeos en movmeno, ec.) y por oro aplcacón en dversos dsposvos de baja poenca de cálculo, handhelds y ssemas embebdos (por ejemplo cámaras de foos). 3.2 Bases del deecor 3.2. Las caraceríscas Ese deecor de objeos clasfca las mágenes basado en la evaluacón de caraceríscas sencllas. Las prncpales razones para ulzar caraceríscas son que por un lado ésas pueden acuar como un codfcador del domno del conocmeno y por oro que los ssemas basados en caraceríscas son mucho más rápdos que los que operan drecamene con los píxeles. Las caraceríscas ulzadas por Vola-Jones son del eslo de las caraceríscas Harr bass (Waveles) y han sdo ulzadas por oros auores (referenca 7). Esas caraceríscas son las caraceríscas recángulo, exsen varas formas de dchas caraceríscas, pero odas ellas se basan en la suma y dferenca de los valores de los píxeles de áreas denro de recángulos. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.9 / 44 Vola-Jones ulzan res caraceríscas, la caracerísca Dos-recángulos con orenacón Horzonal y vercal, la res-recángulos y la cuaro-recángulos. Ver fgura 3. El valor de la caracerísca Dos-recángulos es la dferenca enre la suma del valor de los píxeles denro de cada regón, o sea se suma el valor de los píxeles denro de una regón (mad del recángulo donde se avalúa la caracerísca) y se le resa la suma del valor de los píxeles de la ora regón (la ora mad del recángulo). El valor de la caracerísca res-recángulos es dferenca enre la suma del valor de los píxeles denro de los recángulos exerores y el recángulo neror. El valor de la caracerísca Cuaro-recángulos es la dferenca enre la suma del valor de los píxeles denro de los recángulos en una dagonal del valor y la suma de los píxeles denro de los recángulos de la ora dagonal. Ver fgura 3. 2 h 2 v 3 4 Fgura 3.- Caraceríscas dos recángulos horzonal, dos recángulos vercal, res recángulos y cuaro recángulos. La resolucón base con la que rabaja el deecor es de 24 por 24 píxeles, el se oal de caraceríscas para ese amaño de magen es exremadamene alo 45396, mucho mayor que la candad de píxeles conendos en la magen de 24 por 24 píxeles, 576 (la msma candad de píxeles) serían las necesaras para descrbr compleamene la magen. En ese sendo es que se ulzará Adaboos para selecconar las más mporanes. En una poseror mejora de ese deecor, Lenhar añade dos pos nuevos, los pos 3 y 4 (ver fgura 4) y ulza los pos, 2, 3 y 4 descarando el po 5. A su vez nroduce nuevas orenacones 45º y 35 Fgura 4. -Dferenes pos y orenacones de caraceríscas po Haar, propuesas por Vola-Jones y Lenhar e al. Las zonas claras se compuan con sgno posvo y las oscuras con sgno negavo. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.20 / 44 3.2.2 La magen negral Las caraceríscas recángulo, pueden ser calculadas en forma exremadamene rápda ulzando una represenacón nermeda de la magen que los auores llaman Imagen negral, en vez de rabajar con la magen msma. La magen negral en un puno (x, y) de la magen base, es la suma de odos los píxeles conendos en el recángulo formado por el orgen (0,0) y puno(x, y). O sea: ( x, y) = ( x, y ) x x, y y donde (x,y) es la magen negral en el puno (x,y) e (x,y) es el valor de los píxeles de la magen orgnal, ver fgura 5. (x,y) Fgura 5.- Imagen negral del puno (x,y), corresponde a la suma de los píxeles del área coloreada. Ulzando la sguene recursvdad, se puede obener la magen negral en una sola pasada sobre la magen orgnal: S(x,y)= S(x, y-) + (x,y) con S(x, -)=0 y (-,y)=0 (x,y)= (x, y-) + S(x,y) Donde S (x,y) es la suma hasa y de la fla x. Ulzando la magen negral cualquer suma denro de un recángulo puede ser compuada en 4 referencas a la abla, ver fgura 6. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.2 / 44 A B 2 C D 3 4 Fgura 6.- Accedendo al resulado de la magen negral de los punos, 2, 3 y 4, podemos calcular en forma senclla y rápda la suma de los píxeles denro de cualquera de los recángulos. Por ejemplo, la suma de los píxeles denro del recángulo D puede ser calculada fáclmene como 4+-2-3. Donde 4 es la magen negral en el puno 4, ec. Enonces es claro, que la resa del área de dos recángulos cualesquera puede ser calculada en 8 referencas a la abla, pero en las caraceríscas de dos recángulos al ser esos adyacenes se puede calcular con solo ses referencas, solo ocho para el caso de res recángulos y nueve para la de cuaro recángulos. S ben por un lado las caraceríscas recángulo pueden resular a pror un poco prmvas o oscas, en comparacón con oras alernavas (Seerable flres, negrales dfusas, ec.), por un lado son capaces de dar una represenacón muy rca de la magen s son efcenemene enrenadas y por oro su exremadamene ala efcenca compuaconal compensan con creces su fala de flexbldad. Además, gracas a la magen negral cualquer caracerísca recángulo puede ser calculada en cualquer lugar de la magen y a cualquer escala ulzando para ello unas pocas operacones, eso hace que ese deecor sea exremadamene rápdo. 3.2.3 Seleccón de caraceríscas Como ya hemos vso para cada sub-venana de 24 por 24 píxeles enemos un oal de 45396 caraceríscas recángulo, un número muy superor a la candad de píxeles conendos en esa magen. S ben, como vmos, cada caracerísca se puede calcular en forma muy efcene, ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.22 / 44 calcular odas ellas para cada sub-venana es nmanejable, por lo que se debe hacer una seleccón de las msmas. Dada la experenca, esa vso que un pequeño numero de esas correcamene combnadas es sufcene para formar un clasfcador efcene. Lo neresane es enconrar cuales son esas caraceríscas. Por lo ano debe ulzarse algún méodo para realzar la seleccón de caraceríscas. Vola- Jones ulza una varane de Adaboos, ano para selecconar las caraceríscas como para enrenar el clasfcador. Como vmos en las seccones anerores Adaboos ulza una combnacón de algormos débles para ermnar formando un algormo de clasfcaron muy fuere. Lo neresane de ulzar Adaboos es que ese procedmeno de aprendzaje es muy fuere, y como ya hemos vso el error de enrenameno ende a cero en forma exponencal con el número de urnos. Adaboos puede ser nerpreado como un ambcoso proceso de seleccón de caraceríscas, dado que es un mecansmo agresvo para selecconar un pequeño conjuno de buenas funcones de clasfcacón. El ruco esa en asocar las funcones de clasfcacón (los llamados clasfcadores débles) con las caraceríscas recángulo. Adaboos se convere enonces en un efecvo procedmeno para seleccón un número reducdo de Buenas Caraceríscas. El procedmeno prácco para lograrlo es resrngr cada clasfcador débl al conjuno de funcones de clasfcacón donde, cada una dependa de solamene una caracerísca recángulo. Enonces, cada clasfcador débl será dseñado para selecconar la caracerísca recángulo que mejor separa los ejemplos negavos de los posvos. A su vez para cada funcón de clasfcacón el clasfcador débl deermna el umbral ópmo de clasfcacón que mnmza el número de ejemplos mal clasfcados. Enonces s h j (x) es el clasfcador débl que consse en la caracerísca f j, el umbral p j para manener el sgno de la necuacón: θ j y donde x es una sub-venana de 24 por 24 píxeles. En la prácca, nnguna caracerísca sola es capaz de realzar la area con bajo error, las prmeras resulanes del proceso de seleccón producen errores enre el 0 y el 30%, menras que las selecconadas más adelane y que por lo ano realzan una area mas complcada (debdo a la nauraleza del Adaboos) producen errores enre el 40 y 50%. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.23 / 44 Se muesra en la abla el proceso de seleccón y enrenameno. 3.2.4 Resulados de la seleccón y aprendzaje: Experencas realzadas por los auores demosraron que un clasfcador consrudo con 200 caraceríscas (recordemos que eníamos 45396 posbles) produce resulados razonables, alcanzando para un 95% de deeccón una asa de falsos posvos de en 4084. Ver fgura 7. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.24 / 44 Fgura 7.- Curva ROC para un clasfcador compueso por 200 caraceríscas recángulo En nuesro caso las caraceríscas recángulo que ncalmene seleccona el algormo Adaboos son muy sgnfcavas, y además les podemos dar una nerpreacón nuva senclla. Ver fgura 8. Fgura 8.- Prmera y segunda caracerísca selecconada por Adaboos. La prmera caracerísca selecconada podemos nerprearla fáclmene, dado que la zona correspondene a los ojos se presenará más oscura que la correspondene a la pare de la cara nmedaamene abajo, formada por los pómulos y narz. La segunda quzás más fácl aun, hace noar las dferenca enre la nensdad en la zona correspondene a cada ojo (zona mas ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.25 / 44 oscura) con de la zona ene ellos, correspondene a pare de la narz y generalmene más lumnada. 3.2.5 Arquecura en cascada Derás de la eleccón de la esrucura en cascada esa la necesdad de lograr un alísmo nvel de deeccón a la vez que una reduccón drásca de la necesdad de cálculo y por ende un bajo coso compuaconal. La dea fundamenal para lograrlo, es la habldad de los muy efcenes y sencllos clasfcadores enrenados con Adaboos de poder rechazar la mayoría de las sub-venanas, dejando pasar odos los casos posvos. Esos clasfcadores muy sencllos y de bajo coso compuaconal se ponen en las prmeras eapas de manera que en pocas operacones se pueda rechazar la mayoría de las venanas, dejando así los clasfcadores más complejos concenrarse en pocos casos. Es de desacar que muy pocas de las mles de venanas a analzar conene un objeo, por lo que la gran mayoría de las msmas deberán ser rechazadas. Cada una de las eapas de la cascada es enrenada ulzando Adaboos. El prmer clasfcador conene las dos caraceríscas que vmos en la fgura 8. El umbral ncal del clasfcador es calculado para ener el mínmo error de enrenameno, luego ese umbral es bajado de manera de obener nveles de deeccón mas alos, por supueso eso mplca nveles ambén mas alos de falsos posvos. Se procede enonces a ajusar el umbral de ese prmer clasfcador para obener 00% de deeccones con un índce de falsos posvos del 40%. El umbral ncal es 2 = α. Esa performance, s ben puede parecer no muy buena, es capaz de reducr a menos de la mad las venanas a explorar en unas pocas operacones, asegurando que odas las caras son deecadas. Eso es fácl de ver dado que una caracerísca recángulo es evaluada con máxmo 9 accesos a la abla, calcular el clasfcador débl para cada caracerísca es smplemene calcular un umbral y luego combnar los clasfcadores son solo mulplcacón y suma. Enonces con solo 60 operacones de mcroprocesador ya enemos una gran pare de las venanas descaradas. La esrucura de la arquecura en cascada se muesra en la fgura 9. Báscamene la esrucura del clasfcador adopa la forma de un árbol de decsón. S el prmer clasfcador da por buena una venana, esa pasa al segundo clasfcador que ambén ha sdo enrenado para producr una ala asa de deeccón, sno la venana es descarada. El segundo ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.26 / 44 clasfcador la evalúa, s la da por buena se la pasa al ercer clasfcador, sno la descara, y así sgue odo el proceso. Es claro que en una magen normal la gran mayoría de las venanas exploradas serán negavas. Por lo que en el proceso es deseable rechazar anas venanas como sea posble, lo anes posble, eso acelerara el proceso. Es claro ambén, que a medda que avanzamos en los clasfcadores, esos cada vez ene una area más dfícl ya que esos no ven las mágenes más ípcas sno las que ya pasaron por las oras eapas. Es usual que esos clasfcadores se enrenen con mágenes que ya pasaron por las eapas anerores o sea que los negavos serán en realdad falsos posvos de las oras eapas. Enrada de odas las Sub-Venanas V V 2 3 V Al sguene proceso F F F Sub-Venanas Rechazadas Fgura 9.- esrucura de clasfcadores en cascada 3.3 Enrenameno de la cascada de clasfcadores Para el dseño de la cascada es necesaro fjar las meas de deeccón y performance. Lo usual sería lograr nveles de deeccón enre el 85 y 95%, con asa de falso posvos muy bajas, del orden de 5 0 6 o 0. La dea es alcanzar esos regsros pero con sgnfcavamene menor esfuerzo compuaconal. Dado un clasfcador en cascada enrenado, la asa F de falsos posvos vene dada por la sguene expresón: ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.27 / 44 F = K = f Donde f es la asa de falsos posvos de la eapa y K es el número de eapas del clasfcador. Por oro lado la asa de deeccón D vene dada por la expresón: D = K = d Por ejemplo para una asa de deeccón de 90% y un deecor de 0 eapas, cada eapa debe alcanzar una asa de deeccón de 0.99, ya que 0.99 0 0. 9. S ben eso parece en prncpo un poco complcado de lograr, vemos que la area se smplfca por la poco exgene asa de falsos posvos F, ya que permrnos una asa de falsos posvos de 30%. 6 6 0 0.3 0, por lo que podemos El número esperado de caraceríscas a evaluar en un proceso de ese es = n K ( = 0 + n p j ) j< Donde K es el número de eapas o clasfcadores, p es la asa de deeccón del -ésmo clasfcador y n es la candad de caraceríscas de -ésmo clasfcador. Observacón mporane: Adaboos esa dseñado para mnmzar el error y no para alcanzar alas asas de deeccón a cosa de oleranes asas de falsos posvos. La manera de lograr eso es jugando con el umbral del percepron generado por Adaboos, umbrales más bajos darán como resulado asas de deeccón mas alas y asas de falsos posvos mas alas, umbrales mas alos darán asas de falsos posvos mas bajas pero peores asas de deencón. o queda claro s a pesar de ese juego con los umbrales las granas de Adaboos se sguen manenendo. El dseño y enrenameno del ssema mplca algunos compromsos, por un lado cuanas más caraceríscas enga un clasfcador, obendrá asas mas alas de deeccón así como mejores asas de falsos posvos, pero cuano mas caraceríscas se evalúen mas empo compuaconal ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.28 / 44 precsamos, por lo que se debe mnmzar, para un D y F fjados. El ópmo es compromso enre el número de eapas, los objevos a alcanzar y el número esperado de caraceríscas a evaluar, que a su vez eso depende de cómo se dseñe cada eapa. Lamenablemene enconrar ese ópmo es una area descomunalmene complcada. Una forma pracca de mplemenar eso es la sguene: el usuaro fja d y f, se enrena el clasfcador ulzando Adaboos, se van agregando caraceríscas hasa alcanzar la performance requerda, se esea el ssema con un conjuno de valdacón, s la asa de falsos posvos no es alcanzada, se agrega ora eapa. Los ejemplos de mágenes negavas (o sea que no conenen una cara) para el enrenameno se obene de recolecar odos los falsos posvos del clasfcador aneror. 3.4 Un smple expermeno Para explorar las vrudes de la esrucura en cascada se enrenaron dos clasfcadores, uno monolíco de 200 caraceríscas y oro con arquecura de cascada con 0 eapas de 20 caraceríscas cada una. La prmera eapa del clasfcador en cascada se enrenó ulzando 5000 caras y 0000 subvenanas no-caras elegdas aleaoramene de una base de mágenes no-caras. La segunda eapa se enrenó ulzando las msmas 5000 caras más 5000 falsos posvos del prmer clasfcador. Las sguenes eapas se enrenaron de la msma manera ulzando sempre como ejemplos de no-cara los falsos posvos recolecados de la eapa aneror. El clasfcador monolíco se enreno con la unón de odos los ejemplos con los que se enrenó el clasfcador en cascada. Fue una forma efcene de elegr los ejemplos de no-cara. S ben en érmnos de performance las dferencas fueron mínmas, en érmnos de velocdad, el clasfcador en cascada fue del orden de 0 veces más rápdo. En la fgura 0 se muesran las curvas ROC de cada clasfcador. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.29 / 44 Fgura 0.- Curvas ROC de clasfcador monolíco de 200 caraceríscas y clasfcador en cascada de 0 eapas de 20 caraceríscas. 3.5 Resulados Aquí se presena la esrucura fnal del deecor así como los daos de enrenameno y los resulados alcanzados. 3.5. Daos de enrenameno El conjuno de enrenameno para el deecor fnal fue consrudo con 496 mágenes de caras escaladas, cenradas y equeadas a mano, con una resolucón base de 24 x 24 píxeles. 3.5.2 Esrucura del deecor La esrucura fnal del clasfcador consa de 32 eapas en cascada y un oal de 4297 caraceríscas. La prmera eapa del clasfcador esá consruda con 2 caraceríscas y rechaza el 60% de las no-caras menras alcanza práccamene un 00% de deeccones. La segunda eapa esa consruda con 5 caraceríscas y rechaza el 80% de las no-caras menras alcanza un 00% de ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.30 / 44 deeccones. Luego sguen 3 eapas de 20 caraceríscas cada una, dos eapas de 50 caraceríscas cada una, 5 eapas de de 00 y 20 de 200 caraceríscas. Ver fgura : 3x20 2x50 5x00 20x00 Enrada de odas las Sub-Venanas 2 V 5 V Salda F F F F F F Sub-Venanas Rechazadas Fgura.- Esrucura fnal del deecor de Vola-Jones La candad de caraceríscas en cada eapa fue conseguda medane pruebas, ensayo y error, Luego se fueron agregando eapas hasa consegur la performance deseada. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.3 / 44 Fgura 2.- Ejemplo de mágenes ulzadas para el enrenameno El enrenameno de las prmeras eapas se hzo con las 496 caras más 0.000 sub-venanas no-caras de ambén 24x24 píxeles, ulzando Adaboos, ver fgura 2. Para las sguenes eapas se ulzaron dferenes muesras de no-caras y los falsos posvos recolecados de las eapas anerores. Es muy mporane resalar que para el ssema compleo rabajando en una AlphaSaon XP900 de 466 Mhz el empo de enrenameno fue del orden de semanas. 3.6 Proceso de la magen, exploracón y deeccón odas las sub-venanas ulzadas durane el enrenameno fueron normalzadas para mnmzar los efecos de la varacón de lumnacón (se normalza la varanza). La normalzacón durane la exploracón de una magen se pude hacer medane la pos mulplcacón de las caraceríscas que es más efcene que operar sobre los propos píxeles. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.32 / 44 La exploracón se hace parendo de una venana de 24X24 píxeles, luego se va escalando, lo que realmene se escala es el deecor y no la magen en s, eso es gracas a que las caraceríscas pueden ser calculadas en cualquer lugar de la magen y en cualquer escala con el msmo coso compuaconal. ambén se va hacendo una exploracón a ravés de las dsnas áreas de la magen, eso se logra hacendo un corrmeno de píxeles. Ese proceso de corrmeno se ve afecado por el escalameno, o sea s se empezó con un corrmeno de píxeles, cuando escale S el corrmeno en ese facor de escala será [S ] donde [] es la operacón de redondeo. La eleccón de S y de afeca sgnfcavamene ano la performance como la velocdad del deecor. Se han obendo buenos resulados para S=.25 y = o 2. 3.7 es del ssema El ssema fue esado ulzando la base de caras fronales del MI+CMU, que consa de 30 mágenes con 507 caras equeadas. Para = y una escala ncal = el número de subvenanas exploradas fue 75.08.800 para =.5 y una escala ncal de.25 el oal de subvenanas fue de 8.90.947. Las curvas ROC para esos es se muesran en la sguene fgura: ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.33 / 44 Fgura 3.- es del ssema para dsnos valores de escalado y desplazameno. 4 PARE 3: PRUEBAS REALIZADAS A modo de prueba se nsaló un programa de reconocmeno de caras fronales smlar al de Vola-Jones, a parr del códgo Malab de Sreekar Krsnha, donde se mplemena el OpenCV's face deecor creado por Raner Lenhar. S ben el programa ncal esa hecho en Malab se debe nsalar el Vsual Sudo.E 2003 para poder acceder al complador Mcrosof Vsual C/C++ versón 7., a su vez la versón de Malab debe ser poseror a la 7.0.0 R4. Eso es debdo a que el programa prncpal esa hecho en C++ para a su vez poder ulzar las bbloecas de OpenCV. A su vez el clasfcador enrenado aparece como dao en un archvo Xml. Observacón: al mrar el archvo Xml, que presena el clasfcador enrenado, vemos que en realdad no es el clasfcador de Vola-Jones, pues como vmos ese consa de 32 eapas y el que enconramos en el Xml consa de 20 eapas. Pero manene la msma flosofía que el clasfcador de Vola-Jones. El programa recbe como enradas la foo a la cual se le va efecuar la deeccón de caras y la dreccón donde se encenra el archvo.xml. que conene el clasfcador enrenado. La salda del programa es una marz xm. Donde es la candad de caras deecadas y M=4. Cada fla corresponde a una cara, y las cuaro columnas represenan la ubcacón x e y del vérce superor derecho, el ancho y el alo de la foo. Analzando el archvo C++ enconramos res parámeros con los que podemos jugar, el amaño mínmo de la magen, el facor de escala S y la superposcón de recángulos para consderar mul-deeccón. Los parámeros por defeco son S=., amaño mínmo de la magen 30 X 30 píxeles, mul-deeccón en 2. 4. Parámeros del clasfcador y caraceríscas de las mágenes de prueba Se eseo el clasfcador con 20 foos dgales formao jpg. Cada magen fue preprocesada para bajar su resolucón a 640 x 480 píxeles, de manera de hacer manejable el amaño de las msmas. Se omaron 3 valores del facor de escala, que en prncpo se presenó como el ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal

Adaboos con aplcacón a deeccón de caras medane algormo de Vola-Jones Pág.34 / 44 parámero mas sensble, S=.05, S=. y S=.25, a su vez se omó el amaño mínmo de magen en 0 x0 y 30 x30 píxeles. Se hzo una modfcacón en el programa para medr el empo nsumdo en cada una de las pruebas. Para poder correr esas confguracones se modfco el códgo C++ y se complo generando así cnco.mex. Luego se cargo cada uno de las foos y se corró el archvo Malab llamando en cada ocasón a cada uno de los cnco.mex. oacón Se ulzó la sguene noacón: s la foo se llamaba nombre.jpg, la foo procesada con S=.05 y amaño mínmo de magen de 0 x0 píxeles, la foo procesada se llamó nombre0500.jpg, s se procesaba con S=.25 y amaño mínmo de magen de 30 x30 píxeles, a la foo procesada se le llama npmbre253030.jpg. 4.2 Presenacón de resulados Los resulados enconrados varían mucho dependendo del po de foo, para foos donde las caras represenaban un amaño mporane denro del oal de la foo, odas las combnacones respondían razonablemene ben, endendo las escalas menores a presenar mas falsos posvos. Para foos donde las caras esán lejanas empeza a jugar un papel muy mporane el amaño mínmo ncal, cosa que es razonable, aquí la escala no jugó un papel an mporane. En cuano a la velocdad ese programa esa muy por debajo de lo esperado para el algormo Vola-Jones. Para comparar velocdades se probó con foos de amaño 320x240 (del orden del ulzado por Vola-Jones) con escala.25 y amaño mínmo de 30x 30 (la mas rápda de las combnacones probadas), el empo empleado es del orden de los 0.7 s que es 0 veces superor al anuncado en el paper (corrdo en un PIII Inel de 500Mhz con 256 MBes Ram). Eso puede deberse a que el programa no esa opmzado y que Malab no sea la mejor plaaforma para ello. Se analzaron los falsos posvos y se enconró que algunos eran realmene razonables, menras que no se enconró explcacón para oros. Para hacer ese esudo se pasaron las foos a escalas de grses que es como la oma el algormo y luego se jugó con el brllo y el conrase de cada una, nenando enconrar la cara fanasma. ésor Paz.- Inroduccón al reconocmeno de parones - rabajo Fnal