Clasificación de Música por Género utilizando Redes Neuronales Artificiales

Documentos relacionados
TEMA 4: CANALES DIGITALES EN BANDA BASE CON RUIDO

2. Métodos Numéricos Aplicados a Ecuaciones Diferenciales

En este capítulo se presenta a detalle el esquema de relajación Lagrangeana utilizado para

I EJERCICIOS RESUELTOS II EXÁMENES DE ECONOMETRÍA III EXÁMENES DE ECONOMETRÍA EMPRESARIAL IV EXÁMENES DE PRINCIPIOS DE ECONOMETRÍA

7) Considere los ejercicios 2.b) y 2.c) a) Encuentre un nuevo modelo en variable de estados considerando la transformación dada por:

INDICE DE COSTES DE LA CONSTRUCCIÓN

Ejercicios resueltos y exámenes

Movimiento Rectilíneo Uniformemente Acelerado (MRUA)

Circuitos Rectificadores 1/8

Estadística de Precios de Vivienda

EL METODO PERT (PROGRAM EVALUATION AND REVIEW TECHNIQUE)

MADRID / SEPTIEMBRE99. LOGSE / FÍSICA / ÓPTICA/OPCIÓN A/ CUESTIÓN 3

C Tópicos Avanzados: Redes Neuronales Artificiales. Redes Recurrentes. Dra. Ma. del Pilar Gómez Gil V:

Física General 1 Proyecto PMME - Curso 2008 Instituto de Física Facultad de Ingeniería UdelaR

Pattern Classification

Recuperación de la Información

+12V +12V +12V 2K 15V. Problema 2: Determinar el punto de funcionamiento del transistor MOSFET del siguiente circuito: I(mA) D

9. CIRCUITOS DE SEGUNDO ORDEN LC Y RLC

Santiago, CIRCULAR N. Para todas las entidades aseguradoras y reaseguradoras del segundo grupo

Circuitos Limitadores 1/8

Capítulo 3 Metodología.

ESTIMACIÓN DE LAS ELASTICIDADES DE LA DEMANDA DE GASOLINA EN EL ECUADOR: UN ANÁLISIS EMPÍRICO

Cálculo y Estadística

MUESTRAS CON ROTACIÓN DE PANELES

El signo negativo indica que la fem inducida es una E que se opone al cambio de la corriente.

Presentación. INEGI. Sistema de Indicadores Compuestos Coincidentes y Adelantado Metodología

Cálculo Estocástico Variación Cuadrática para Martingalas Continuas y Acotadas

Tema 5. Análisis Transitorio de Circuitos de Primer y Segundo Orden

Introducción a la Teoría de Inventarios

Adaboost con aplicación a detección de caras mediante el algoritmo de Viola-Jones. Trabajo final - Introducción al reconocimiento de patrones

CRÉDITO AGRICOLA. Consideraciones del producto:

Semana 12: Tema 9 Movimiento Rotacional

MOVIMIENTO RECTILÍNEO UNIFORMEMENTE ACELERADO

CRÉDITO PESCA. Consideraciones del producto:

CICLO BASICO DE INGENIERIA. Aplicar los conceptos fundamentales relacionados con el algebra matricial y calculo de determinantes.

Método de Runge-Kutta para Ecuaciones Diferenciales

Análisis de supervivencia. Albert Sorribas Grup de Bioestadística I Biomatemàtica Departament de Ciències Mèdiques Bàsiques Universitat de Lleida

4o. Encuentro. Matemáticas en todo y para todos. Uso de las distribuciones de probabilidad en la simulación de sistemas productivos

INDICADORES DEL SISTEMA EDUCATIVO COSTARRICENSE

Diplomatura de Ciencias Empresariales. Estadística Económica. Sara Mateo.

SIGLAS Y NOTACIÓN EMPLEADA

FASCÍCULO: MATRICES Y DETERMINANTES

Índice de precios de materiales de construcción (IPMC referencia 2006) Nota Metodológica

3. El cambio en el sistema de pensiones y su impacto sobre la cobertura

ALTERNATIVAS AL ESTIMADOR DE REGRESIÓN EN POBLACIONES FINITAS. APLICACIÓN A UN COLECTIVO DE EMPRESAS

Ondas y Rotaciones. Aplicaciones I. Jaime Feliciano Hernández Universidad Autónoma Metropolitana - Iztapalapa México, D. F. 15 de agosto de 2012

Cálculo y Estadística

UN MODELO NO LINEAL PARA LA PREDICCIÓN DE LA VARIACIÓN DEL ÍNDICE IPSA CONSIDERANDO VOLATILIDADES EN CLUSTERING

Consideraciones generales sobre dinámica estructural

Los esquemas de la reproduccio n de Marx

El efecto traspaso de la tasa de interés en el Perú: Un análisis a nivel de bancos ( )

(TÍTULO DEL PROYECTO) Estudio de sincronización cooperativa en redes de sensores

Curso 2006/07. Tema 9: Modelos con retardos distribuidos (I) 9.1. Análisis de los efectos dinámicos en un modelo con retardos distribuidos

Caracterís cas de la Metodología para calcular Rentabilidad Ajustada por Riesgo

INTRODUCCIÓN A LOS MODELOS OCULTOS DE MARKOV. Luis Miguel Bergasa Pascual

Cuestión 1 (2 puntos)

Ciencia en su PC ISSN: Centro de Información y Gestión Tecnológica de Santiago de Cuba. Cuba

TÉCNICAS METAHEURÍSTICAS. ALGORITMOS BASADOS EN NUBES DE PARTÍCULAS

Nélida Diaz, Francisco Jiménez y Mauricio López División de Tiempo y Frecuencia. Resumen

VERIFICACIÓN DE LOS SUPUESTOS DEL MODELO DE COX

Estadísticas de Cuentas Nacionales Trimestrales

1. Introducción, n, concepto y clasificación

Estadística Clase 6. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Medida de los radios de curvatura de un espejo cóncavo y otro convexo. Medida de la focal de una lente convergente y otra divergente.

Nota de Clase 5 Introducción a modelos de Data Panel: Generalidades

Hallar la media y varianza. Obtener la F.G.M y obtenerlas de nuevo.

EJERCICIOS: Análisis de circuitos en el dominio del tiempo

VISIÓN POR COMPUTADOR

INTERVALOS DE CONFIANZA BOOTSTRAP EN REGRESIÓN P-SPLINE CON ERRORES AUTOCORRELACIONADOS

UNIVERSIDAD NACIONAL DE SAN JUAN

En España operaron empresas en 2013, un 1,4% menos que el año anterior. En 2013 se crearon empresas y desaparecieron 318.

TRABAJO PRACTICO Nº1: NÚMEROS ÍNDICES

Lección 7: Demodulación y Detección Paso-Banda. Parte I

ÁREA 4 y 9: ECONOMÍA INDUSTRIAL, DE SERVICIOS Y DE LA INFORMACIÓN Y EL CONOCIMIENTO. Departamento de Economía Aplicada

DIFERENCIAS EN EL MERCADO DE TRABAJO ENTRE LAS PROVINCIAS ESPAÑOLAS RESUMEN

TIPOS DE TENDENCIAS Y SUS CONSEQUENCIAS. Tendencias estocásticas versus deterministas.

Control predictivo distribuido mediante redes de sensores: Aplicación al control distribuido de temperaturas en una habitación

Estadística de Precios de Suelo

Macroeconomía II. FCE-UBA Primer Examen Parcial Mayo 2015 INSTRUCCIONES. (Prof. D. Pierri)

Análisis de Varianza no paramétricos

Dinero, precios, tasa de interés y actividad económica: un modelo del caso colombiano (1984:I 2003:IV)

ANEXOS DEL INFORME. Recopilación de Información para la Construcción del Indicador INDICE DE PRECIOS AL CONSUMIDOR

1. MODELOS DE SERIES TEMPORALES UNIECUACIONALES

ESTRUCTURA DE LAS SIMILARIDADES

Estimación a partir de muestras intencionadas: fiabilidad del Índice de Producción Industrial en la Comunitat Valenciana( )

Análisis estadístico de incertidumbres aleatorias

CAPÍTULO IV BASES Y DESARROLLO DEL PROGRAMA COMPUTACIONAL. En este capítulo describiremos los modelos y herramientas que utilizaremos para la

Examen Final de Econometría Grado

Señales en los sistemas electrónicos. Parte 2. Equivalentes Thevenin y Norton. Impedancia de entrada y salida

Optimización del balance de carga en circuitos de distribución primaria

METODOLOGÍA PARA EL CÁLCULO DEL ÍNDICE COLCAP

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

Determinantes de los spreads de tasas de los bonos. corporativos: revisión de la literatura

CONTRIBUCIÓN A LA MEJORA DE RESOLUCIÓN DE LOS SISTEMAS DE OBTENCIÓN DE IMÁGENES POR ULTRASONIDOS

OPTIMIZACIÓN DEL CÁLCULO DE LA MATRIZ DE RIGIDEZ EN FORMA ANALÍTICA DE UN ELEMENTO FINITO ISOPARAMÉTRICO DE CUATRO NODOS EN ELASTICIDAD PLANA.

Ejercicios T9c- VARIABLE ALEATORIA, MODELOS DE PROBABILIDAD UNIVARIANTES C

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

METODOLOGÍA ENERGÍA ELÉCTRICA

Transcripción:

Clasfcacón de Músca por Género ulzando Redes Neuronales Arfcales Elkn García, Gullermo Pacheco y Germán Mancera 2 Unversdad de los Andes Carrera N 8A Bogoá, Colomba {elkn-ga, or-pach}@unandes.edu.co 2 4 Evans Hall Unversy of Delaware Newark, DE 97 USA gmancera@ece.udel.edu Resumen En ese proyeco se realza un esudo de la nformacón conenda en archvos dgales de músca con el fn de deermnar parámeros represenavos de un género muscal para ser usados como enradas a un ssema clasfcador mplemenado con Redes Neuronales Arfcales. La exraccón de parámeros se realza hacendo uso de análss en el domno del empo, de la frecuenca, y ulzando la Transformada Wavele. Se han mplemenado dos opologías dferenes de Red Neuronal: Perceprón Mulnvel y Red de Funcones de Base Radal (RBF), adconalmene se mplemena un clasfcador ulzando el algormo Adaboos sobre un clasfcador débl RBF. Los resulados que han sdo obendos son comparados en cuano porcenae de clasfcacón correca y amaño de la red. De la msma manera, se ha esudado la repercusón que ene la aplcacón de AdaBoos sobre ese clasfcador débl. INTRODUCCIÓN Bases de daos de músca en formao dgal cuyo amaño era dfícl magnar hace unos años se comparen hoy en día con gran facldad a ravés de las redes de compuadores, creando la necesdad de dsponer de méodos efcenes que perman la búsqueda y organzacón de dchas bases. En los úlmos años, y debdo al crecene fenómeno de dsrbucón de músca a ravés de Inerne, ha surgdo la necesdad de crear ssemas capaces de clasfcar músca de manera auomáca. Sn embargo, son muchos los esudos que se han vendo realzando con el fn de esablecer cuáles son aquellas caraceríscas que consuyen un eslo muscal, qué parámeros muscales son relevanes para hacer la clasfcacón y cuáles son las écncas de aprendzae de máquna más efecvas para procesar al nformacón [],[2],[3]. Los esudos que se han realzado al respeco son pocos. Seh Golub [2] realzó uno en la cual probó res pos dferenes de clasfcadores aplcados a dos géneros smlares. Paul Sco [3] elaboró un ssema clasfcador usando un perceprón mulnvel para 4 géneros basane dferenes. Numerosos nvesgadores han realzado rabaos relaconados con la denfcacón de caraceríscas relevanes a parr de la músca. Por eemplo, Fooe [4] empleó écncas especrales para dsngur enre voz y músca con un alo grado de exacud, menras que Solau [5] enrenó

2 Elkn García, Gullermo Pacheco y Germán Mancera2 una red neuronal auo asocava usando la écnca de Fooe para los géneros rock, pop, ecno y clásco. Su razón de clasfcacón correca fue smlar a la obenda por Golub. Ese proyeco esá enfocado haca la clasfcacón de cancones en res géneros basanes populares a nvel colombano y con caraceríscas muy smlares (Merengue, Salsa y Vallenao) con el fn de probar la robusez del ssema. Ese arículo comenza con una descrpcón de odos los desarrollos hechos durane la realzacón del proyeco en cuano a exraccón de caraceríscas y algormos de enrenameno. Se presenan las especfcacones del ssema en lo referene a la base de daos y fnalmene se exponen los resulados obendos hacendo énfass en las dferencas que se obenen medane la ulzacón del Perceprón Mulnvel, la Red de Funcones de Base Radal y AdaBoos. 2 DESARROLLOS El ssema es capaz de clasfcar cancones en formao MP3 y WAV, aunque realza una conversón de MP3 a WAV medane la ulzacón de una aplcacón desarrollada por el grupo de nvesgacón LAME [2]. La base de daos consa de 5 cancones, 9% para enrenameno y % para evaluacón. Las muesras que son omadas de las cancones en formao WAV enen una duracón de.486 segundos a parr de cancones cuya asa de muesreo es 44. khz es decr 2 6 muesras (cancón monofónca). Los parámeros exraídos pueden ser dvddos en res grupos: El prmero de ellos se realza por medo de un análss en empo [6] que hace uso de la correlacón. El segundo grupo se basa en un análss en frecuenca que ulza la Transformada de Fourer y se aplca a dferenes nervalos de frecuenca [2],[3],[7]. El úlmo grupo se obene a parr de la exraccón de dos apores rímcos ndependenes hacendo uso de la Transformada Wavele y enendo como funcón madre el sombrero mecano defndo por:. () 2 4 2 2 x exp( x / 2) 3 Esos parámeros surgen de la descomposcón de la señal en 2 componenes orogonales, denomnadas parones rímcos. (Fg.) Fg.. Fragmeno orgnal anes de procesar (Izq.) y parones rímcos exraídos (Der)

Clasfcacón de Músca por Género ulzando Redes Neuronales Arfcales 3 Se exraen un oal de 33 parámeros, 5 basado en análss en empo, 5 basados en análss en frecuenca y 23 a parr de la ransformada Wavele. Medane la ulzacón de la Transformacón de Karhunen Loéve [8] se busca descarar el conendo poco nformavo que es usado como enrada a la Red Neuronal Arfcal. Eso perme además reducr la compledad del modelo ya que se reduce la dmensonaldad del espaco de enrada, dando como resulado, la seleccón de las 2 combnacones lneales más represenavas de parámeros ncales. 2.. Perceprón mulnvel y Red de funcones de base radal (RBF) El perceprón mulnvel de una capa escondda se enrena ulzando propagacón nversa del error (Backpropagaon) a parr del sguene pseudo códgo: Escoa el número de neuronas de la capa ocula. Incalce los pesos W. Repa Repa para cada uno de los daos X Calcule la salda para la prmera capa G f X W W Calcule la salda oal Fn. Repa para cada uno de las saldas Fn Calcule el error como Hasa condcón de ermnacón K F f GW W o ob o N h hb F para odo desde hasa M Y F F La funcón de acvacón ulzada para odas las neuronas es la funcón sgmode y se emplea la ncalzacón de pesos de Nguyen Wdrow [9] para opmzar la convergenca del enrenameno. La salda de la red enrenada se calcula ulzando la dsanca mínma eucldana enre F y los vecores correspondenes a las posbles equeas T, donde p es el número de equeas posbles. p Por ora pare para RBF el pseudo códgo del algormo de enrenameno mplemenado es el sguene: Escoa el número de neuronas de la capa escondda. Incalce (Cenros de las Funcones de Base Radal) Repa Repa para cada uno de los daos x Asgne x a (cluser) al que 2 x sea la mínma enre las posbles. F

4 Elkn García, Gullermo Pacheco y Germán Mancera2 Fn. Repa para cada uno de los clusers x Fn. Hasa que nnguno de los x cambe de cluser. Encuenre la varanza de los daos medane 2 Encuenre los pesos de la capa de salda medane x T W T x x Con el obevo de enconrar el orden del modelo adecuado para las redes del perceprón mulnvel y RBF se ulza el proceso de Fold Cross Valdaon [] para redes enre 2 y 2 neuronas. Adconalmene se nroducen conocmeno prevo pues es un facor fundamenal en cualquer proceso de clasfcacón y se emplea con el fn de obener desempeños superores a aquellos que obenen los clasfcadores medane solo el proceso de enrenameno. Dado que las cancones de los géneros esudados presenan rregulardades que se deben a arreglos muscales propos de cada nérpree, raducdas en espacos de slenco, mprovsacones, solos, cambos de velocdad enre oros y que la exraccón de caraceríscas se hace a parr de un fragmeno muy coro, se compensa esa caracerísca ncorporando un ssema de voacón 2 de 3, en el cual se evalúa la red en 3 fragmenos dferenes de la cancón, reducendo así la probabldad de clasfcacón errónea. T 2.3 AdaBoos. AdaBoos se emplea como algormo de aprendzae con el obevo de dsmnur el error de evaluacón a medda que la red se sgue enrenando, ncluso después de que el error de enrenameno ha alcanzado el valor de cero []. Se escoge como clasfcador débl una red de funcones de base radal de neuronas pueso que presena una buena relacón enre el empo de enrenameno y el porcenae correco de clasfcacón. El pseudo códgo de Adaboos es el sguene: Se hace unforme D () m Para desde hasa T Se eecua el clasfcador débl con enradas X, Y, D Se calcula Se acualza = log 2 D () - D () e Z R ( ( )) donde () es un facor al que

Clasfcacón de Músca por Género ulzando Redes Neuronales Arfcales 5 () s H ( ) Y ( ) s H ( ) Y ( ) Fn Se calcula la hpóess fnal H( ) p T al que g ( ) es máxma Puede noarse que en la prmera eracón el algormo enía gual probabldad de equvocarse con cualquer cancón, por lo cual la dsrbucón ncal asgna gual probabldad de escogenca a odas las muesras. Esa probabldad es modfcada de acuerdo al resulado obendo por la red al momeno de clasfcar una muesra: S ésa es clasfcada correcamene su probabldad dsmnuye; s no, su probabldad aumena. A parr de esa dsrbucón se obene un conuno de muesras boosrap; lo que se desea con ese po de conuno, es que cada clasfcador débl se enrene con un conuno de muesras aleaoro, pero hacendo mayor énfass en las cancones que no han sdo clasfcadas correcamene con el fn de llevar a cero el error de enrenameno. El coefcene a enrega un grado de credbldad para cada uno de los clasfcadores débles y además se ulza para calcular la dsrbucón de probabldad, menras que es el error en la eracón. A parr de la suma de hpóess parcales se genera la aneror hpóess fnal, con la cual se calcula el error de enrenameno y la dsrbucón de márgenes para cada una de las clases, en dferenes épocas de enrenameno. 3 RESULTADOS El error promedo de clasfcacón, empleando Fold Cross Valdaon para el perceprón mulnvel en el conuno de valdacón es basane smlar para los dferenes ordenes de la red, y no se presenan meoras sgnfcavas al aumenar el número de neuronas de la capa ocula (Fg. 2.). El porcenae promedo de clasfcacón correca ene su máxmo para la red con 6 neuronas en la capa escondda, con un porcenae de acero del 72.25 %. Por ora pare, ulzando la msma meodología para RBF se observa que el porcenae promedo de clasfcacón aumena a medda que se agregan neuronas a la capa escondda. El porcenae promedo de clasfcacón correca ene su máxmo para una red con 9 neuronas en la capa escondda, con un porcenae promedo de acero del 76.89 %.

Porcenae de Error (x%) Porcenae de Error (x%) Porcenae de Error (x%) Porcenae de Error (x%) Porcenae de Error (x%) Porcenae Promedo de Clasfcacón Correca Porcenae Promedo de Clasfcacón Correca 6 Elkn García, Gullermo Pacheco y Germán Mancera2 8 Porcenae de Clasfcacón Correca en funcón del Número de Neuronas 8 Porcenae de clasfcacón correca en funcón del número de neuronas 7 7 6 6 5 5 4 4 3 3 2 2 2 4 6 8 2 4 6 8 2 Número de Neuronas 2 4 6 8 2 4 6 8 2 Número de Neuronas Fg. 2. Porcenae Promedo de Clasfcacón Correca obendo empleando Fold Cross Valdaon en funcón del número de neuronas para perceprón mulnvel (Izq.) y RBF (Der.). Para el clasfcador Adaboos, menras el error de enrenameno baa hasa la eracón a un valor mínmo de.22, el error de evaluacón oal ambén dsmnuye para los res géneros (Fg. 3.), esa dsmnucón ambén se corrobora por medo de los márgenes de confdenca (Fg. 4.). Un resumen de resulados para el clasfcador Adaboos mplemenado se presena en la Tabla Tabla. Porcenaes de clasfcacón correca ulzando Adaboos. Toal Merengue Salsa Vallenao Porcenae de Clasfcacón correco (%) 8 7.59 88.24 8.25 5 Error de Enrenameno Toal.5 Error de Evaluacón Toal 5 5 5 5.5..5 5 2 3 4 5 6 7 8 9 Número de Ieracones 2 3 4 5 6 7 8 9 Número de Ieracones.9 Error de Evaluacón Merengue.7 Error de Evaluacón Salsa.65 Error de Evaluacón Vallenao.8.6.6.55.7.5.5.6.5. 5 5 5 2 3 4 5 6 7 8 9 Número de Ieracones 2 3 4 5 6 7 8 9 Número de Ieracones.5 2 3 4 5 6 7 8 9 Número de Ieracones Fg. 3. Error de enrenameno oal (Sup. Izq.). Error de evaluacón a) Toal (Sup. Der.), b)merengue (Inf. Izq.), c)salsa (Inf. Cen.) y d)vallenao (Inf. Der.).

Dsrbucón de Márgenes Dsrbucón de Márgenes Dsrbucón de Márgenes Clasfcacón de Músca por Género ulzando Redes Neuronales Arfcales 7.9.8 Dsrbucón de Márgenes Género Merengue 2 Ieracones 5 Ieracones 2 Ieracones Ieracones.9.8 Dsrbucón de Márgenes Género Salsa 2 Ieracones 5 Ieracones 2 Ieracones Ieracones.9.8 Dsrbucón de Márgenes Género Vallenao 2 Ieracones 5 Ieracones 2 Ieracones Ieracones.7.7.7.6.6.6.5..5..5. - -.8 -.6 - -.6.8 Márgenes - -.8 -.6 - -.6.8 Márgenes - -.8 -.6 - -.6.8 Márgenes Fg. 4. Dsrbucón de márgenes de evaluacón para a) Merengue (Izq.) b) Salsa (Cen.) c) Vallenao (Der.). La Tabla 2 presena un resumen deallado de odas las caraceríscas obendas para las redes de Propagacón Inversa y de Funcones de Base Radal. Para la mplemenacón de Adaboos, se ulzó una red de funcones de base radal con neuronas en la capa escondda debdo a que el empo requerdo para su enrenameno es bao comparado con los demás amaños de red. Por ora pare, fue posble cercorarse de la forma en la cual se meora el desempeño de un clasfcador débl medane la observacón del porcenae obendo al realzar las eracones. Tabla 2. Comparacón de los resulados obendos para las opologías Red de Propagacón Inversa y Red de Funcones de Base Radal. RED DE PROPAGACIÓN INVERSA RED DE FUNCIONES DE BASE RADIAL Tempo oal empleado en la búsqueda de la Red Ópma..8357 h 2.84 h Núm. de Neuronas Ópmo para la Capa Ocula. 6 6 Tempo oal empleado en el enrenameno de la Red Ópma 73.8836 mn 25.56 mn Núm. de Ieracones realzadas en la Valdacón Cruzada. 2 25 % Promedo de Clasfcacón en la Valdacón Cruzada 7.67 76.22 Máxmo % de Clasfcacón en la Valdacón Cruzada 75.56 8 Porcenae Correco de Evaluacón 76 8 Tempo escogdo para realzar la Evaluacón 6 s 6 s Porcenae Correco de Evaluacón empleando Voacón 2 de 3 78 84 Tempos escogdos para realzar la evaluacón con Voacón 6, 75 y 9 s 45, 6 y 75 s Adconalmene al hecho que los errores de enrenameno y evaluacón dsmnuyan conforme aumena el número de eracones, se observa que el porcenae de acero obendo en la evaluacón, ulzando Adaboos, es superor a ese msmo porcenae para la meor red que se obene usando Fold Cross Valdaon, como se muesra en la Tabla 3. Tabla 3. Resulado de la aplcacón de Adaboos a un clasfcador débl. Red de Funcones de Base Radal de neuronas en la Capa Escondda Clasfcador Adaboos con eracones % de acero en la Evaluacón 7 8

8 Elkn García, Gullermo Pacheco y Germán Mancera2 4.5 CONCLUSIONES El esudo ncal realzado, acerca de la obencón y exraccón de parámeros relevanes, a parr de un archvo de músca en formao dgal, muesra que las caraceríscas ulzadas son apropadas y permen dferencar enre los res pos de géneros que forman pare de ese esudo. Los resulados arroados por los clasfcadores mplemenados corroboran la afrmacón aneror, ya que de no ser así, la caegorzacón de cancones no hubese mosrado los resulados sasfacoros que fueron obendos. Los parámeros exraídos a parr de la Transformada Wavele enen una esrecha relacón con la forma en la cual el ser humano realza el proceso de dsncón de músca por género. Eso es, que se cenran en la denfcacón de un parón rímco básco presene en la músca. Es de desacar, que los parámeros que son exraídos buscando un parón rímco, son produco de la expermenacón y la realzacón de numerosas pruebas, en las cuales se buscó represenar esa caracerísca. Eso consuye un apore mporane al campo de la Clasfcacón de Señales de Audo. El proyeco obuvo como resulado dos pos báscos de clasfcadores, que fueron produco de sucesvos esudos, en los cuales se opmzaron las respecvas arquecuras de red, buscando aquellas para las cuales se presenaba el meor desempeño, meddo en érmnos de la clasfcacón correca de cancones que no fueron usadas durane la fase de enrenameno. Las meoras nroducdas durane la fase de desarrollo fueron las sguenes: Exraccón de Caraceríscas Relevanes a parr de la ransformacón del algormo de Karhunen Loéve. Fold Cross Valdaon, con el fn de deermnar el orden apropado del modelo. Incorporacón de Conocmeno prevo para nferr el nervalo de empo adecuado para omar la muesra de la cancón a clasfcar. Voacón 2 de 3, con el fn de dsmnur la probabldad de error debda a la escogenca de un nervalo de empo no represenavo de la esrucura muscal. La úlma y más relevane meora mplemenada fue el uso de Adaboos aplcado al problema específco propo de ese rabao. Se demosró que su ulzacón eleva el porcenae de acero en la clasfcacón para un clasfcador débl con 3 saldas. Los resulados producdos en ese proyeco son basane buenos en comparacón con los que han sdo obendos por oros nvesgadores que han rabaado en el msmo campo, desacando la smlardad de los géneros ulzados. Por eemplo Seh Golub [2] obuvo un porcenae de clasfcacón correco del 77% ulzando redes de propagacón nversa para dos géneros muy smlares, menras que Paul Sco [3] logró un porcenae de clasfcacón de 94.8% ulzando como enradas, géneros muy dferenes como Rock, Clásca, Soul y Counry. Oros rabaos como el de Solau [5] obuveron 8.9% para Rock, Pop, Tecno y Clásca, menras Tzaneaks [7] ulzó ses géneros y obuvo un porcenae de clasfcacón de 6%. Esos porcenaes son nferores para aquellos esudos que ulzaron rmos smlares y comparables con los esudos que usaron rmos dferenes. A pesar de la smlud exsene en los géneros ulzados en ese proyeco, se realzó un proceso de clasfcacón que conrbuye al

Clasfcacón de Músca por Género ulzando Redes Neuronales Arfcales 9 desarrollo de la redes neuronales arfcales aplcadas no solo a la clasfcacón de músca sno a la clasfcacón de señales de audo. REFERENCIAS [] Gerhard, Davd. Ph.D. Deph Paper: Audo Sgnal Classfcaon. School of Compung Scence. Smon Fraser Unversy. 2. [2] Golub, Seh. Classfyng Recorded Musc. MSc n Arfcal Inellgence. Dvson of Informacs. Unversy of Ednburgh. 2. [3] Sco, Paul. Musc Classfcaon usng Neural Neworks. EE373B Proyec. Sanford Unversy. 2. [4] Fooe, J.. A smlary measure for auomac audo classfcaon. Techncal repor, Insue of Sysems Scence, Naonal Unversy of Sngapure. 997 [5] Solau, H., Schulz, T., Wesphal, M., y Wabel, A.. Recognon of musc ypes. Ineracve Sysem Laboraory. 998. [6] Desan, P. Auocorrelaon and he sudy of muscal expresson. Cenre of knowledge echnology, Urech School of ars. 99 [7] Tzaneaks, George; Essl, Georg; Cook, Perry. Auomac Muscal Genre Classfcaon of Audo Sgnals. Compuer Scence Deparmen. Prnceon Unversy. 2 [8] Fukunaga, K. Inroducon o Sascal Paern Recognon. 2da Edcón. SanDego Academc Press. 99 [9] Malab Help. The MahWorks, Inc. Versón 6.5. [] Bshop, Chrsopher. Neural Neworks for Paern Recognon. New York. Oxford Unversy Press Inc. 995. [] R.E. Schapre. Theorecal vews of boosng. In Compuaonal Learnng Theory: Fourh European Conference, EuroCOLT'99, 999. [2] www.lame.org Grupo de nvesgacón dedcado a desarrollar algormos para descomprmr MP3.