VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR

Tamaño: px
Comenzar la demostración a partir de la página:

Download "VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR"

Transcripción

1 VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR ESPECIALIDAD: Comunicaciones y Electrónica Juan Arturo Nolazco Flores PhD Ingeniería Informática Fecha de Ingreso: 15 de Noviembre, 2012.

2 Especialidad: Comunicaciones y Electrónica 2

3 CONTENIDO RESUMEN EJECUTIVO INTRODUCCIÓN SISTEMAS CONVENCIONALES [3, 4] ESTADO DEL ARTE: JFA (Joint Factor Analysis) [5, 6] ESTIMACIÓN DISCRIMINATIVA: MVE ( Minimum Verification Error ) MINIMIZANDO EL ÁREA BAJO LA CURVA DET RESULTADOS Base de Datos Condiciones de señal limpia Condiciones de señal con ruido CONCLUSIONES REFERENCIAS BIBLIOGRAFÍA AGRADECIMIENTOS CURRICULUM VITAE Especialidad: Comunicaciones y Electrónica 3

4 RESUMEN EJECUTIVO En el presente trabajo se presentó un sistema para Verificación de Locutor basado en MVE (Minimum Verification Error), el cual es un método discriminativo que minimiza el área bajo la curva en lugar de optimizar un punto de operación. Los resultados en señales limpias utilizando la técnica MVE mejoró a la técnica convencional por más del 15.30%, y minimizando el área bajo la curva todavía mejoró otro 2.22% mas. Aplicando la minimización del área bajo la curva sobre JFA mejoró el resultado por 1.16% comparado con JFA puro. Los resultados de AUC-JFA y AUC-MVE en señales corruptas con ruido aditivo de diferentes tipos mejoran en un 6.05% y 10.49% respectivamente con respecto al rendimiento de la técnica convencional. Palabras clave: verificación de personas, biométricas, reconocimiento de patrones, reconocimiento de personas Especialidad: Comunicaciones y Electrónica 4

5 1. INTRODUCCIÓN Los sistemas de reconocimiento biométrico utilizan alguna característica de la persona para reconocerlo. Estas características pueden ser intrusivas como pruebas de sangre; o puede ser no intrusiva como características del rostro, de la palma de la mano, la forma de caminar, la forma de hablar, el iris, etc. Los sistemas de reconocimiento biométrico de personas se dividen en sistemas de identificación y sistemas de verificación. En los sistemas de identificación se desea obtener la persona que tiene las características más parecidas a las presentadas. Generalmente, el universo de personas que se busca es limitado, por ejemplo a un departamento, a una empresa, a una ciudad, a afiliados, etc. En caso de que se utilice identificación biométrica para una investigación forense, entonces la principal amenaza para estos sistemas es que la persona va a intente hablar diferente para evitar ser identificado. En un sistema de verificación, el sistema coteja las características biométricas del individuo con un modelo acústico de la persona quien dice ser. El sistema debe de confirmar/negar si la personas es quien dice ser. Los sistemas de verificación biométricas son generalmente utilizados para control de acceso. La principal amenaza para los sistemas de verificación de personas es que el individuo intente imitar a la otra persona. Los humanos utilizamos como uno de los medios de comunicación el sonido generado por nuestra sistema bucal. La voz generada depende de muchas variables como el tamaño, grosor, elasticidad de nuestras cuerdas bucales, el tamaño de nuestra laringe, boca, etc. Tal es la diferencia entre individuos de estas características que la voz se puede utilizar como biométrica. En el presente trabajo se presenta un sistema que se han diseñado y desarrollado para realizar la tarea de verificación del locutor. Con este sistema se ha participado en evaluaciones internacionales y hemos obtenido muy buenos resultados. En la sección 2 se presenta la arquitectura de un sistema para ASV convencional. En esta arquitectura se presenta la función de cada módulo de la arquitectura. En la sección 3 se presenta la técnica JFK (Joint Factor Analysis) que se utiliza en un sistemas ASV para separar las características del canal de las características de los usuarios. En la sección 4 se presenta una técnica discriminativa que aplicamos a un sistema ASV. Especialidad: Comunicaciones y Electrónica 5

6 En la sección 5 se presenta una técnica de optimización que se aplica a diferentes técnicas utilizadas en sistemas ASVs. En la sección 6 se presentan resultados tanto de técnicas tradicionales como las que hemos desarrollado. En la sección 7 se presentan las Conclusiones. Especialidad: Comunicaciones y Electrónica 6

7 2. SISTEMAS CONVENCIONALES [3, 4] En la figura se muestra la arquitectura de nuestro sistema de Verificación de Locutor. Esta arquitectura tiene dos partes. La parte de entrenamiento de los modelos acústicos de los Locutores. La parte de evaluación del sistema utilizando los modelos acústicos de los Locutores. En el primer módulo de la arquitectura el pre-procesamiento de la señal de voz de los locutores objetivo, como locutores intrusos. En este módulo se procesa la señal de voz para obtener las características de la voz de los locutores. Lo deseable de estas características es que sean lo más diferenciadoras posibles entre locutores, tal que faciliten la verificación de los mismos. Este módulo es el mismo tanto en la parte de entrenamiento de los modelos acústico, como en la parte de evaluación del sistema. El procesamiento de la señal de voz se hace por segmentos de tiempo; cada segmento de tiempo con una duración de entre 20ms y 40ms. Esto se debe a que es importante que la señal analizada sea estacionaria; y resulta que la señal de voz generada por las personas es una señal estacionaria en segmentos pequeños (quasiestacionaria). Entonces podemos analizar la señal por intervalos pequeños en tiempo. En este intervalo de tiempo podemos obtener características como número de cruces por Cero (al graficar la señal), energía, máxima amplitud, periodo. También podemos obtener su espectro de Especialidad: Comunicaciones y Electrónica 7

8 Fourier y obtener otras características en función de la frecuencia como distribución de la energía y frecuencias de resonancia. En nuestro trabajo hemos encontrado buenos resultados para periodos de tiempo de 40ms y calculando la energía de este segment así como los coeficientes MFCC ( Mel Frequency Cepstral Coefficients ). Los MFCC se calculan primeramente calculando la Transformada Discreta de Fourier para cada segmento de tiempo ( STFT- Short-Time Discrete Fourier Transform ); después se calcula la Transformada Coseno del logaritmo de la magnitud de la energía para cada uno de los componentes de STFT. La transformada Coseno genera los MFCCs. Utilizamos también las características dinámicas de los coeficientes representadas por la primera y segunda derivada. En nuestro trabajo hemos encontrado buenos resultados para periodos de tiempo de 40ms, y para cada segmente obtenemos un vector de dimensión 58 (1 representando la energía de la señal, 19 coeficientes MFCC, y sus primeras y segundas derivadas). Con las características de la señal de voz de los locutores objetivos, el siguiente módulo del sección del entrenamiento son los módulos para Modelación Locutores Objetivos (Targets). Con las características de los locutores intrusos se crea un Modelo de Locutores Intrusos, lo que se le conoce como UBM (Universal Background Model). La modelación acústica de cada locutor es un GMM ( Gaussian Mixture Model ) que es una Cadena Escondida de Markov de un estado. Cada estado de la GMM tiene un vector con las medias de la energía y de los MFCCs, incluyendo su primer y segunda derivada; y el otro vector con las varianzas de la energía y de cada uno de los MFCCs, incluyendo sus primera y segunda derivada. Debido a la cantidad de datos que generalmente se encuentran en una tarea de Verificación de Locutores, la estimación de estos parámetros es utilizando MAP (Maximum A Posteriori). En la parte de la Evaluación, el locutor se identifica y genera una señal de voz, entonces primero calculamos los MFCCs de la señal de voz; después, calculamos las puntuaciones del locutor tanto para el modelo del locutor objetivo, como para el modelo UBM. Dados las dos puntuaciones, el problema de clasificación involucra dos hipótesis: que el usuario legítimo (quien dice ser), H!, o que el usuario sea un impostor, H!. Sea p! z H! la función de densidad condicional de la puntuación observada z generada por el locutor auténtico A. De la misma manera sea p! z H! la función de densidad condicional de la puntuación (score) observada z generada por locutores impostores de A. Especialidad: Comunicaciones y Electrónica 8

9 La densidad condicional p! z H! se estima con las puntuaciones de del mismo locutor A utilizando su modelo acústico. La densidad condicional p! z H! se estima con las puntuaciones de todos los impostores posibles utilizando el modelo acústico de A. Cuando todos los impostores comparten el mismo modelo entonces se le conoce como Modelo Universal (UBM- Universal Background Model) Si conocemos las densidades condicionales de p! z H! y p! z H!, entonces una prueba de Bayes, con el mismo costo de error en la clasificación por locutor, se basa en la taza de verosimilitud (likelihood ratio) para el locutor A [2,15] como se muestra a continuación: o en el dominio logarítmico λ! = p! z H! p! z H! λ! = log p! z H! log p! z H!. Entonces, el problema de clasificación es el siguiente: Si log p! z H! log p! z H! τ seleccione H! < τ seleccione H! Con el propósito de simplificar las figura que se presentan de aquí en adelante, vamos a simplificar la gráfica de la arquitectura como se muestra a continuación: Especialidad: Comunicaciones y Electrónica 9

10 3. ESTADO DEL ARTE: JFA (Joint Factor Analysis) [5, 6] El propósito de JFA es separar la voz del locutor y las características del canal. Esto es porque el canal crea distorsión en la señal, lo cual afecta la precisión para identificar las personas. En JFA, las medias de todas las Gaussianas en una GMM son concatenadas en un solo vector llamado, supervector M!,!! = {μ! μ! μ! }. El supervector M representa el GMM para la distribución de datos sobre cada tipo de canal Ch para el locutor S. M!,!! = m + Vy! + Ux!,!! + Dz! donde m es una media global de todos los locutors; V es un conjunto de voces características (eigenvoices) representando el subespacio en el que se ubican los componentes específicos de los locutors, M!,!!. U es un conjunto de canales característicos (eigenchannels) representando el subespacio sobre el cual están los componentes específicos de un canal. D es una matriz diagonal. y! es un vector con distribución Normal que representa los factores específicos del locutor S. x!,!! es un vector con distribución Normal que representa los factores específicos del locutor S sobre el canal Ch. z! es un vector con distribución Normal que representa un error residual; El entrenamiento de V, U y D es utilizando el algoritmo de Baum- Welch; El aprendizaje de y!, z! y x!,!! es utilizando procedimiento EM (Expectation Maximization) [6, 5]. Especialidad: Comunicaciones y Electrónica 10

11 4. ESTIMACIÓN DISCRIMINATIVA: MVE ( Minimum Verification Error ) Mientras que en una estimación convencionales el objetivo es aprender los parámetros de estas distribuciones que mejor se ajustan a los datos de entrenamiento utilizando un criterio de Máxima Verosimilitud (ML) sin explícitamente considerar la minimización de un punto de operación deseado. En un paradigma discriminativo podemos optimizar el rendimiento del sistema utilizando los datos de entrenamiento; esto es de las muestras positivas (del locutor objetivo (target)) y negativas (del locutor no objetivo (no target)). MVE (Minimum Verificaation error) es un método discriminativo que minimizan el Error Empírico (EE) de verificación en los datos de entrenamiento. Este método lo aplicamos a una tarea de Verificación del locutor [15], la arquitectura se presenta en la siguiente figura: Se puede observar que esta optimización agrega una etapa más de entrenamiento. La entrada a este segunda etapa es GMM MAP ; el proceso de actualización de parámetros es iterativo hasta que se cumple con el requisito de minimizar el EE de los datos de entrenamiento. Cuando el EE es mínimo entonces obtenemos como salida el modelo GMM MVE. A continuación se presente este proceso iterativo: Especialidad: Comunicaciones y Electrónica 11

12 Especialidad: Comunicaciones y Electrónica 12

13 5. MINIMIZANDO EL ÁREA BAJO LA CURVA DET El propósito de ASV es proveer una decisión confiable, ya sea aceptado o rechazado, dado un identidad reclamada y una frase hablada. Los errores posibles que puedes ocurrir son las Aceptaciones Falsas (FA-False Aceptances) y las Rechazos Falsos (FR- False Rejections). En el caso de los FA se acepta a un locutor no es el locutor objetivo; y en el caso del FR se rechaza incorrectamente a un locutor. En la práctica, al reducir el FA aumenta el FR, y viceversa. Si graficamos cada punto en una curva bidimensional con FA y FR obtendremos lo que se conoce como curva DET ( Detection Error Tradeoff ), como se presenta en la siguiente curva: El verificador es mejor si la curva es más cercana a los ejes. El rendimiento del SV generalmente es caracterizado por el EER ( Equal Error Rate ) y es el punto de operación en el que el FR tiene el mismo valor de FA [1]. Una mejor medida de rendimiento es el área bajo la curva; esto se puede observar al comparar las FR y FA, donde la curva azul es mejor que la curva verde a pesar de que el EER de la curva verde es mejor que el EER de la curva azul. Mientras que en una estimación convencionales [3, 4, 5, 6, 7] (secciones 3 y 4) el objetivo es aprender los parámetros de estas distribuciones que mejor se ajustan a los datos de entrenamiento utilizando un criterio de Máxima Verosimilitud (ML) sin explícitamente Especialidad: Comunicaciones y Electrónica 13

14 considerar la minimización de un punto de operación deseado. Por otro lado, los paradigmas discriminativos (sección 4) para GMM [11, 12, 14] y para JFA [13] estimación de los parámetros para optimizar el rendimiento utilizando un punto de operación específico. Sin embargo, en estos métodos discriminativos el punto de operación que optimizan depende de la proporción de muestras positivas (del locutor objetivo (target)) y negativas (del locutor no objetivo (no target)) y optimiza un punto en la curva DET, pero que no necesariamente es el punto EER ni un punto de operación específico que deseemos optimizar. Es un hecho que los paradigmas discriminativos también pueden ser diseñado para optimizar el rendimiento de la clasificación considerando un punto de operación específico; o inclusive tomando toda la curva DET en su totalidad. Nuestra propuesta es minimizar el área bajo la curva (AUC- Area Under the Curve) optimiza cada punto en la curva. Con algunas manipulaciones matemáticas llegamos a la siguiente expresión que actualiza los parámetros: donde L X, Λ = 1 M W Λ!!! = Λ! ε L X, Λ χεh χεw γ 1 R θ χ, θ χ θ χ Λ θ χ Λ X es el conjunto completo de datos de entrenamiento; M y W son dos conjuntos de datos pertenecientes a las clases C y C; y se cumple que X = M W. θ χ es un score de un clasificador binario que determina si un dato χ pertenece a C o no; R θ χ, θ χ = γφ θ χ,θ χ 1+e γ es la velocidad de aprendizaje, y φ θ χ, θ χ es la distancia entre θ χ y θ χ. Esta ecuación que minimiza el AUC se puede incorporar en los algoritmos MVE (Minimum Verification Error) [9]! Especialidad: Comunicaciones y Electrónica 14

15 y también para JFA (Joint Factor Analysis)[6] Especialidad: Comunicaciones y Electrónica 15

16 6. RESULTADOS 6.1 Base de Datos Para nuestra evaluación utilizamos un subconjunto de la base de datos NIST 2010 utilizados en las evaluaciones bianuales de la NIST (National Institute of Standards and Technology). Este conjunto fue seleccionado aleatoriamente. Para los experimentos con condiciones con ruido agregamos ruido de diferentes fuentes: fiesta, crucero, automóvil a alta velocidad, avión, fábrica. La taza de ruido que se probó fue de 10dB SNR (Signal to Noise Ratio). 6.2 Condiciones de señal limpia A continuación se presenta una tabla con los resultados en los que se muestra como mejoran los resultados con MVE comparado con la técnica convencional: Método EER (clean) Mejora Relativa MAP MVE % Se puede observar que el método convencional obtiene un EER ( Equal Error Rate ) de 15.95; y con MVE obtenemos 13.51, lo que representa una mejora relativa del 15.30%. A continuación se presenta una tabla con los resultados en los que se muestra como mejoran los resultados cuando minimizando el área bajo la curva en modelación MVE: Método EER (clean) Mejora Relativa MVE AUC MVE % Se puede observar que aplicando la optimización AUC en MVE obtenemos un EER 13.21, lo que representa una mejora relativa del 2.22% sobre MVE puro. Especialidad: Comunicaciones y Electrónica 16

17 A continuación se presenta una tabla con los resultados en los que se muestra como mejoran los resultados cuando minimizando el área bajo la curva en modelación JFA: Método EER (clean) Mejora Relativa JFA AUC JFA % 6.3 Condiciones de señal con ruido A continuación se presenta una tabla con los resultados obtenidos para una taza de señal a ruido de 10dB en los que se muestra como mejoran los resultados para diferente técnicas: Método EER (10dB) Mejora Relativa MAP JFA % AUC JFA % AUC MVE % En condiciones con ruido de 10dB, el base de de EER. Utilizando JFA se obtiene un EER de 17.23, lo cual corresponde a un mejora relativa del 6% comparado con el método convencional. Si aplicamos la optimización de minimizar bajo la curva al método JFA, es decir AUC JFA obtenemos un EER de 16.92, lo cual corresponde a una mejora relativa del 6.05%. Si aplicamos la optimización de minimizar bajo la curva al método MVE, AUC MVE obtenemos un EER de 16.12, lo cual corresponde a una mejora relativa del 10.49%. Especialidad: Comunicaciones y Electrónica 17

18 7. CONCLUSIONES En el presente trabajo se presentó un sistema para Verificación de Locutor basado en MVE (Minimum Verification Error), el cual es un método discriminativo que minimiza el área bajo la curva en lugar de optimizar un punto de operación. Los resultados en señales limpias utilizando la técnica MVE mejoró a la técnica convencional por más del 15.30%, y minimizando el área bajo la curva todavía mejoró otro 2.22% mas. Aplicando la minimización del área bajo la curva sobre JFA mejoró el resultado por 1.16% comparado con JFA puro. Los resultados de AUC-JFA y AUC-MVE en señales corruptas con ruido aditivo de diferentes tipos mejoran en un 6.05% y 10.49% respectivamente con respecto al rendimiento de la técnica convencional. Como pudimos observar en los resultados de todos los experimentos, los resultados mejoraron consistentemente. Nuestra investigación seguirá buscando como mejorar los resultados aplicando AUC en otras técnicas o con variaciones de AUC. Especialidad: Comunicaciones y Electrónica 18

19 8. REFERENCIAS [1] A. Martin, G. Doddington, T. Kamm, M. Ordowski, and M. Przybocki, The det curve in assessment of detection task performance, Tech.Rep., DTIC Document, [2] D. A. Reynolds, T. F. Quatieri, and R. B. Dunn, Speaker verification using adapted gaussian mixture models, Digital Signal Processing,vol. 10, pp , [3] F. Bimbot, J. Bonastre, C. Fredouille, G. Gravier, I. Magrin- Chagnolleau, S. Meignier, T. Merlin, J. Ortega-Garcia, anddd Petrovska-Delacretaz, Reynolds (2004) A tutorial on textindependent speaker verification, EURASIP Journal on Applied Signal Processing, vol. 4, pp [4] D. Petrovska-Delacr etaz, A. El Hannani, and G. Chollet, Textindependent speaker verification: state of the art and challenges, Progress in nonlinear speech processing, pp , [5] P. Kenny, G. Boulianne, P. Ouellet, and P. Dumouchel, Joint factor analysis versus eigenchannels in speaker recognition, IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 4, pp , [6] P. Kenny, P. Oueleet, N. Dehak, V. Gupta, and P. Dumouchel, A study of inter-speaker variability in speaker verification, IEEE Trans. ASLP, vol. 16, pp , [7] Najim Dehak, Patrick J. Kenny, Rda Dehak, Pierre Dumouchel, and Pierre Ouellet, Front end factor analysis for speaker verification, IEEE Transactions on Audio, Speech and Language Processing, [11] D. Povey, PC Woodland, and MJF Gales, Discriminative map for acoustic model adaptation, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), 2003, vol. 1, pp. I 312. [12] F. Sha and L.K. Saul, Large margin gaussian mixture modeling for phonetic classification and recognition, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), [13] L. Burget, O. Plchot, S. Cumani, O. Glembek, P. Matejka, and N. Brummer, Discriminatively trained probabilistic linear discriminant analysis for speaker verification, 2012, Proceedings of ICASSP. [14] B.-H. Juang, W. Chou, and C.-H. Lee, Minimum classification error rate methods for speech recognition, IEEE Trans. on Speech and Audio Processing, vol. 5, pp , May Especialidad: Comunicaciones y Electrónica 19

20 [15] K. Fukunaga, Introduction to statistical pattern recognition, in Computer Science and Scientific Computing, 2nd ed., W. Rheinboldt and D. Siewiorek, Eds. San Diego, CA: Academic, Especialidad: Comunicaciones y Electrónica 20

21 9. BIBLIOGRAFÍA H. B. Mann and D. R. Whitney, On a test of whether one of two random variables is stochastically larger than the other, Annals of Mathematical Statistics, vol. 18:1, pp , CH Lee, A unified statistical hypothesis testing approach to speaker verification and verbal information verification, in Proc. COST,Workshop on Speech Technology in the Public Telephone Network: Where are we today?, Greece, September 1997, vol. 250, pp J.-L. Gauvain and C.-H. Lee, Maximum a posteriori estimation for multivariate Gaussian mixture observations of markov chains, IEEE Trans. on Speech and Audio Processing, vol. 2, pp , Apr E. Rosenberg, Speaker verification using minimum verification error training, 1998, Proceedings of ICASSP. Optimization of the det curve in speaker verification(extended version), L.K. Saul and M.G. Rahim, Maximum likelihood and minimum classification error factor analysis for automatic speech recognition, Speech and Audio Processing, IEEE Transactions on, vol. 8, no. 2, pp , L. Burget, O. Plchot, S. Cumani, O. Glembek, P. Matejka, and N. Brummer, Discriminatively trained probabilistic linear discriminant analysis for speaker verification, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), A.F. Martin and C.S. Greenberg, NIST 2008 Speaker Recognition Evaluation: Performance Across Telephone and Room Microphone Channels, in Proc. Interspeech, D. A. Reynolds, Speaker identification and verification using Gaussian mixture speaker models, Speech Communication, vol. 17, no. 1-2, pp , L. Burget, M. Fapso, and V. Hubeika, BUT system for NIST 2008 speaker recognition evaluation, in Interspeech, N. Scheffer, L. Ferrer, M. Graciarena, S. Kajarekar, E. Shriberg, and A. Stolcke, The SRI NIST 2010 speaker recognition evaluation system, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), 2011, pp O. Glembek, L. Burget, N. Dehak, N. Brummer, and P. Kenny, Comparison of scoring methods used in speaker recognition with joint factor analysis, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), P. Matejka, O. Glembek, F. Castaldo, MJ Alam, O. Plchot, P. Kenny, L. Burget, and J. Cernocky, Full-covariance UBM and Especialidad: Comunicaciones y Electrónica 21

22 heavy-tailed PLDA in i-vector speaker verification, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), P Kenny, Bayesian Speaker Verification with Heavy-Tailed Priors, keynote presentation, Odyssey Speaker and Language Recognition Workshop Brno, Czech Republic, Especialidad: Comunicaciones y Electrónica 22

23 10. AGRADECIMIENTOS Agradezco el apoyo del Instituto Tecnológico y de Estudios Superiores de Monterrey por el apoyo financiero para mantener este proyecto desde el año Agradezco el apoyo de mis asistentes de Investigación, especialmente a Leibny Paola Garcia Perera y Roberto Aceves. Agradezco a Richard Stern, Bhiksha Raj, y Rita Singh del Instituto de Tecnología y Lenguaje de la Universidad de Carnegie Mellon, por las excelentes discusiones que hemos tenido en el área de Reconocimiento Automático de Voz y Verificación Automática del Locutor y muy especialmente por su apoyo en el desarrollo de la técnica de optimización que minimiza el área bajo la curva. Agradezco el apoyo de Chin-Hui Lee de Georgia Tech en la adecuación de la técnica MVE a nuestro sistema ASV. Agradezco el apoyo de Eduardo Lleida de la Universidad de Zaragoza, España, por las excelentes discusiones que hemos tenido en el área de Reconocimiento Automático de Voz y Verificación Automática del Locutor. Especialidad: Comunicaciones y Electrónica 23

24 11. CURRICULUM VITAE EDUCACIÓN: Grado: Institución: BSc. Ingeniero en Sistemas Electrónicos (ISE), mención honorífica ( ) ITESM, campus Monterrey, Monterrey, N.L., México. Grado: M.Sc. Ingeniería de Control ( ) Institución: ITESM (Instituto Tecnológico y de Estudios Superiores de Monterrey), campus Monterrey, Monterrey, N.L., México. Grado: M.Phil. ( ) Institución: Universidad de Cambridge, Cambridge, Inglaterra. área: Procesamiento de Voz y de Lenguaje Grado: Ph.D. ( junio) Institución: Universidad de Cambridge, Cambridge, Inglaterra. área: Reconocimiento Automático de Voz en ambientes altamente contaminados por ruido. DISTINCIONES: 1. Miembro de la Academia Mexicana de Ciencias, SNI, nivel I, período ; candidato en el periodo Premio a la Labor Docente y de Investigación del Instituto Tecnológico y de Estudios Superiores de Monterrey, campus Monterrey, Mayo Premio a la Labor Docente y de Investigación del Instituto Tecnológico y de Estudios Superiores de Monterrey, campus Monterrey, Mayo Invitado por CONACyT a formar parte de Red Nacional en Tecnologías de Información, 2008-fecha. 6. Vice-presidente el SIL-IL ( Special Interest Group in Iberoamerican Languages ) de ISCA (Internacional Speech and Communication Association), en el periodo 2008-fecha. 7. Agencia Española de Cooperación Internacional (AECI), para participar en le Programa de Cooperación Interuniversitaria AL.E, estancia corta en la Univ. de Zaragoza, España, en Junio del Especialidad: Comunicaciones y Electrónica 24

25 8. Reconocimieto como Responsable de la Cátedra de Investigación de Seguridad de la Información, lo cual me hace acreedor a un apoyo financiero del ITESM de $1,500, pesos al año. 9. Reconocimiento como profesor Titular del ITESM, campus Monterrey, Beca de la Academia Mexicana de Ciencias (AMC-FOMECE) durante el verano del 2001 para realizar investigación sobre reconocimiento automático de Voz en la Universidad de Carnegie Mellon, EUA (4, USD + pasaje de avión). 11. Apoyo financiero de la DAAD para realizar una estancia en la Universidad de Marburg, Alemania, período Mayo-Julio de 1998 (11, DM por un período de tres meses). 12. Beca F.C.O ("Foreign and Commonwealth"), administrada por el Consejo Británico, para realizar estudios de postgrado en la Universidad de Cambridge, Inglaterra ( ). 13. Premio O.R.S. ("Overseas Research Student Award") para realizar investigación en la Universidad de Cambridge, Inglaterra ( ). 14. Beca de CONACYT (Consejo Nacional de Ciencia y Tecnología) para realizar estudios doctorales en la Universidad de Cambridge, Inglaterra ( ). 15. Beca BUAC (Becas Universitarias Asociación Civil) para realizar estudios de maestría en el ITESM, campus Monterrey ( ) en el programa de Profesores a Futuro. 16. Carta de Reconocimiento de BUAC por estar dentro de los 15 estudiantes becados con las calificaciones promedio más alto en el ITESM, campus Monterrey (Ene. 1983). 17. Beca BUAC para realizar estudios de licenciatura en el ITESM, campus Monterrey ( ). EXPERIENCIA LABORAL: Institución: Dpto. de Ciencias Computacionales, ITESM, campus Monterrey, Monterrey, N.L., México. Responsabilidades: Profesor de Tiempo completo (Full-time professor): Director del Dpto. de Ciencias Computacionales, (2003-fecha) Especialidad: Comunicaciones y Electrónica 25

Verificación Automática del Locutor

Verificación Automática del Locutor Verificación Automática del Locutor Juan Arturo Nolazco Flores Departamento de Ciencias Computacionales Tecnológico de Monterrey, Campus Monterrey. Juan Arturo Nolazco Flores. RAH Agenda Introducción IAL

Más detalles

ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION

ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION Fecha de recepción: 17 de mayo 2016 Fecha de aceptación: 20

Más detalles

Eficacia de las características prosódicas a corto plazo en la verificación de locutor

Eficacia de las características prosódicas a corto plazo en la verificación de locutor Eficacia de las características prosódicas a corto plazo en la verificación de locutor Iker Luengo 1, Eva Navas 1, Inmaculada Hernáez 1, Jon Sanchez 1, Ibon Saratxaga 1, Iñaki Sainz 1, Juan J. Igarza 1

Más detalles

Reconocimiento Automático de Locutor

Reconocimiento Automático de Locutor Reconocimiento Automático de Locutor Joaquín González Rodríguez ATVS Biometric Recognition Group Universidad Autónoma de Madrid http://atvs.ii.uam.es Sumario Introducción: n: voz e identidad Reconocimiento

Más detalles

ESTUDIO COMPARATIVO DE TÉCNICAS PARA ROBUSTEZ DE SISTEMAS DE VERIFICACIÓN DE LOCUTOR TEXTO INDEPENDIENTE JOSUÉ ABRAHAM FREDES SANDOVAL

ESTUDIO COMPARATIVO DE TÉCNICAS PARA ROBUSTEZ DE SISTEMAS DE VERIFICACIÓN DE LOCUTOR TEXTO INDEPENDIENTE JOSUÉ ABRAHAM FREDES SANDOVAL UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO INGENIERÍA ELÉCTRICA ESTUDIO COMPARATIVO DE TÉCNICAS PARA ROBUSTEZ DE SISTEMAS DE VERIFICACIÓN DE LOCUTOR TEXTO INDEPENDIENTE

Más detalles

EXPERIMENTOS PRELIMINARES DE VERIFICACIÓN DE LOCUTORES CON UNA BASE DE DATOS REALISTA

EXPERIMENTOS PRELIMINARES DE VERIFICACIÓN DE LOCUTORES CON UNA BASE DE DATOS REALISTA EXPERIMENTOS PRELIMINARES DE VERIFICACIÓN DE LOCUTORES CON UNA BASE DE DATOS REALISTA José Antonio Rubio García, José Manuel Pardo Muñoz, Ricardo de Córdoba Herralde, Javier Macías Guarasa Grupo de Tecnología

Más detalles

EXTRACCIÓN DE LRs DE AUDIOS DE CASOS CERRADOS DE LA POLICÍA DE INVESTIGACIONES DE CHILE PDI

EXTRACCIÓN DE LRs DE AUDIOS DE CASOS CERRADOS DE LA POLICÍA DE INVESTIGACIONES DE CHILE PDI EXTRACCIÓN DE LRs DE AUDIOS DE CASOS CERRADOS DE LA POLICÍA DE INVESTIGACIONES DE CHILE PDI Claudia Rosas 1, Jorge Sommerhoff 2, César Sáez 3, José Novoa 4 1 Instituto de Lingüística y Literatura, Universidad

Más detalles

Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla

Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla Jorge Luis Guevara Diaz Semana ciencia de la Computación Escuela de Informática Universidad Nacional

Más detalles

Fusión de sistemas de reconocimiento basados en características de alto y bajo nivel

Fusión de sistemas de reconocimiento basados en características de alto y bajo nivel Fusión de sistemas de reconocimiento basados en características de alto y bajo nivel Mireia Farrús 1, Jan Anguita 1, Javier Hernando 1, Ramon Cerdà 2 1 Universitat Politècnica de Catalunya, 2 Universitat

Más detalles

6 BASE DE DATOS Y SOFTWARE

6 BASE DE DATOS Y SOFTWARE 6 BASE DE DATOS Y SOFTWARE En este capítulo describiremos la base de datos con la que hemos elaborado las pruebas experimentales a lo largo de este proyecto, así como los protocolos seguidos para la realización

Más detalles

Identificación del Hablante Empleando Modelos de Clases de Fonemas. Vizcaya Pedro, Ulloa Nicolás,

Identificación del Hablante Empleando Modelos de Clases de Fonemas. Vizcaya Pedro, Ulloa Nicolás, Identificación del Hablante Empleando Modelos de Clases de Fonemas Vizcaya Pedro, Ulloa Nicolás, Abstract Este trabajo trata sobre sistemas de reconocimiento de voz, tomando una arquitectura típica para

Más detalles

Procesamiento de voz - Reconocimiento de voz II

Procesamiento de voz - Reconocimiento de voz II Procesamiento de voz - Reconocimiento de voz II Marc S. Reßl Roxana Saint-Nom 2009 Ingeniería Electrónica Instituto Tecnológico de Buenos Aires Reconocimiento de voz Las técnicas que vimos hasta ahora

Más detalles

EL reconocimiento biométrico consiste en el uso de características

EL reconocimiento biométrico consiste en el uso de características Verificador de locutores implementado en un dspic Maximiliano Lizondo, Pablo Agüero, Alejandro J. Uriz, Juan C. Tulli and Esteban González Laboratorio de Comunicaciones - Facultad de Ingeniería - Universidad

Más detalles

MÁQUINAS DE VECTORES SOPORTE (SVM) PARA RECONOCIMIENTO DE LOCUTOR E IDIOMA

MÁQUINAS DE VECTORES SOPORTE (SVM) PARA RECONOCIMIENTO DE LOCUTOR E IDIOMA UNIVERSIDAD AUTÓNOMA DE MADRID ESCUELA POLITÉCNICA SUPERIOR MÁQUINAS DE VECTORES SOPORTE (SVM) PARA RECONOCIMIENTO DE LOCUTOR E IDIOMA -RESUMEN DEL PROYECTO FIN DE CARRERA- XXVIII Convocatoria premios

Más detalles

Podriamos conversar con las maquinas como lo hacemos con los humanos?

Podriamos conversar con las maquinas como lo hacemos con los humanos? Que veremos? 1. Introducción 2. Trabajos Previos 3. Procesamiento de la Señal 4. Coeficientes MFCC 5. Trasformada Wavelet 6. Extracción de características usando wavelets 7. Experimentos y Resultados 8.

Más detalles

INSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5

INSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5 INSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5 PROGRAMA ACADÉMICO: LICENCIATURA EN INGENIERIA INDUSTRIAL TIPO EDUCATIVO: INGENIERIA MODALIDAD: MIXTA SERIACIÓN: NINGUNA CLAVE DE LA ASIGNATURA: 126 CICLO: QUINTO

Más detalles

-matemáticas aplicadas: análisis numérico, ecuaciones diferenciales parciales, computación

-matemáticas aplicadas: análisis numérico, ecuaciones diferenciales parciales, computación Áreas de Interés -control automático -ingeniería eléctrica -ingeniería industrial Especialidad científica -computadoras digitales, analógicas e híbridas -problemas de simulación analógica, digital e híbrida

Más detalles

Reconocimiento Automático de Voz

Reconocimiento Automático de Voz Reconocimiento Automático de Voz Presentación basada en las siguientes Referencias: [1] Rabiner, L. & Juang, B-H.. Fundamentals of Speech Recognition, Prentice Hall, N.J., 1993. [2] Rabiner, L. & Juang,

Más detalles

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA DE INVESTIGACIÓN Y POSGRADO

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA DE INVESTIGACIÓN Y POSGRADO SIP-30 INSTITUTO POLITÉCNICO NACIONAL SECRETARIA DE INVESTIGACIÓN Y POSGRADO DIRECCIÓN DE POSGRADO FORMATO GUÍA PARA REGISTRO DE ASIGNATURAS Hoja 1 de 3 I. DATOS DEL PROGRAMA Y LA ASIGNATURA 1.1 NOMBRE

Más detalles

Sistemas de Reconocimiento de Patrones

Sistemas de Reconocimiento de Patrones Sistemas de Reconocimiento de Patrones p. 1/33 Sistemas de Reconocimiento de Patrones Luis Vázquez GTI - IIE Facultad de Ingeniería Universidad de la República Sistemas de Reconocimiento de Patrones p.

Más detalles

Carlos Cuevas-Covarrubias (Mexico): Mutual Principal Components, reduction of dimensionality in statistical classification

Carlos Cuevas-Covarrubias (Mexico): Mutual Principal Components, reduction of dimensionality in statistical classification Carlos Cuevas-Covarrubias (Mexico): Mutual Principal Components, reduction of dimensionality in statistical classification Mutual Principal Components, reduction of dimensionality in statistical classification

Más detalles

EXTRACCIÓN DE INFORMACIÓN DE SEÑALES DE VOZ PARA EL AGRUPAMIENTO POR LOCUTORES DE LOCUCIONES ANÓNIMAS

EXTRACCIÓN DE INFORMACIÓN DE SEÑALES DE VOZ PARA EL AGRUPAMIENTO POR LOCUTORES DE LOCUCIONES ANÓNIMAS UNIVERSIDAD AUTÓNOMA DE MADRID ESCUELA POLITÉCNICA SUPERIOR PROYECTO FIN DE CARRERA EXTRACCIÓN DE INFORMACIÓN DE SEÑALES DE VOZ PARA EL AGRUPAMIENTO POR LOCUTORES DE LOCUCIONES ANÓNIMAS Ingeniería de Telecomunicaciónn

Más detalles

DR. JESÚS FABIÁN LÓPEZ PÉREZ

DR. JESÚS FABIÁN LÓPEZ PÉREZ DR. JESÚS FABIÁN LÓPEZ PÉREZ A. DATOS PERSONALES 1. Nombre Jesús Fabián López Pérez 2. Domicilio 3. Teléfono Particular 4. E-mail : fabian.lopezpz@gmail.com 5. Teléfono y fax trabajo 6. Fecha de Nacimiento

Más detalles

ALGORITMO CON COMPRESIÓN OPTIMA PARA MODELOS MIXTOS LINEALES RALOS

ALGORITMO CON COMPRESIÓN OPTIMA PARA MODELOS MIXTOS LINEALES RALOS ALGORITMO CON COMPRESIÓN OPTIMA PARA MODELOS MIXTOS LINEALES RALOS S. Pazos, M. Hurtado y C. Muravchik LEICI, Dto Electrotecnia, FI-UNLP INTRODUCCIÓN En varios problemas de procesamiento de señales los

Más detalles

PROGRAMA DE CURSO. Señales y Sistemas II. Signals and Systems II Horas de Cátedra. Horas de Trabajo Personal ,5 1,5 5,0

PROGRAMA DE CURSO. Señales y Sistemas II. Signals and Systems II Horas de Cátedra. Horas de Trabajo Personal ,5 1,5 5,0 Código Nombre EL 4003 Nombre en Inglés SCT Unidades Docentes PROGRAMA DE CURSO Señales y Sistemas II Signals and Systems II Horas de Cátedra Horas Docencia Auxiliar Horas de Trabajo Personal 6 10 3,5 1,5

Más detalles

Reconocimiento de Locutor (Biometría Vocal)

Reconocimiento de Locutor (Biometría Vocal) Reconocimiento de Locutor (Biometría Vocal) Daniel Ramos Castro daniel.ramos@uam.es ATVS Biometric Recognition Group http://atvs.ii.uam.es Universidad Autónoma de Madrid Sumario Introducción: voz e identidad

Más detalles

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA ELÉCTRICA

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA ELÉCTRICA UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA ELÉCTRICA ROBUSTEZ A VARIABILIDAD DE CANAL EN RECONOCIMIENTO DE PATRONES ACÚSTICOS CON APLICACIONES EN ENSEÑANZA

Más detalles

SOMI XVIII Congreso de Instrumentación TECNOLOGIAS DE LA INFORMACION RAM1847

SOMI XVIII Congreso de Instrumentación TECNOLOGIAS DE LA INFORMACION RAM1847 Reconocedor de Voz Adaptado para mejorar la pronunciación de Inglés en Hispanos M.A. García Galván, R. Aréchiga Martínez Universidad Autónoma Metropolitana, Departamento de Electrónica. Av San Pablo #

Más detalles

Probabilidad y Estadística

Probabilidad y Estadística Programa de la Asignatura: Código: 23 Probabilidad y Estadística Carrera: Ingeniería en Computación Plan: 2013 Carácter: Obligatoria Unidad Académica: Secretaría Académica Curso: Tercer año Primer cuatrimestre

Más detalles

IDENTIFICACION BIOMETRICA DE LOCUTORES PARA EL AMBITO FORENSE: ESTADO DEL ARTE

IDENTIFICACION BIOMETRICA DE LOCUTORES PARA EL AMBITO FORENSE: ESTADO DEL ARTE Buenos Aires, 5, 6 y 7 de noviembre de 2008 IDENTIFICACION BIOMETRICA DE LOCUTORES PARA EL AMBITO FORENSE: ESTADO DEL ARTE Felipe Ochoa (a), César San Martin (b), Roberto Carrillo (b). (a) Laboratorio

Más detalles

EL4005 Principios de Comunicaciones Clase No.24: Demodulación Binaria

EL4005 Principios de Comunicaciones Clase No.24: Demodulación Binaria EL4005 Principios de Comunicaciones Clase No.24: Demodulación Binaria Patricio Parada Departamento de Ingeniería Eléctrica Universidad de Chile 5 de Noviembre de 2010 1 of 34 Contenidos de la Clase (1)

Más detalles

PRÁCTICA I. Ejercicios Teóricos

PRÁCTICA I. Ejercicios Teóricos PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las

Más detalles

Verificación de tema en sistemas de diálogo mediante la aplicación de un test de hipótesis bayesiano

Verificación de tema en sistemas de diálogo mediante la aplicación de un test de hipótesis bayesiano Procesamiento del Lenguaje Natural, núm. 35 (2005), pp. 221-227 recibido 29-04-2005; aceptado 01-06-2005 Verificación de tema en sistemas de diálogo mediante la aplicación de un test de hipótesis bayesiano

Más detalles

Cómo medir la validez y fiabilidad de sistemas de análisis forense. Geoffrey-Stewart Morrison. p p(e H )

Cómo medir la validez y fiabilidad de sistemas de análisis forense. Geoffrey-Stewart Morrison. p p(e H ) Cómo medir la validez y fiabilidad de sistemas de análisis forense Geoffrey-Stewart Morrison p(e H ) p p(e H ) d Preocupaciones Marco lógicamente correcto para la evaluación de las evidencias - ENFSI Guideline

Más detalles

Comparación de clasificadores para el reconocimiento de notas musicales

Comparación de clasificadores para el reconocimiento de notas musicales Comparación de clasificadores para el reconocimiento de notas musicales Omar Velázquez López, José Luis Oropeza Rodríguez, Sergio Suárez Guerra Instituto Politécnico Nacional, Centro de Investigación en

Más detalles

Aprendizaje Automático

Aprendizaje Automático Regresión Lineal: Descenso de Gradiente Árboles de Regresión: M5 Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática

Más detalles

Técnicas Avanzadas de Visión por Computador

Técnicas Avanzadas de Visión por Computador Técnicas Avanzadas de Visión por Computador Sistemas Informáticos Avanzados Índice Introducción. Registrado basado en grises. Funciones criterio. Métodos de minimización. Registrado multimodal. Registrado

Más detalles

CURRICULUM VITAE. F O R M A C I Ó N A C A D É M I C A (Iniciar con el grado más reciente y presentar información de los últimos cinco años)

CURRICULUM VITAE. F O R M A C I Ó N A C A D É M I C A (Iniciar con el grado más reciente y presentar información de los últimos cinco años) CURRICULUM VITAE Domicilio: Teléfono de casa: Celular: Correo electrónico: RFC: CURP: Arroyo Díaz Salvador Antonio Blvd. Cholula Huejotzingo km 6 Las Moras Residencial (222) 2404081 044 22 24 60 47 49

Más detalles

3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL Descripción del Problema: La identificación de un sistema consiste en

3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL Descripción del Problema: La identificación de un sistema consiste en 301 3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL 3.7.1 Descripción del Problema: La identificación de un sistema consiste en determinar una función que relacione las variables de entrada con las

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Ensayos de consolidación (2)

Ensayos de consolidación (2) Ensayos de consolidación (2) Análisis de las curvas asiento-tiempo Células con medida de presión (Célula Rowe) Ensayos con carga continua Resumen Análisis de las curvas asiento tiempo Método de Casagrande

Más detalles

Estimación a priori de umbrales dependientes del locutor

Estimación a priori de umbrales dependientes del locutor Estimación a priori de umbrales dependientes del locutor Javier R. Saeta 1, Javier Hernando 2 1 Biometric Technologies, S.L.. Barcelona. j.rodriguez@biometco.com 2 TALP Research Center, Universitat Politècnica

Más detalles

Organización. Autómatas probabilísticos (AEFP) Definición de Autómata. Modelo de Markov. Ejemplo de AEFP. Modelos basados en autómatas probabilísticos

Organización. Autómatas probabilísticos (AEFP) Definición de Autómata. Modelo de Markov. Ejemplo de AEFP. Modelos basados en autómatas probabilísticos Organización Modelos basados en autómatas probabilísticos Bioingeniería I Parte I Autómatas determinísticos Autómatas celulares. Aplicación modelos tejido excitable. Parte II Autómatas probabilísticos

Más detalles

Universidad Autónoma de Madrid. Escuela politécnica superior. Proyecto fin de carrera

Universidad Autónoma de Madrid. Escuela politécnica superior. Proyecto fin de carrera Universidad Autónoma de Madrid Escuela politécnica superior Proyecto fin de carrera ANÁLISIS DE COMPENSACIÓN DE VARIABILIDAD EN RECONOCIMIENTO DE LOCUTOR APLICADO A DURACIONES CORTAS Ingeniería de Telecomunicación

Más detalles

Ingeniería y Arquitectura Programa de asignatura

Ingeniería y Arquitectura Programa de asignatura Identificación de la asignatura Nombre de la asignatura: Métodos Numéricos Clave: MIES Área académica: Ingenierías y Arquitectura Total créditos: 04 Teórico Práctico 3 1 Programa académico al que pertenece:

Más detalles

Introducción al Tratamiento de Señales

Introducción al Tratamiento de Señales Introducción al Tratamiento de Señales Introducción Presenta: Mauricio Nava Flores -1- Contenido 1. Objetivo general del curso 2. Antecedentes académicos 3. Desarrollo del curso 4. Temario 5. Evaluación

Más detalles

ESTADÍSTICA BAYESIANA Y TEORÍA DE DECISIONES

ESTADÍSTICA BAYESIANA Y TEORÍA DE DECISIONES MISIÓN Formar profesionales altamente capacitados, desarrollar investigación y realizar actividades de extensión en Matemáticas y Computación, así como en sus diversas aplicaciones. ESTADÍSTICA BAYESIANA

Más detalles

ECUALIZACIÓN DE HISTOGRAMAS ADAPTATIVA EN EL DOMINIO CEPSTRAL PARA RECONOCIMIENTO DE VOZ ROBUSTO

ECUALIZACIÓN DE HISTOGRAMAS ADAPTATIVA EN EL DOMINIO CEPSTRAL PARA RECONOCIMIENTO DE VOZ ROBUSTO ECUALIZACIÓN DE HISTOGRAMAS ADAPTATIVA EN EL DOMINIO CEPSTRAL PARA RECONOCIMIENTO DE VOZ ROBUSTO Carmen Benítez, Ángel de la Torre, José C. Segura, Javier Ramírez, Antonio J. Rubio Dpto. Electrónica y

Más detalles

Paul McCartney es un impostor?

Paul McCartney es un impostor? Paul McCartney es un impostor? Introducción al Reconocimiento Forense de Hablantes Miguel Martínez Soler Laboratorio de Investigaciones Sensoriales (LIS) INIGEM, CONICET-UBA, Hospital de Cĺınicas Nuestros

Más detalles

COMPENSADOR DE TEMPERATURA PARA CELDAS DE CARGA

COMPENSADOR DE TEMPERATURA PARA CELDAS DE CARGA COMPENSADOR DE TEMPERATURA PARA CELDAS DE CARGA 1 Roberto Salas, 2 M. Velasco 1 MIDE, Metrología Integral y Desarrollo S. A. de C. V., Querétaro, México. 2 CENAM (Centro Nacional de Metrología), Querétaro,

Más detalles

Lugar y fecha de nacimiento: Madrid, 22 de abril de 1965 Teléfono:

Lugar y fecha de nacimiento: Madrid, 22 de abril de 1965 Teléfono: CURRICULUM VITAE Datos personales: Nombre: José Alberto Apellidos: Mauricio Arias Lugar y fecha de nacimiento: Madrid, 22 de abril de 1965 Teléfono: 91 394 2597 Correo electrónico: jamauri@ccee.ucm.es

Más detalles

Trabajo extra clase: 1 Total de horas semestre: 80 Fecha de actualización: Febrero Materia requisito:

Trabajo extra clase: 1 Total de horas semestre: 80 Fecha de actualización: Febrero Materia requisito: UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: Clave: FACULTAD DE INGENIERÍA DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: Área en plan de estudios: Créditos 5 Total de horas

Más detalles

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA PROGRAMA ANALÍTICO FIME Nombre de la unidad de aprendizaje: Reconocimiento de patrones Frecuencia semanal: 3 horas. Horas

Más detalles

UNIVERSIDAD DE CONCEPCIÓN, DEPTO. INGENIERÍA MATEMÁTICA Concepción, Chile

UNIVERSIDAD DE CONCEPCIÓN, DEPTO. INGENIERÍA MATEMÁTICA Concepción, Chile Fabián Fabian Flores Bazán 02/07/2016 03:29 Portal del Investigador Antecedentes del Investigador Cargo / Full Professor UNIVERSIDAD DE CONCEPCIÓN, DEPTO. INGENIERÍA MATEMÁTICA Concepción, Resumen Nonconvex

Más detalles

CURRICULUM VITAE RUBÉN MULLOR IBÁÑEZ. Septiembre 2009

CURRICULUM VITAE RUBÉN MULLOR IBÁÑEZ. Septiembre 2009 CURRICULUM VITAE Septiembre 2009 1 Datos Personales Nombre: Rubén Mullor Ibáñez Teléfono: 965 90 36 87 Fax: 965 90 36 67 Correo electrónico (e -mail): ruben.mullor@ua.es Formación Académica Licenciatura:

Más detalles

Carrera: MTE Participantes Representante de las academias de ingeniería Mecatrónica de los Institutos Tecnológicos.

Carrera: MTE Participantes Representante de las academias de ingeniería Mecatrónica de los Institutos Tecnológicos. .- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos: Matemáticas Discretas MTE-08 --6.- HISTORIA DEL PROGRAMA Lugar y fecha de elaboración

Más detalles

Optimización de una Interfaz Cerebro Computador Basada en Imaginación Motora Usando Emotiv Epoc

Optimización de una Interfaz Cerebro Computador Basada en Imaginación Motora Usando Emotiv Epoc Optimización de una Interfaz Cerebro Computador Basada en Imaginación Motora Usando Emotiv Epoc J. Castillo 1, 2, B. Longo 2, A. Floriano 2, E. Caicedo 1, T. Bastos 2 1 Universidad del Valle: 1300 Av.

Más detalles

ANALISIS DISCRIMINANTE, ESTADISTICA GERENCIAL

ANALISIS DISCRIMINANTE, ESTADISTICA GERENCIAL UNIVERSIDAD DE PUERTO RICO Recinto de Río Piedras Facultad de Administración de Empresas Instituto de Estadística ANALISIS DISCRIMINANTE, HERRAMIENTA EN ESTADISTICA GERENCIAL José C. Vega Vilca, PhD Presentación

Más detalles

Seriación obligatoria antecedente: Análisis Espectral de Señales y Variable Compleja Aplicada a la Geofísica

Seriación obligatoria antecedente: Análisis Espectral de Señales y Variable Compleja Aplicada a la Geofísica UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO INTRODUCCIÓN AL DISEÑO DE FILTROS DIGITALES 1743 7 09 Asignatura Clave Semestre Créditos Ingeniería en Ciencias de la

Más detalles

Asignaturas antecedentes y subsecuentes

Asignaturas antecedentes y subsecuentes PROGRAMA DE ESTUDIOS Reconocimiento de Patrones Área a la que pertenece: Área de Formación Integral Profesional Horas teóricas: 3 Horas prácticas: 1 Créditos: 7 Clave: F0182 Asignaturas antecedentes y

Más detalles

Entrenamiento discriminativo maximizando una distancia entre modelos de clases

Entrenamiento discriminativo maximizando una distancia entre modelos de clases Entrenamiento discriminativo maximizando una distancia entre modelos de clases Milton O. Sarria-Paja 1 Cesar G. Castellanos-Domínguez 2 Resumen: En este trabajo se presenta una técnica de entrenamiento

Más detalles

Tablas de estadística

Tablas de estadística Tablas de estadística FUOC 3 Tablas de estadística Tabla 1. Probabilidades de la distribución binomial (n; p) FUOC 4 Tablas de estadística Tabla 1 (Continuación). Probabilidades de la distribución binomial

Más detalles

TEMA 5: RECONOCIMIENTO DE LOCUTORES Y DE VOZ.

TEMA 5: RECONOCIMIENTO DE LOCUTORES Y DE VOZ. TEM 5: RECONOCMENTO E LOCUTORES Y E VOZ. 5.. Reconocimiento de locutores.. Entrenamiento: se extraen parámetros de cada usuario del sistema.. uncionamiento: a partir de las señales, el sistema tomará la

Más detalles

Análisis Avanzado de de Series Temporales Curso de Macroeconometría Doctorado en Economía (UPV-EHU)

Análisis Avanzado de de Series Temporales Curso de Macroeconometría Doctorado en Economía (UPV-EHU) Análisis Avanzado de de Series Temporales Curso de Macroeconometría Doctorado en Economía (UPV-EHU) Josu Arteche 2006-2007 (15 horas) 1. Series Temporales y el Dominio de la Frecuencia 1.1 Ciclos 1.2 Funciones

Más detalles

Visión Artificial Avanzada

Visión Artificial Avanzada Visión Artificial Avanzada Máster de Sistemas Inteligentes Instituto de Estudios de Posgrado Universidad de Córdoba Curso académico: 2015 2016 Trabajo del tema 1.- Introducción a la Visión Artificial Se

Más detalles

Ejercicios resueltos del capítulo 4

Ejercicios resueltos del capítulo 4 Ejercicios resueltos del capítulo 4 Ejercicios impares resueltos..a Calcular los autovalores y subespacios invariantes asociados a la matriz: A = Calculamos el polinomio característico y resolvemos: λ

Más detalles

Tema 2. Introducción a la Estadística Bayesiana

Tema 2. Introducción a la Estadística Bayesiana 2-1 Tema 2 Introducción a la Estadística Bayesiana El teorema de Bayes Ejemplo Interpretación Ejemplo: influencia de la distribución a priori Ejemplo: densidad de flujo Probabilidad bayesiana Ejemplo:

Más detalles

Procesamiento de voz - Reconocimiento de voz I

Procesamiento de voz - Reconocimiento de voz I Procesamiento de voz - Reconocimiento de voz I Marc S. Reßl Roxana Saint-Nom 2009 Ingeniería Electrónica Instituto Tecnológico de Buenos Aires Reconocimiento de voz El reconocimiento automático de voz

Más detalles

Núcleo Académico Básico

Núcleo Académico Básico Núcleo Académico Básico El Núcleo Académico Básico de la Maestría en Ciencias de la Computación está integrado por: 1. Betania Hernández Ocaña Doctora en Ciencias de la Computación con mención honorífica

Más detalles

Redes de Neuronas de Base Radial

Redes de Neuronas de Base Radial Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta

Más detalles

Curso: Métodos de Monte Carlo Unidad 4, Sesión 11: Sorteo de variables aleatorias con distribución arbitraria

Curso: Métodos de Monte Carlo Unidad 4, Sesión 11: Sorteo de variables aleatorias con distribución arbitraria Curso: Métodos de Monte Carlo Unidad 4, Sesión 11: Sorteo de variables aleatorias con distribución arbitraria Departamento de Investigación Operativa Instituto de Computación, Facultad de Ingeniería Universidad

Más detalles

RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO

RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: RECONOCIMIENTO DE PATRONES TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 3 : RECONOCIMIENTO

Más detalles

Reconocimiento del locutor dependiente del texto con modelos acústicos del habla

Reconocimiento del locutor dependiente del texto con modelos acústicos del habla Reconocimiento del locutor dependiente del texto con modelos acústicos del habla Ing. Ivis Rodés Alfonso, Dr. C. José Ramón Calvo de Lara Centro de Aplicaciones de Tecnología de Avanzada, 7a #21812 e/

Más detalles

Bases estadísticas del reconocimiento de patrones

Bases estadísticas del reconocimiento de patrones Bases estadísticas del reconocimiento de patrones César Martínez cmartinez _AT_ fich.unl.edu.ar Inteligencia Computacional FICH-UNL Percepción humana Tarea muuuuy simple: Cuántas llaves hay? Inteligencia

Más detalles

Filtrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional

Filtrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional Filtrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional Mario A. Bueno a, Josué Álvarez-Borrego b, Leonardo Acho a y Vitaly Kober c mbueno@cicese.mx,

Más detalles

Diplomado en Ingeniería Geotécnica (DIG-MIEG)

Diplomado en Ingeniería Geotécnica (DIG-MIEG) Diplomado en Ingeniería Geotécnica (DIG-MIEG) 1 DESCRIPCIÓN Con el Diplomado en Ingeniería Geotécnica los alumnos aprenden a modelar el comportamiento de suelos naturales y antropogénicos para el diseño

Más detalles

USO DEL FILTRO DE KALMAN PARA ESTIMAR LA TENDENCIA DE UNA SERIE

USO DEL FILTRO DE KALMAN PARA ESTIMAR LA TENDENCIA DE UNA SERIE DIVISIÓN ECONÓMICA DEPARTAMENTO DE INVESTIGACIONES ECONÓMICAS INFORME TÉCNICO DIE-87-003-IT USO DEL FILTRO DE KALMAN PARA ESTIMAR LA TENDENCIA DE UNA SERIE Ana Cecilia Kikut V. OCTUBRE, 003 Entre los diferentes

Más detalles

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Más detalles

Contenidos. Importancia del tema. Conocimientos previos para este tema?

Contenidos. Importancia del tema. Conocimientos previos para este tema? Transformación conforme Contenidos Unidad I: Funciones de variable compleja. Operaciones. Analiticidad, integrales, singularidades, residuos. Funciones de variable real a valores complejos. Funciones de

Más detalles

El modelo de azar proporcional: la regresión de Cox

El modelo de azar proporcional: la regresión de Cox El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten

Más detalles

RECONOCIMIENTO DE HABLA Y SISTEMAS DE DIÁLOGO

RECONOCIMIENTO DE HABLA Y SISTEMAS DE DIÁLOGO MÁSTER OFICIAL EN LENGUA ESPAÑOLA Y LITERATURA HISPÁNICA Aplicación de las tecnologías de la información y de la comunicación (TIC) a la Lengua española Tecnologías del habla, Carme de-la-mota RECONOCIMIENTO

Más detalles

(1) Métodos y materiales

(1) Métodos y materiales Desarrollo de un filtro en el dominio de la frecuencia para procesamiento digital de imágenes de huella dactilar basado en la Transformada Rápida de Fourier Modificada. Resumen. El análisis en frecuencia

Más detalles

PROGRAMA DE CURSO. Código Nombre MA3402 Estadística Nombre en Inglés Statistics SCT Requisitos. DIM Resultados de Aprendizaje

PROGRAMA DE CURSO. Código Nombre MA3402 Estadística Nombre en Inglés Statistics SCT Requisitos. DIM Resultados de Aprendizaje > < ; U Q R ;?C: VT 2 +D :?CB J B > > ; S6D :? < ;? ; C?C : >? ; W( U C > X?2 > R+DE?C : < > ; ; 9 : : R > ; Y < > < ; U Q R ;?C: VT 2 +D :?C B J B > > ; S6D :? < ;? ; C?C : >? ; W( U C > X?2 > R+DE?C

Más detalles

Análisis de un Reconocedor de Género Basado en Técnicas Lineales

Análisis de un Reconocedor de Género Basado en Técnicas Lineales Universidad de Buenos Aires Facultad de Ciencias Exactas y Naturales Departamento de Computación Análisis de un Reconocedor de Género Basado en Técnicas Lineales Trabajo de cátedra: Introducción al Procesamiento

Más detalles

Diseños D-óptimos bayesianos para modelos lineales heteroscedásticos

Diseños D-óptimos bayesianos para modelos lineales heteroscedásticos XXVI Simposio Internacional de Estadística 2016 Sincelejo, Sucre, Colombia, 8 al 12 de Agosto de 2016 Diseños D-óptimos bayesianos para modelos lineales heteroscedásticos Catalina Patiño Bustamante 1,a,

Más detalles

Método de mínimos cuadrados (Continuación)

Método de mínimos cuadrados (Continuación) Clase No. 11: MAT 251 Método de mínimos cuadrados (Continuación) Dr. Alonso Ramírez Manzanares CIMAT A.C. e-mail: alram@ cimat.mx web: http://www.cimat.mx/ alram/met_num/ Dr. Joaquín Peña Acevedo CIMAT

Más detalles

UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS

UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS UNIVERSIDAD DE MÁLAGA ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA INGENIERÍA SUPERIOR EN INFORMÁTICA ANTEPROYECTO UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS DIRECTOR DEL PROYECTO: FIRMA:

Más detalles

3. ANÁLISIS DE SEÑALES

3. ANÁLISIS DE SEÑALES 3. ANÁLISIS DE SEÑALES 3.1 REGISTRO Y TRATAMIENTO DE SEÑALES Una señal se define como la historia de los valores de aceleración que mide un acelerómetro en determinado tiempo para un punto específico.

Más detalles

Modelo de Computación Cuántica. Jesús García López de Lacalle

Modelo de Computación Cuántica. Jesús García López de Lacalle Modelo de Jesús García López de Lacalle Grupo de Investigación Mathematical Modeling and Biocomputing (MMBC) ETS de Ingeniería de Sistemas Informáticos Universidad Politécnica de Madrid jglopez@etsisi.upm.es

Más detalles

Procesos Estocásticos I

Procesos Estocásticos I UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Ciencias Plan de estudios de la Licenciatura en Actuaría Procesos Estocásticos I Clave 0630 Modalidad Semestre 5 Créditos 10 Área Campo de conocimiento

Más detalles

Biometría por voz: fundamentos, tecnología y aplicaciones

Biometría por voz: fundamentos, tecnología y aplicaciones Biometría por voz: fundamentos, tecnología y aplicaciones Néstor Becerra Yoma, PhD Laboratorio de Procesamiento y Transmisión de Voz Departamento de Ingeniería Eléctrica Universidad de Chile Tel: (02)29784205

Más detalles

Reconocimiento Automático de Voz basado en Técnicas de Comparación de Patrones

Reconocimiento Automático de Voz basado en Técnicas de Comparación de Patrones Reconocimiento Automático de Voz basado en Técnicas de Comparación de Patrones Presentación basada en las siguientes Referencias: Juan Carlos Gómez [] Rabiner, L. & Juang, B-H.. Fundamentals of Speech

Más detalles

Propagación numérica de ondas de choque acústicas

Propagación numérica de ondas de choque acústicas Propagación numérica de ondas de choque acústicas Informe semestral Roberto Velasco Segura 1 Director: Dr. Pablo Luis Rendón Garrido 1 1 Centro de Ciencias Aplicadas y Desarrollo Tecnológico Universidad

Más detalles

TECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS

TECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS UNIVERSIDAD POLITECNICA DE CATALUÑA Departamento de Teoria de la señal y comunicaciones TECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS

Más detalles

Reducción del ruido de cuantificación en señales suaves usando proyecciones sobre conjuntos convexos reducibles. Luis Mancera Pascual DECSAI VIP

Reducción del ruido de cuantificación en señales suaves usando proyecciones sobre conjuntos convexos reducibles. Luis Mancera Pascual DECSAI VIP Reducción del ruido de cuantificación en señales suaves usando proyecciones sobre conjuntos convexos reducibles Luis Mancera Pascual DECSAI VIP ÍNDICE Motivación Introducción Teórica a POCS POCS y minimización

Más detalles

DSAP - Procesado Digital de Audio y Voz

DSAP - Procesado Digital de Audio y Voz Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 230 - ETSETB - Escuela Técnica Superior de Ingeniería de Telecomunicación de Barcelona 739 - TSC - Departamento de Teoría

Más detalles

Resumen. El análisis de componentes principales (PCA) es una técnica multivariada utilizada

Resumen. El análisis de componentes principales (PCA) es una técnica multivariada utilizada Comparación de las aproximaciones χ 2 para la prueba de igualdad de los valores propios en el PCA Eduard Alexander Gañán Cárdenas a, Juan Carlos Correa Morales b Email: eaganan@unal.edu.co a. Estudiante

Más detalles

Análisis Espacial aplicando Técnicas de Inteligencia Artificial

Análisis Espacial aplicando Técnicas de Inteligencia Artificial Análisis Espacial aplicando Técnicas de Inteligencia Artificial OBJETIVO. Proporcionar al estudiante técnicas variadas de inteligencia artificial para el tratamiento de datos espaciales y presentar cómo

Más detalles

Aplicación de un Filtro Stack en Imágenes con Ruido Speckle

Aplicación de un Filtro Stack en Imágenes con Ruido Speckle Aplicación de un Filtro Stack en Imágenes con Ruido Speckle María E Buemi, Juliana Gambini, Marta Mejail y Julio Jacobo Berllés Departamento de Computación,FCEyN,UBA,Buenos Aires,Argentina {mebuemi; jgambini;

Más detalles