VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
|
|
- Gonzalo Martín Poblete
- hace 6 años
- Vistas:
Transcripción
1 VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR ESPECIALIDAD: Comunicaciones y Electrónica Juan Arturo Nolazco Flores PhD Ingeniería Informática Fecha de Ingreso: 15 de Noviembre, 2012.
2 Especialidad: Comunicaciones y Electrónica 2
3 CONTENIDO RESUMEN EJECUTIVO INTRODUCCIÓN SISTEMAS CONVENCIONALES [3, 4] ESTADO DEL ARTE: JFA (Joint Factor Analysis) [5, 6] ESTIMACIÓN DISCRIMINATIVA: MVE ( Minimum Verification Error ) MINIMIZANDO EL ÁREA BAJO LA CURVA DET RESULTADOS Base de Datos Condiciones de señal limpia Condiciones de señal con ruido CONCLUSIONES REFERENCIAS BIBLIOGRAFÍA AGRADECIMIENTOS CURRICULUM VITAE Especialidad: Comunicaciones y Electrónica 3
4 RESUMEN EJECUTIVO En el presente trabajo se presentó un sistema para Verificación de Locutor basado en MVE (Minimum Verification Error), el cual es un método discriminativo que minimiza el área bajo la curva en lugar de optimizar un punto de operación. Los resultados en señales limpias utilizando la técnica MVE mejoró a la técnica convencional por más del 15.30%, y minimizando el área bajo la curva todavía mejoró otro 2.22% mas. Aplicando la minimización del área bajo la curva sobre JFA mejoró el resultado por 1.16% comparado con JFA puro. Los resultados de AUC-JFA y AUC-MVE en señales corruptas con ruido aditivo de diferentes tipos mejoran en un 6.05% y 10.49% respectivamente con respecto al rendimiento de la técnica convencional. Palabras clave: verificación de personas, biométricas, reconocimiento de patrones, reconocimiento de personas Especialidad: Comunicaciones y Electrónica 4
5 1. INTRODUCCIÓN Los sistemas de reconocimiento biométrico utilizan alguna característica de la persona para reconocerlo. Estas características pueden ser intrusivas como pruebas de sangre; o puede ser no intrusiva como características del rostro, de la palma de la mano, la forma de caminar, la forma de hablar, el iris, etc. Los sistemas de reconocimiento biométrico de personas se dividen en sistemas de identificación y sistemas de verificación. En los sistemas de identificación se desea obtener la persona que tiene las características más parecidas a las presentadas. Generalmente, el universo de personas que se busca es limitado, por ejemplo a un departamento, a una empresa, a una ciudad, a afiliados, etc. En caso de que se utilice identificación biométrica para una investigación forense, entonces la principal amenaza para estos sistemas es que la persona va a intente hablar diferente para evitar ser identificado. En un sistema de verificación, el sistema coteja las características biométricas del individuo con un modelo acústico de la persona quien dice ser. El sistema debe de confirmar/negar si la personas es quien dice ser. Los sistemas de verificación biométricas son generalmente utilizados para control de acceso. La principal amenaza para los sistemas de verificación de personas es que el individuo intente imitar a la otra persona. Los humanos utilizamos como uno de los medios de comunicación el sonido generado por nuestra sistema bucal. La voz generada depende de muchas variables como el tamaño, grosor, elasticidad de nuestras cuerdas bucales, el tamaño de nuestra laringe, boca, etc. Tal es la diferencia entre individuos de estas características que la voz se puede utilizar como biométrica. En el presente trabajo se presenta un sistema que se han diseñado y desarrollado para realizar la tarea de verificación del locutor. Con este sistema se ha participado en evaluaciones internacionales y hemos obtenido muy buenos resultados. En la sección 2 se presenta la arquitectura de un sistema para ASV convencional. En esta arquitectura se presenta la función de cada módulo de la arquitectura. En la sección 3 se presenta la técnica JFK (Joint Factor Analysis) que se utiliza en un sistemas ASV para separar las características del canal de las características de los usuarios. En la sección 4 se presenta una técnica discriminativa que aplicamos a un sistema ASV. Especialidad: Comunicaciones y Electrónica 5
6 En la sección 5 se presenta una técnica de optimización que se aplica a diferentes técnicas utilizadas en sistemas ASVs. En la sección 6 se presentan resultados tanto de técnicas tradicionales como las que hemos desarrollado. En la sección 7 se presentan las Conclusiones. Especialidad: Comunicaciones y Electrónica 6
7 2. SISTEMAS CONVENCIONALES [3, 4] En la figura se muestra la arquitectura de nuestro sistema de Verificación de Locutor. Esta arquitectura tiene dos partes. La parte de entrenamiento de los modelos acústicos de los Locutores. La parte de evaluación del sistema utilizando los modelos acústicos de los Locutores. En el primer módulo de la arquitectura el pre-procesamiento de la señal de voz de los locutores objetivo, como locutores intrusos. En este módulo se procesa la señal de voz para obtener las características de la voz de los locutores. Lo deseable de estas características es que sean lo más diferenciadoras posibles entre locutores, tal que faciliten la verificación de los mismos. Este módulo es el mismo tanto en la parte de entrenamiento de los modelos acústico, como en la parte de evaluación del sistema. El procesamiento de la señal de voz se hace por segmentos de tiempo; cada segmento de tiempo con una duración de entre 20ms y 40ms. Esto se debe a que es importante que la señal analizada sea estacionaria; y resulta que la señal de voz generada por las personas es una señal estacionaria en segmentos pequeños (quasiestacionaria). Entonces podemos analizar la señal por intervalos pequeños en tiempo. En este intervalo de tiempo podemos obtener características como número de cruces por Cero (al graficar la señal), energía, máxima amplitud, periodo. También podemos obtener su espectro de Especialidad: Comunicaciones y Electrónica 7
8 Fourier y obtener otras características en función de la frecuencia como distribución de la energía y frecuencias de resonancia. En nuestro trabajo hemos encontrado buenos resultados para periodos de tiempo de 40ms y calculando la energía de este segment así como los coeficientes MFCC ( Mel Frequency Cepstral Coefficients ). Los MFCC se calculan primeramente calculando la Transformada Discreta de Fourier para cada segmento de tiempo ( STFT- Short-Time Discrete Fourier Transform ); después se calcula la Transformada Coseno del logaritmo de la magnitud de la energía para cada uno de los componentes de STFT. La transformada Coseno genera los MFCCs. Utilizamos también las características dinámicas de los coeficientes representadas por la primera y segunda derivada. En nuestro trabajo hemos encontrado buenos resultados para periodos de tiempo de 40ms, y para cada segmente obtenemos un vector de dimensión 58 (1 representando la energía de la señal, 19 coeficientes MFCC, y sus primeras y segundas derivadas). Con las características de la señal de voz de los locutores objetivos, el siguiente módulo del sección del entrenamiento son los módulos para Modelación Locutores Objetivos (Targets). Con las características de los locutores intrusos se crea un Modelo de Locutores Intrusos, lo que se le conoce como UBM (Universal Background Model). La modelación acústica de cada locutor es un GMM ( Gaussian Mixture Model ) que es una Cadena Escondida de Markov de un estado. Cada estado de la GMM tiene un vector con las medias de la energía y de los MFCCs, incluyendo su primer y segunda derivada; y el otro vector con las varianzas de la energía y de cada uno de los MFCCs, incluyendo sus primera y segunda derivada. Debido a la cantidad de datos que generalmente se encuentran en una tarea de Verificación de Locutores, la estimación de estos parámetros es utilizando MAP (Maximum A Posteriori). En la parte de la Evaluación, el locutor se identifica y genera una señal de voz, entonces primero calculamos los MFCCs de la señal de voz; después, calculamos las puntuaciones del locutor tanto para el modelo del locutor objetivo, como para el modelo UBM. Dados las dos puntuaciones, el problema de clasificación involucra dos hipótesis: que el usuario legítimo (quien dice ser), H!, o que el usuario sea un impostor, H!. Sea p! z H! la función de densidad condicional de la puntuación observada z generada por el locutor auténtico A. De la misma manera sea p! z H! la función de densidad condicional de la puntuación (score) observada z generada por locutores impostores de A. Especialidad: Comunicaciones y Electrónica 8
9 La densidad condicional p! z H! se estima con las puntuaciones de del mismo locutor A utilizando su modelo acústico. La densidad condicional p! z H! se estima con las puntuaciones de todos los impostores posibles utilizando el modelo acústico de A. Cuando todos los impostores comparten el mismo modelo entonces se le conoce como Modelo Universal (UBM- Universal Background Model) Si conocemos las densidades condicionales de p! z H! y p! z H!, entonces una prueba de Bayes, con el mismo costo de error en la clasificación por locutor, se basa en la taza de verosimilitud (likelihood ratio) para el locutor A [2,15] como se muestra a continuación: o en el dominio logarítmico λ! = p! z H! p! z H! λ! = log p! z H! log p! z H!. Entonces, el problema de clasificación es el siguiente: Si log p! z H! log p! z H! τ seleccione H! < τ seleccione H! Con el propósito de simplificar las figura que se presentan de aquí en adelante, vamos a simplificar la gráfica de la arquitectura como se muestra a continuación: Especialidad: Comunicaciones y Electrónica 9
10 3. ESTADO DEL ARTE: JFA (Joint Factor Analysis) [5, 6] El propósito de JFA es separar la voz del locutor y las características del canal. Esto es porque el canal crea distorsión en la señal, lo cual afecta la precisión para identificar las personas. En JFA, las medias de todas las Gaussianas en una GMM son concatenadas en un solo vector llamado, supervector M!,!! = {μ! μ! μ! }. El supervector M representa el GMM para la distribución de datos sobre cada tipo de canal Ch para el locutor S. M!,!! = m + Vy! + Ux!,!! + Dz! donde m es una media global de todos los locutors; V es un conjunto de voces características (eigenvoices) representando el subespacio en el que se ubican los componentes específicos de los locutors, M!,!!. U es un conjunto de canales característicos (eigenchannels) representando el subespacio sobre el cual están los componentes específicos de un canal. D es una matriz diagonal. y! es un vector con distribución Normal que representa los factores específicos del locutor S. x!,!! es un vector con distribución Normal que representa los factores específicos del locutor S sobre el canal Ch. z! es un vector con distribución Normal que representa un error residual; El entrenamiento de V, U y D es utilizando el algoritmo de Baum- Welch; El aprendizaje de y!, z! y x!,!! es utilizando procedimiento EM (Expectation Maximization) [6, 5]. Especialidad: Comunicaciones y Electrónica 10
11 4. ESTIMACIÓN DISCRIMINATIVA: MVE ( Minimum Verification Error ) Mientras que en una estimación convencionales el objetivo es aprender los parámetros de estas distribuciones que mejor se ajustan a los datos de entrenamiento utilizando un criterio de Máxima Verosimilitud (ML) sin explícitamente considerar la minimización de un punto de operación deseado. En un paradigma discriminativo podemos optimizar el rendimiento del sistema utilizando los datos de entrenamiento; esto es de las muestras positivas (del locutor objetivo (target)) y negativas (del locutor no objetivo (no target)). MVE (Minimum Verificaation error) es un método discriminativo que minimizan el Error Empírico (EE) de verificación en los datos de entrenamiento. Este método lo aplicamos a una tarea de Verificación del locutor [15], la arquitectura se presenta en la siguiente figura: Se puede observar que esta optimización agrega una etapa más de entrenamiento. La entrada a este segunda etapa es GMM MAP ; el proceso de actualización de parámetros es iterativo hasta que se cumple con el requisito de minimizar el EE de los datos de entrenamiento. Cuando el EE es mínimo entonces obtenemos como salida el modelo GMM MVE. A continuación se presente este proceso iterativo: Especialidad: Comunicaciones y Electrónica 11
12 Especialidad: Comunicaciones y Electrónica 12
13 5. MINIMIZANDO EL ÁREA BAJO LA CURVA DET El propósito de ASV es proveer una decisión confiable, ya sea aceptado o rechazado, dado un identidad reclamada y una frase hablada. Los errores posibles que puedes ocurrir son las Aceptaciones Falsas (FA-False Aceptances) y las Rechazos Falsos (FR- False Rejections). En el caso de los FA se acepta a un locutor no es el locutor objetivo; y en el caso del FR se rechaza incorrectamente a un locutor. En la práctica, al reducir el FA aumenta el FR, y viceversa. Si graficamos cada punto en una curva bidimensional con FA y FR obtendremos lo que se conoce como curva DET ( Detection Error Tradeoff ), como se presenta en la siguiente curva: El verificador es mejor si la curva es más cercana a los ejes. El rendimiento del SV generalmente es caracterizado por el EER ( Equal Error Rate ) y es el punto de operación en el que el FR tiene el mismo valor de FA [1]. Una mejor medida de rendimiento es el área bajo la curva; esto se puede observar al comparar las FR y FA, donde la curva azul es mejor que la curva verde a pesar de que el EER de la curva verde es mejor que el EER de la curva azul. Mientras que en una estimación convencionales [3, 4, 5, 6, 7] (secciones 3 y 4) el objetivo es aprender los parámetros de estas distribuciones que mejor se ajustan a los datos de entrenamiento utilizando un criterio de Máxima Verosimilitud (ML) sin explícitamente Especialidad: Comunicaciones y Electrónica 13
14 considerar la minimización de un punto de operación deseado. Por otro lado, los paradigmas discriminativos (sección 4) para GMM [11, 12, 14] y para JFA [13] estimación de los parámetros para optimizar el rendimiento utilizando un punto de operación específico. Sin embargo, en estos métodos discriminativos el punto de operación que optimizan depende de la proporción de muestras positivas (del locutor objetivo (target)) y negativas (del locutor no objetivo (no target)) y optimiza un punto en la curva DET, pero que no necesariamente es el punto EER ni un punto de operación específico que deseemos optimizar. Es un hecho que los paradigmas discriminativos también pueden ser diseñado para optimizar el rendimiento de la clasificación considerando un punto de operación específico; o inclusive tomando toda la curva DET en su totalidad. Nuestra propuesta es minimizar el área bajo la curva (AUC- Area Under the Curve) optimiza cada punto en la curva. Con algunas manipulaciones matemáticas llegamos a la siguiente expresión que actualiza los parámetros: donde L X, Λ = 1 M W Λ!!! = Λ! ε L X, Λ χεh χεw γ 1 R θ χ, θ χ θ χ Λ θ χ Λ X es el conjunto completo de datos de entrenamiento; M y W son dos conjuntos de datos pertenecientes a las clases C y C; y se cumple que X = M W. θ χ es un score de un clasificador binario que determina si un dato χ pertenece a C o no; R θ χ, θ χ = γφ θ χ,θ χ 1+e γ es la velocidad de aprendizaje, y φ θ χ, θ χ es la distancia entre θ χ y θ χ. Esta ecuación que minimiza el AUC se puede incorporar en los algoritmos MVE (Minimum Verification Error) [9]! Especialidad: Comunicaciones y Electrónica 14
15 y también para JFA (Joint Factor Analysis)[6] Especialidad: Comunicaciones y Electrónica 15
16 6. RESULTADOS 6.1 Base de Datos Para nuestra evaluación utilizamos un subconjunto de la base de datos NIST 2010 utilizados en las evaluaciones bianuales de la NIST (National Institute of Standards and Technology). Este conjunto fue seleccionado aleatoriamente. Para los experimentos con condiciones con ruido agregamos ruido de diferentes fuentes: fiesta, crucero, automóvil a alta velocidad, avión, fábrica. La taza de ruido que se probó fue de 10dB SNR (Signal to Noise Ratio). 6.2 Condiciones de señal limpia A continuación se presenta una tabla con los resultados en los que se muestra como mejoran los resultados con MVE comparado con la técnica convencional: Método EER (clean) Mejora Relativa MAP MVE % Se puede observar que el método convencional obtiene un EER ( Equal Error Rate ) de 15.95; y con MVE obtenemos 13.51, lo que representa una mejora relativa del 15.30%. A continuación se presenta una tabla con los resultados en los que se muestra como mejoran los resultados cuando minimizando el área bajo la curva en modelación MVE: Método EER (clean) Mejora Relativa MVE AUC MVE % Se puede observar que aplicando la optimización AUC en MVE obtenemos un EER 13.21, lo que representa una mejora relativa del 2.22% sobre MVE puro. Especialidad: Comunicaciones y Electrónica 16
17 A continuación se presenta una tabla con los resultados en los que se muestra como mejoran los resultados cuando minimizando el área bajo la curva en modelación JFA: Método EER (clean) Mejora Relativa JFA AUC JFA % 6.3 Condiciones de señal con ruido A continuación se presenta una tabla con los resultados obtenidos para una taza de señal a ruido de 10dB en los que se muestra como mejoran los resultados para diferente técnicas: Método EER (10dB) Mejora Relativa MAP JFA % AUC JFA % AUC MVE % En condiciones con ruido de 10dB, el base de de EER. Utilizando JFA se obtiene un EER de 17.23, lo cual corresponde a un mejora relativa del 6% comparado con el método convencional. Si aplicamos la optimización de minimizar bajo la curva al método JFA, es decir AUC JFA obtenemos un EER de 16.92, lo cual corresponde a una mejora relativa del 6.05%. Si aplicamos la optimización de minimizar bajo la curva al método MVE, AUC MVE obtenemos un EER de 16.12, lo cual corresponde a una mejora relativa del 10.49%. Especialidad: Comunicaciones y Electrónica 17
18 7. CONCLUSIONES En el presente trabajo se presentó un sistema para Verificación de Locutor basado en MVE (Minimum Verification Error), el cual es un método discriminativo que minimiza el área bajo la curva en lugar de optimizar un punto de operación. Los resultados en señales limpias utilizando la técnica MVE mejoró a la técnica convencional por más del 15.30%, y minimizando el área bajo la curva todavía mejoró otro 2.22% mas. Aplicando la minimización del área bajo la curva sobre JFA mejoró el resultado por 1.16% comparado con JFA puro. Los resultados de AUC-JFA y AUC-MVE en señales corruptas con ruido aditivo de diferentes tipos mejoran en un 6.05% y 10.49% respectivamente con respecto al rendimiento de la técnica convencional. Como pudimos observar en los resultados de todos los experimentos, los resultados mejoraron consistentemente. Nuestra investigación seguirá buscando como mejorar los resultados aplicando AUC en otras técnicas o con variaciones de AUC. Especialidad: Comunicaciones y Electrónica 18
19 8. REFERENCIAS [1] A. Martin, G. Doddington, T. Kamm, M. Ordowski, and M. Przybocki, The det curve in assessment of detection task performance, Tech.Rep., DTIC Document, [2] D. A. Reynolds, T. F. Quatieri, and R. B. Dunn, Speaker verification using adapted gaussian mixture models, Digital Signal Processing,vol. 10, pp , [3] F. Bimbot, J. Bonastre, C. Fredouille, G. Gravier, I. Magrin- Chagnolleau, S. Meignier, T. Merlin, J. Ortega-Garcia, anddd Petrovska-Delacretaz, Reynolds (2004) A tutorial on textindependent speaker verification, EURASIP Journal on Applied Signal Processing, vol. 4, pp [4] D. Petrovska-Delacr etaz, A. El Hannani, and G. Chollet, Textindependent speaker verification: state of the art and challenges, Progress in nonlinear speech processing, pp , [5] P. Kenny, G. Boulianne, P. Ouellet, and P. Dumouchel, Joint factor analysis versus eigenchannels in speaker recognition, IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 4, pp , [6] P. Kenny, P. Oueleet, N. Dehak, V. Gupta, and P. Dumouchel, A study of inter-speaker variability in speaker verification, IEEE Trans. ASLP, vol. 16, pp , [7] Najim Dehak, Patrick J. Kenny, Rda Dehak, Pierre Dumouchel, and Pierre Ouellet, Front end factor analysis for speaker verification, IEEE Transactions on Audio, Speech and Language Processing, [11] D. Povey, PC Woodland, and MJF Gales, Discriminative map for acoustic model adaptation, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), 2003, vol. 1, pp. I 312. [12] F. Sha and L.K. Saul, Large margin gaussian mixture modeling for phonetic classification and recognition, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), [13] L. Burget, O. Plchot, S. Cumani, O. Glembek, P. Matejka, and N. Brummer, Discriminatively trained probabilistic linear discriminant analysis for speaker verification, 2012, Proceedings of ICASSP. [14] B.-H. Juang, W. Chou, and C.-H. Lee, Minimum classification error rate methods for speech recognition, IEEE Trans. on Speech and Audio Processing, vol. 5, pp , May Especialidad: Comunicaciones y Electrónica 19
20 [15] K. Fukunaga, Introduction to statistical pattern recognition, in Computer Science and Scientific Computing, 2nd ed., W. Rheinboldt and D. Siewiorek, Eds. San Diego, CA: Academic, Especialidad: Comunicaciones y Electrónica 20
21 9. BIBLIOGRAFÍA H. B. Mann and D. R. Whitney, On a test of whether one of two random variables is stochastically larger than the other, Annals of Mathematical Statistics, vol. 18:1, pp , CH Lee, A unified statistical hypothesis testing approach to speaker verification and verbal information verification, in Proc. COST,Workshop on Speech Technology in the Public Telephone Network: Where are we today?, Greece, September 1997, vol. 250, pp J.-L. Gauvain and C.-H. Lee, Maximum a posteriori estimation for multivariate Gaussian mixture observations of markov chains, IEEE Trans. on Speech and Audio Processing, vol. 2, pp , Apr E. Rosenberg, Speaker verification using minimum verification error training, 1998, Proceedings of ICASSP. Optimization of the det curve in speaker verification(extended version), L.K. Saul and M.G. Rahim, Maximum likelihood and minimum classification error factor analysis for automatic speech recognition, Speech and Audio Processing, IEEE Transactions on, vol. 8, no. 2, pp , L. Burget, O. Plchot, S. Cumani, O. Glembek, P. Matejka, and N. Brummer, Discriminatively trained probabilistic linear discriminant analysis for speaker verification, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), A.F. Martin and C.S. Greenberg, NIST 2008 Speaker Recognition Evaluation: Performance Across Telephone and Room Microphone Channels, in Proc. Interspeech, D. A. Reynolds, Speaker identification and verification using Gaussian mixture speaker models, Speech Communication, vol. 17, no. 1-2, pp , L. Burget, M. Fapso, and V. Hubeika, BUT system for NIST 2008 speaker recognition evaluation, in Interspeech, N. Scheffer, L. Ferrer, M. Graciarena, S. Kajarekar, E. Shriberg, and A. Stolcke, The SRI NIST 2010 speaker recognition evaluation system, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), 2011, pp O. Glembek, L. Burget, N. Dehak, N. Brummer, and P. Kenny, Comparison of scoring methods used in speaker recognition with joint factor analysis, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), P. Matejka, O. Glembek, F. Castaldo, MJ Alam, O. Plchot, P. Kenny, L. Burget, and J. Cernocky, Full-covariance UBM and Especialidad: Comunicaciones y Electrónica 21
22 heavy-tailed PLDA in i-vector speaker verification, in IEEE Intl. Conf. on Acoustics, Speech and Sig. Proc. (ICASSP), P Kenny, Bayesian Speaker Verification with Heavy-Tailed Priors, keynote presentation, Odyssey Speaker and Language Recognition Workshop Brno, Czech Republic, Especialidad: Comunicaciones y Electrónica 22
23 10. AGRADECIMIENTOS Agradezco el apoyo del Instituto Tecnológico y de Estudios Superiores de Monterrey por el apoyo financiero para mantener este proyecto desde el año Agradezco el apoyo de mis asistentes de Investigación, especialmente a Leibny Paola Garcia Perera y Roberto Aceves. Agradezco a Richard Stern, Bhiksha Raj, y Rita Singh del Instituto de Tecnología y Lenguaje de la Universidad de Carnegie Mellon, por las excelentes discusiones que hemos tenido en el área de Reconocimiento Automático de Voz y Verificación Automática del Locutor y muy especialmente por su apoyo en el desarrollo de la técnica de optimización que minimiza el área bajo la curva. Agradezco el apoyo de Chin-Hui Lee de Georgia Tech en la adecuación de la técnica MVE a nuestro sistema ASV. Agradezco el apoyo de Eduardo Lleida de la Universidad de Zaragoza, España, por las excelentes discusiones que hemos tenido en el área de Reconocimiento Automático de Voz y Verificación Automática del Locutor. Especialidad: Comunicaciones y Electrónica 23
24 11. CURRICULUM VITAE EDUCACIÓN: Grado: Institución: BSc. Ingeniero en Sistemas Electrónicos (ISE), mención honorífica ( ) ITESM, campus Monterrey, Monterrey, N.L., México. Grado: M.Sc. Ingeniería de Control ( ) Institución: ITESM (Instituto Tecnológico y de Estudios Superiores de Monterrey), campus Monterrey, Monterrey, N.L., México. Grado: M.Phil. ( ) Institución: Universidad de Cambridge, Cambridge, Inglaterra. área: Procesamiento de Voz y de Lenguaje Grado: Ph.D. ( junio) Institución: Universidad de Cambridge, Cambridge, Inglaterra. área: Reconocimiento Automático de Voz en ambientes altamente contaminados por ruido. DISTINCIONES: 1. Miembro de la Academia Mexicana de Ciencias, SNI, nivel I, período ; candidato en el periodo Premio a la Labor Docente y de Investigación del Instituto Tecnológico y de Estudios Superiores de Monterrey, campus Monterrey, Mayo Premio a la Labor Docente y de Investigación del Instituto Tecnológico y de Estudios Superiores de Monterrey, campus Monterrey, Mayo Invitado por CONACyT a formar parte de Red Nacional en Tecnologías de Información, 2008-fecha. 6. Vice-presidente el SIL-IL ( Special Interest Group in Iberoamerican Languages ) de ISCA (Internacional Speech and Communication Association), en el periodo 2008-fecha. 7. Agencia Española de Cooperación Internacional (AECI), para participar en le Programa de Cooperación Interuniversitaria AL.E, estancia corta en la Univ. de Zaragoza, España, en Junio del Especialidad: Comunicaciones y Electrónica 24
25 8. Reconocimieto como Responsable de la Cátedra de Investigación de Seguridad de la Información, lo cual me hace acreedor a un apoyo financiero del ITESM de $1,500, pesos al año. 9. Reconocimiento como profesor Titular del ITESM, campus Monterrey, Beca de la Academia Mexicana de Ciencias (AMC-FOMECE) durante el verano del 2001 para realizar investigación sobre reconocimiento automático de Voz en la Universidad de Carnegie Mellon, EUA (4, USD + pasaje de avión). 11. Apoyo financiero de la DAAD para realizar una estancia en la Universidad de Marburg, Alemania, período Mayo-Julio de 1998 (11, DM por un período de tres meses). 12. Beca F.C.O ("Foreign and Commonwealth"), administrada por el Consejo Británico, para realizar estudios de postgrado en la Universidad de Cambridge, Inglaterra ( ). 13. Premio O.R.S. ("Overseas Research Student Award") para realizar investigación en la Universidad de Cambridge, Inglaterra ( ). 14. Beca de CONACYT (Consejo Nacional de Ciencia y Tecnología) para realizar estudios doctorales en la Universidad de Cambridge, Inglaterra ( ). 15. Beca BUAC (Becas Universitarias Asociación Civil) para realizar estudios de maestría en el ITESM, campus Monterrey ( ) en el programa de Profesores a Futuro. 16. Carta de Reconocimiento de BUAC por estar dentro de los 15 estudiantes becados con las calificaciones promedio más alto en el ITESM, campus Monterrey (Ene. 1983). 17. Beca BUAC para realizar estudios de licenciatura en el ITESM, campus Monterrey ( ). EXPERIENCIA LABORAL: Institución: Dpto. de Ciencias Computacionales, ITESM, campus Monterrey, Monterrey, N.L., México. Responsabilidades: Profesor de Tiempo completo (Full-time professor): Director del Dpto. de Ciencias Computacionales, (2003-fecha) Especialidad: Comunicaciones y Electrónica 25
Verificación Automática del Locutor
Verificación Automática del Locutor Juan Arturo Nolazco Flores Departamento de Ciencias Computacionales Tecnológico de Monterrey, Campus Monterrey. Juan Arturo Nolazco Flores. RAH Agenda Introducción IAL
Más detallesATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION
ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION Fecha de recepción: 17 de mayo 2016 Fecha de aceptación: 20
Más detallesEficacia de las características prosódicas a corto plazo en la verificación de locutor
Eficacia de las características prosódicas a corto plazo en la verificación de locutor Iker Luengo 1, Eva Navas 1, Inmaculada Hernáez 1, Jon Sanchez 1, Ibon Saratxaga 1, Iñaki Sainz 1, Juan J. Igarza 1
Más detallesReconocimiento Automático de Locutor
Reconocimiento Automático de Locutor Joaquín González Rodríguez ATVS Biometric Recognition Group Universidad Autónoma de Madrid http://atvs.ii.uam.es Sumario Introducción: n: voz e identidad Reconocimiento
Más detallesESTUDIO COMPARATIVO DE TÉCNICAS PARA ROBUSTEZ DE SISTEMAS DE VERIFICACIÓN DE LOCUTOR TEXTO INDEPENDIENTE JOSUÉ ABRAHAM FREDES SANDOVAL
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO INGENIERÍA ELÉCTRICA ESTUDIO COMPARATIVO DE TÉCNICAS PARA ROBUSTEZ DE SISTEMAS DE VERIFICACIÓN DE LOCUTOR TEXTO INDEPENDIENTE
Más detallesEXPERIMENTOS PRELIMINARES DE VERIFICACIÓN DE LOCUTORES CON UNA BASE DE DATOS REALISTA
EXPERIMENTOS PRELIMINARES DE VERIFICACIÓN DE LOCUTORES CON UNA BASE DE DATOS REALISTA José Antonio Rubio García, José Manuel Pardo Muñoz, Ricardo de Córdoba Herralde, Javier Macías Guarasa Grupo de Tecnología
Más detallesEXTRACCIÓN DE LRs DE AUDIOS DE CASOS CERRADOS DE LA POLICÍA DE INVESTIGACIONES DE CHILE PDI
EXTRACCIÓN DE LRs DE AUDIOS DE CASOS CERRADOS DE LA POLICÍA DE INVESTIGACIONES DE CHILE PDI Claudia Rosas 1, Jorge Sommerhoff 2, César Sáez 3, José Novoa 4 1 Instituto de Lingüística y Literatura, Universidad
Más detallesCoeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla
Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla Jorge Luis Guevara Diaz Semana ciencia de la Computación Escuela de Informática Universidad Nacional
Más detallesFusión de sistemas de reconocimiento basados en características de alto y bajo nivel
Fusión de sistemas de reconocimiento basados en características de alto y bajo nivel Mireia Farrús 1, Jan Anguita 1, Javier Hernando 1, Ramon Cerdà 2 1 Universitat Politècnica de Catalunya, 2 Universitat
Más detalles6 BASE DE DATOS Y SOFTWARE
6 BASE DE DATOS Y SOFTWARE En este capítulo describiremos la base de datos con la que hemos elaborado las pruebas experimentales a lo largo de este proyecto, así como los protocolos seguidos para la realización
Más detallesIdentificación del Hablante Empleando Modelos de Clases de Fonemas. Vizcaya Pedro, Ulloa Nicolás,
Identificación del Hablante Empleando Modelos de Clases de Fonemas Vizcaya Pedro, Ulloa Nicolás, Abstract Este trabajo trata sobre sistemas de reconocimiento de voz, tomando una arquitectura típica para
Más detallesProcesamiento de voz - Reconocimiento de voz II
Procesamiento de voz - Reconocimiento de voz II Marc S. Reßl Roxana Saint-Nom 2009 Ingeniería Electrónica Instituto Tecnológico de Buenos Aires Reconocimiento de voz Las técnicas que vimos hasta ahora
Más detallesEL reconocimiento biométrico consiste en el uso de características
Verificador de locutores implementado en un dspic Maximiliano Lizondo, Pablo Agüero, Alejandro J. Uriz, Juan C. Tulli and Esteban González Laboratorio de Comunicaciones - Facultad de Ingeniería - Universidad
Más detallesMÁQUINAS DE VECTORES SOPORTE (SVM) PARA RECONOCIMIENTO DE LOCUTOR E IDIOMA
UNIVERSIDAD AUTÓNOMA DE MADRID ESCUELA POLITÉCNICA SUPERIOR MÁQUINAS DE VECTORES SOPORTE (SVM) PARA RECONOCIMIENTO DE LOCUTOR E IDIOMA -RESUMEN DEL PROYECTO FIN DE CARRERA- XXVIII Convocatoria premios
Más detallesPodriamos conversar con las maquinas como lo hacemos con los humanos?
Que veremos? 1. Introducción 2. Trabajos Previos 3. Procesamiento de la Señal 4. Coeficientes MFCC 5. Trasformada Wavelet 6. Extracción de características usando wavelets 7. Experimentos y Resultados 8.
Más detallesINSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5
INSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5 PROGRAMA ACADÉMICO: LICENCIATURA EN INGENIERIA INDUSTRIAL TIPO EDUCATIVO: INGENIERIA MODALIDAD: MIXTA SERIACIÓN: NINGUNA CLAVE DE LA ASIGNATURA: 126 CICLO: QUINTO
Más detalles-matemáticas aplicadas: análisis numérico, ecuaciones diferenciales parciales, computación
Áreas de Interés -control automático -ingeniería eléctrica -ingeniería industrial Especialidad científica -computadoras digitales, analógicas e híbridas -problemas de simulación analógica, digital e híbrida
Más detallesReconocimiento Automático de Voz
Reconocimiento Automático de Voz Presentación basada en las siguientes Referencias: [1] Rabiner, L. & Juang, B-H.. Fundamentals of Speech Recognition, Prentice Hall, N.J., 1993. [2] Rabiner, L. & Juang,
Más detallesINSTITUTO POLITÉCNICO NACIONAL SECRETARIA DE INVESTIGACIÓN Y POSGRADO
SIP-30 INSTITUTO POLITÉCNICO NACIONAL SECRETARIA DE INVESTIGACIÓN Y POSGRADO DIRECCIÓN DE POSGRADO FORMATO GUÍA PARA REGISTRO DE ASIGNATURAS Hoja 1 de 3 I. DATOS DEL PROGRAMA Y LA ASIGNATURA 1.1 NOMBRE
Más detallesSistemas de Reconocimiento de Patrones
Sistemas de Reconocimiento de Patrones p. 1/33 Sistemas de Reconocimiento de Patrones Luis Vázquez GTI - IIE Facultad de Ingeniería Universidad de la República Sistemas de Reconocimiento de Patrones p.
Más detallesCarlos Cuevas-Covarrubias (Mexico): Mutual Principal Components, reduction of dimensionality in statistical classification
Carlos Cuevas-Covarrubias (Mexico): Mutual Principal Components, reduction of dimensionality in statistical classification Mutual Principal Components, reduction of dimensionality in statistical classification
Más detallesEXTRACCIÓN DE INFORMACIÓN DE SEÑALES DE VOZ PARA EL AGRUPAMIENTO POR LOCUTORES DE LOCUCIONES ANÓNIMAS
UNIVERSIDAD AUTÓNOMA DE MADRID ESCUELA POLITÉCNICA SUPERIOR PROYECTO FIN DE CARRERA EXTRACCIÓN DE INFORMACIÓN DE SEÑALES DE VOZ PARA EL AGRUPAMIENTO POR LOCUTORES DE LOCUCIONES ANÓNIMAS Ingeniería de Telecomunicaciónn
Más detallesDR. JESÚS FABIÁN LÓPEZ PÉREZ
DR. JESÚS FABIÁN LÓPEZ PÉREZ A. DATOS PERSONALES 1. Nombre Jesús Fabián López Pérez 2. Domicilio 3. Teléfono Particular 4. E-mail : fabian.lopezpz@gmail.com 5. Teléfono y fax trabajo 6. Fecha de Nacimiento
Más detallesALGORITMO CON COMPRESIÓN OPTIMA PARA MODELOS MIXTOS LINEALES RALOS
ALGORITMO CON COMPRESIÓN OPTIMA PARA MODELOS MIXTOS LINEALES RALOS S. Pazos, M. Hurtado y C. Muravchik LEICI, Dto Electrotecnia, FI-UNLP INTRODUCCIÓN En varios problemas de procesamiento de señales los
Más detallesPROGRAMA DE CURSO. Señales y Sistemas II. Signals and Systems II Horas de Cátedra. Horas de Trabajo Personal ,5 1,5 5,0
Código Nombre EL 4003 Nombre en Inglés SCT Unidades Docentes PROGRAMA DE CURSO Señales y Sistemas II Signals and Systems II Horas de Cátedra Horas Docencia Auxiliar Horas de Trabajo Personal 6 10 3,5 1,5
Más detallesReconocimiento de Locutor (Biometría Vocal)
Reconocimiento de Locutor (Biometría Vocal) Daniel Ramos Castro daniel.ramos@uam.es ATVS Biometric Recognition Group http://atvs.ii.uam.es Universidad Autónoma de Madrid Sumario Introducción: voz e identidad
Más detallesUNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA ELÉCTRICA
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA ELÉCTRICA ROBUSTEZ A VARIABILIDAD DE CANAL EN RECONOCIMIENTO DE PATRONES ACÚSTICOS CON APLICACIONES EN ENSEÑANZA
Más detallesSOMI XVIII Congreso de Instrumentación TECNOLOGIAS DE LA INFORMACION RAM1847
Reconocedor de Voz Adaptado para mejorar la pronunciación de Inglés en Hispanos M.A. García Galván, R. Aréchiga Martínez Universidad Autónoma Metropolitana, Departamento de Electrónica. Av San Pablo #
Más detallesProbabilidad y Estadística
Programa de la Asignatura: Código: 23 Probabilidad y Estadística Carrera: Ingeniería en Computación Plan: 2013 Carácter: Obligatoria Unidad Académica: Secretaría Académica Curso: Tercer año Primer cuatrimestre
Más detallesIDENTIFICACION BIOMETRICA DE LOCUTORES PARA EL AMBITO FORENSE: ESTADO DEL ARTE
Buenos Aires, 5, 6 y 7 de noviembre de 2008 IDENTIFICACION BIOMETRICA DE LOCUTORES PARA EL AMBITO FORENSE: ESTADO DEL ARTE Felipe Ochoa (a), César San Martin (b), Roberto Carrillo (b). (a) Laboratorio
Más detallesEL4005 Principios de Comunicaciones Clase No.24: Demodulación Binaria
EL4005 Principios de Comunicaciones Clase No.24: Demodulación Binaria Patricio Parada Departamento de Ingeniería Eléctrica Universidad de Chile 5 de Noviembre de 2010 1 of 34 Contenidos de la Clase (1)
Más detallesPRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Más detallesVerificación de tema en sistemas de diálogo mediante la aplicación de un test de hipótesis bayesiano
Procesamiento del Lenguaje Natural, núm. 35 (2005), pp. 221-227 recibido 29-04-2005; aceptado 01-06-2005 Verificación de tema en sistemas de diálogo mediante la aplicación de un test de hipótesis bayesiano
Más detallesCómo medir la validez y fiabilidad de sistemas de análisis forense. Geoffrey-Stewart Morrison. p p(e H )
Cómo medir la validez y fiabilidad de sistemas de análisis forense Geoffrey-Stewart Morrison p(e H ) p p(e H ) d Preocupaciones Marco lógicamente correcto para la evaluación de las evidencias - ENFSI Guideline
Más detallesComparación de clasificadores para el reconocimiento de notas musicales
Comparación de clasificadores para el reconocimiento de notas musicales Omar Velázquez López, José Luis Oropeza Rodríguez, Sergio Suárez Guerra Instituto Politécnico Nacional, Centro de Investigación en
Más detallesAprendizaje Automático
Regresión Lineal: Descenso de Gradiente Árboles de Regresión: M5 Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática
Más detallesTécnicas Avanzadas de Visión por Computador
Técnicas Avanzadas de Visión por Computador Sistemas Informáticos Avanzados Índice Introducción. Registrado basado en grises. Funciones criterio. Métodos de minimización. Registrado multimodal. Registrado
Más detallesCURRICULUM VITAE. F O R M A C I Ó N A C A D É M I C A (Iniciar con el grado más reciente y presentar información de los últimos cinco años)
CURRICULUM VITAE Domicilio: Teléfono de casa: Celular: Correo electrónico: RFC: CURP: Arroyo Díaz Salvador Antonio Blvd. Cholula Huejotzingo km 6 Las Moras Residencial (222) 2404081 044 22 24 60 47 49
Más detalles3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL Descripción del Problema: La identificación de un sistema consiste en
301 3.7 IDENTIFICACION DE UN SISTEMA DINÁMICO NO LINEAL 3.7.1 Descripción del Problema: La identificación de un sistema consiste en determinar una función que relacione las variables de entrada con las
Más detallesAnálisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.
Más detallesEnsayos de consolidación (2)
Ensayos de consolidación (2) Análisis de las curvas asiento-tiempo Células con medida de presión (Célula Rowe) Ensayos con carga continua Resumen Análisis de las curvas asiento tiempo Método de Casagrande
Más detallesEstimación a priori de umbrales dependientes del locutor
Estimación a priori de umbrales dependientes del locutor Javier R. Saeta 1, Javier Hernando 2 1 Biometric Technologies, S.L.. Barcelona. j.rodriguez@biometco.com 2 TALP Research Center, Universitat Politècnica
Más detallesOrganización. Autómatas probabilísticos (AEFP) Definición de Autómata. Modelo de Markov. Ejemplo de AEFP. Modelos basados en autómatas probabilísticos
Organización Modelos basados en autómatas probabilísticos Bioingeniería I Parte I Autómatas determinísticos Autómatas celulares. Aplicación modelos tejido excitable. Parte II Autómatas probabilísticos
Más detallesUniversidad Autónoma de Madrid. Escuela politécnica superior. Proyecto fin de carrera
Universidad Autónoma de Madrid Escuela politécnica superior Proyecto fin de carrera ANÁLISIS DE COMPENSACIÓN DE VARIABILIDAD EN RECONOCIMIENTO DE LOCUTOR APLICADO A DURACIONES CORTAS Ingeniería de Telecomunicación
Más detallesIngeniería y Arquitectura Programa de asignatura
Identificación de la asignatura Nombre de la asignatura: Métodos Numéricos Clave: MIES Área académica: Ingenierías y Arquitectura Total créditos: 04 Teórico Práctico 3 1 Programa académico al que pertenece:
Más detallesIntroducción al Tratamiento de Señales
Introducción al Tratamiento de Señales Introducción Presenta: Mauricio Nava Flores -1- Contenido 1. Objetivo general del curso 2. Antecedentes académicos 3. Desarrollo del curso 4. Temario 5. Evaluación
Más detallesESTADÍSTICA BAYESIANA Y TEORÍA DE DECISIONES
MISIÓN Formar profesionales altamente capacitados, desarrollar investigación y realizar actividades de extensión en Matemáticas y Computación, así como en sus diversas aplicaciones. ESTADÍSTICA BAYESIANA
Más detallesECUALIZACIÓN DE HISTOGRAMAS ADAPTATIVA EN EL DOMINIO CEPSTRAL PARA RECONOCIMIENTO DE VOZ ROBUSTO
ECUALIZACIÓN DE HISTOGRAMAS ADAPTATIVA EN EL DOMINIO CEPSTRAL PARA RECONOCIMIENTO DE VOZ ROBUSTO Carmen Benítez, Ángel de la Torre, José C. Segura, Javier Ramírez, Antonio J. Rubio Dpto. Electrónica y
Más detallesPaul McCartney es un impostor?
Paul McCartney es un impostor? Introducción al Reconocimiento Forense de Hablantes Miguel Martínez Soler Laboratorio de Investigaciones Sensoriales (LIS) INIGEM, CONICET-UBA, Hospital de Cĺınicas Nuestros
Más detallesCOMPENSADOR DE TEMPERATURA PARA CELDAS DE CARGA
COMPENSADOR DE TEMPERATURA PARA CELDAS DE CARGA 1 Roberto Salas, 2 M. Velasco 1 MIDE, Metrología Integral y Desarrollo S. A. de C. V., Querétaro, México. 2 CENAM (Centro Nacional de Metrología), Querétaro,
Más detallesLugar y fecha de nacimiento: Madrid, 22 de abril de 1965 Teléfono:
CURRICULUM VITAE Datos personales: Nombre: José Alberto Apellidos: Mauricio Arias Lugar y fecha de nacimiento: Madrid, 22 de abril de 1965 Teléfono: 91 394 2597 Correo electrónico: jamauri@ccee.ucm.es
Más detallesTrabajo extra clase: 1 Total de horas semestre: 80 Fecha de actualización: Febrero Materia requisito:
UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: Clave: FACULTAD DE INGENIERÍA DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: Área en plan de estudios: Créditos 5 Total de horas
Más detallesFACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA PROGRAMA ANALÍTICO FIME Nombre de la unidad de aprendizaje: Reconocimiento de patrones Frecuencia semanal: 3 horas. Horas
Más detallesUNIVERSIDAD DE CONCEPCIÓN, DEPTO. INGENIERÍA MATEMÁTICA Concepción, Chile
Fabián Fabian Flores Bazán 02/07/2016 03:29 Portal del Investigador Antecedentes del Investigador Cargo / Full Professor UNIVERSIDAD DE CONCEPCIÓN, DEPTO. INGENIERÍA MATEMÁTICA Concepción, Resumen Nonconvex
Más detallesCURRICULUM VITAE RUBÉN MULLOR IBÁÑEZ. Septiembre 2009
CURRICULUM VITAE Septiembre 2009 1 Datos Personales Nombre: Rubén Mullor Ibáñez Teléfono: 965 90 36 87 Fax: 965 90 36 67 Correo electrónico (e -mail): ruben.mullor@ua.es Formación Académica Licenciatura:
Más detallesCarrera: MTE Participantes Representante de las academias de ingeniería Mecatrónica de los Institutos Tecnológicos.
.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos: Matemáticas Discretas MTE-08 --6.- HISTORIA DEL PROGRAMA Lugar y fecha de elaboración
Más detallesOptimización de una Interfaz Cerebro Computador Basada en Imaginación Motora Usando Emotiv Epoc
Optimización de una Interfaz Cerebro Computador Basada en Imaginación Motora Usando Emotiv Epoc J. Castillo 1, 2, B. Longo 2, A. Floriano 2, E. Caicedo 1, T. Bastos 2 1 Universidad del Valle: 1300 Av.
Más detallesANALISIS DISCRIMINANTE, ESTADISTICA GERENCIAL
UNIVERSIDAD DE PUERTO RICO Recinto de Río Piedras Facultad de Administración de Empresas Instituto de Estadística ANALISIS DISCRIMINANTE, HERRAMIENTA EN ESTADISTICA GERENCIAL José C. Vega Vilca, PhD Presentación
Más detallesSeriación obligatoria antecedente: Análisis Espectral de Señales y Variable Compleja Aplicada a la Geofísica
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO INTRODUCCIÓN AL DISEÑO DE FILTROS DIGITALES 1743 7 09 Asignatura Clave Semestre Créditos Ingeniería en Ciencias de la
Más detallesAsignaturas antecedentes y subsecuentes
PROGRAMA DE ESTUDIOS Reconocimiento de Patrones Área a la que pertenece: Área de Formación Integral Profesional Horas teóricas: 3 Horas prácticas: 1 Créditos: 7 Clave: F0182 Asignaturas antecedentes y
Más detallesEntrenamiento discriminativo maximizando una distancia entre modelos de clases
Entrenamiento discriminativo maximizando una distancia entre modelos de clases Milton O. Sarria-Paja 1 Cesar G. Castellanos-Domínguez 2 Resumen: En este trabajo se presenta una técnica de entrenamiento
Más detallesTablas de estadística
Tablas de estadística FUOC 3 Tablas de estadística Tabla 1. Probabilidades de la distribución binomial (n; p) FUOC 4 Tablas de estadística Tabla 1 (Continuación). Probabilidades de la distribución binomial
Más detallesTEMA 5: RECONOCIMIENTO DE LOCUTORES Y DE VOZ.
TEM 5: RECONOCMENTO E LOCUTORES Y E VOZ. 5.. Reconocimiento de locutores.. Entrenamiento: se extraen parámetros de cada usuario del sistema.. uncionamiento: a partir de las señales, el sistema tomará la
Más detallesAnálisis Avanzado de de Series Temporales Curso de Macroeconometría Doctorado en Economía (UPV-EHU)
Análisis Avanzado de de Series Temporales Curso de Macroeconometría Doctorado en Economía (UPV-EHU) Josu Arteche 2006-2007 (15 horas) 1. Series Temporales y el Dominio de la Frecuencia 1.1 Ciclos 1.2 Funciones
Más detallesVisión Artificial Avanzada
Visión Artificial Avanzada Máster de Sistemas Inteligentes Instituto de Estudios de Posgrado Universidad de Córdoba Curso académico: 2015 2016 Trabajo del tema 1.- Introducción a la Visión Artificial Se
Más detallesEjercicios resueltos del capítulo 4
Ejercicios resueltos del capítulo 4 Ejercicios impares resueltos..a Calcular los autovalores y subespacios invariantes asociados a la matriz: A = Calculamos el polinomio característico y resolvemos: λ
Más detallesTema 2. Introducción a la Estadística Bayesiana
2-1 Tema 2 Introducción a la Estadística Bayesiana El teorema de Bayes Ejemplo Interpretación Ejemplo: influencia de la distribución a priori Ejemplo: densidad de flujo Probabilidad bayesiana Ejemplo:
Más detallesProcesamiento de voz - Reconocimiento de voz I
Procesamiento de voz - Reconocimiento de voz I Marc S. Reßl Roxana Saint-Nom 2009 Ingeniería Electrónica Instituto Tecnológico de Buenos Aires Reconocimiento de voz El reconocimiento automático de voz
Más detallesNúcleo Académico Básico
Núcleo Académico Básico El Núcleo Académico Básico de la Maestría en Ciencias de la Computación está integrado por: 1. Betania Hernández Ocaña Doctora en Ciencias de la Computación con mención honorífica
Más detallesRedes de Neuronas de Base Radial
Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta
Más detallesCurso: Métodos de Monte Carlo Unidad 4, Sesión 11: Sorteo de variables aleatorias con distribución arbitraria
Curso: Métodos de Monte Carlo Unidad 4, Sesión 11: Sorteo de variables aleatorias con distribución arbitraria Departamento de Investigación Operativa Instituto de Computación, Facultad de Ingeniería Universidad
Más detallesRECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO
RECONOCIMIENTO DE PATRONES DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: RECONOCIMIENTO DE PATRONES TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 3 : RECONOCIMIENTO
Más detallesReconocimiento del locutor dependiente del texto con modelos acústicos del habla
Reconocimiento del locutor dependiente del texto con modelos acústicos del habla Ing. Ivis Rodés Alfonso, Dr. C. José Ramón Calvo de Lara Centro de Aplicaciones de Tecnología de Avanzada, 7a #21812 e/
Más detallesBases estadísticas del reconocimiento de patrones
Bases estadísticas del reconocimiento de patrones César Martínez cmartinez _AT_ fich.unl.edu.ar Inteligencia Computacional FICH-UNL Percepción humana Tarea muuuuy simple: Cuántas llaves hay? Inteligencia
Más detallesFiltrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional
Filtrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional Mario A. Bueno a, Josué Álvarez-Borrego b, Leonardo Acho a y Vitaly Kober c mbueno@cicese.mx,
Más detallesDiplomado en Ingeniería Geotécnica (DIG-MIEG)
Diplomado en Ingeniería Geotécnica (DIG-MIEG) 1 DESCRIPCIÓN Con el Diplomado en Ingeniería Geotécnica los alumnos aprenden a modelar el comportamiento de suelos naturales y antropogénicos para el diseño
Más detallesUSO DEL FILTRO DE KALMAN PARA ESTIMAR LA TENDENCIA DE UNA SERIE
DIVISIÓN ECONÓMICA DEPARTAMENTO DE INVESTIGACIONES ECONÓMICAS INFORME TÉCNICO DIE-87-003-IT USO DEL FILTRO DE KALMAN PARA ESTIMAR LA TENDENCIA DE UNA SERIE Ana Cecilia Kikut V. OCTUBRE, 003 Entre los diferentes
Más detallesPattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Más detallesContenidos. Importancia del tema. Conocimientos previos para este tema?
Transformación conforme Contenidos Unidad I: Funciones de variable compleja. Operaciones. Analiticidad, integrales, singularidades, residuos. Funciones de variable real a valores complejos. Funciones de
Más detallesEl modelo de azar proporcional: la regresión de Cox
El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten
Más detallesRECONOCIMIENTO DE HABLA Y SISTEMAS DE DIÁLOGO
MÁSTER OFICIAL EN LENGUA ESPAÑOLA Y LITERATURA HISPÁNICA Aplicación de las tecnologías de la información y de la comunicación (TIC) a la Lengua española Tecnologías del habla, Carme de-la-mota RECONOCIMIENTO
Más detalles(1) Métodos y materiales
Desarrollo de un filtro en el dominio de la frecuencia para procesamiento digital de imágenes de huella dactilar basado en la Transformada Rápida de Fourier Modificada. Resumen. El análisis en frecuencia
Más detallesPROGRAMA DE CURSO. Código Nombre MA3402 Estadística Nombre en Inglés Statistics SCT Requisitos. DIM Resultados de Aprendizaje
> < ; U Q R ;?C: VT 2 +D :?CB J B > > ; S6D :? < ;? ; C?C : >? ; W( U C > X?2 > R+DE?C : < > ; ; 9 : : R > ; Y < > < ; U Q R ;?C: VT 2 +D :?C B J B > > ; S6D :? < ;? ; C?C : >? ; W( U C > X?2 > R+DE?C
Más detallesAnálisis de un Reconocedor de Género Basado en Técnicas Lineales
Universidad de Buenos Aires Facultad de Ciencias Exactas y Naturales Departamento de Computación Análisis de un Reconocedor de Género Basado en Técnicas Lineales Trabajo de cátedra: Introducción al Procesamiento
Más detallesDiseños D-óptimos bayesianos para modelos lineales heteroscedásticos
XXVI Simposio Internacional de Estadística 2016 Sincelejo, Sucre, Colombia, 8 al 12 de Agosto de 2016 Diseños D-óptimos bayesianos para modelos lineales heteroscedásticos Catalina Patiño Bustamante 1,a,
Más detallesMétodo de mínimos cuadrados (Continuación)
Clase No. 11: MAT 251 Método de mínimos cuadrados (Continuación) Dr. Alonso Ramírez Manzanares CIMAT A.C. e-mail: alram@ cimat.mx web: http://www.cimat.mx/ alram/met_num/ Dr. Joaquín Peña Acevedo CIMAT
Más detallesUN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS
UNIVERSIDAD DE MÁLAGA ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA INGENIERÍA SUPERIOR EN INFORMÁTICA ANTEPROYECTO UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS DIRECTOR DEL PROYECTO: FIRMA:
Más detalles3. ANÁLISIS DE SEÑALES
3. ANÁLISIS DE SEÑALES 3.1 REGISTRO Y TRATAMIENTO DE SEÑALES Una señal se define como la historia de los valores de aceleración que mide un acelerómetro en determinado tiempo para un punto específico.
Más detallesModelo de Computación Cuántica. Jesús García López de Lacalle
Modelo de Jesús García López de Lacalle Grupo de Investigación Mathematical Modeling and Biocomputing (MMBC) ETS de Ingeniería de Sistemas Informáticos Universidad Politécnica de Madrid jglopez@etsisi.upm.es
Más detallesProcesos Estocásticos I
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Ciencias Plan de estudios de la Licenciatura en Actuaría Procesos Estocásticos I Clave 0630 Modalidad Semestre 5 Créditos 10 Área Campo de conocimiento
Más detallesBiometría por voz: fundamentos, tecnología y aplicaciones
Biometría por voz: fundamentos, tecnología y aplicaciones Néstor Becerra Yoma, PhD Laboratorio de Procesamiento y Transmisión de Voz Departamento de Ingeniería Eléctrica Universidad de Chile Tel: (02)29784205
Más detallesReconocimiento Automático de Voz basado en Técnicas de Comparación de Patrones
Reconocimiento Automático de Voz basado en Técnicas de Comparación de Patrones Presentación basada en las siguientes Referencias: Juan Carlos Gómez [] Rabiner, L. & Juang, B-H.. Fundamentals of Speech
Más detallesPropagación numérica de ondas de choque acústicas
Propagación numérica de ondas de choque acústicas Informe semestral Roberto Velasco Segura 1 Director: Dr. Pablo Luis Rendón Garrido 1 1 Centro de Ciencias Aplicadas y Desarrollo Tecnológico Universidad
Más detallesTECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS
UNIVERSIDAD POLITECNICA DE CATALUÑA Departamento de Teoria de la señal y comunicaciones TECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS
Más detallesReducción del ruido de cuantificación en señales suaves usando proyecciones sobre conjuntos convexos reducibles. Luis Mancera Pascual DECSAI VIP
Reducción del ruido de cuantificación en señales suaves usando proyecciones sobre conjuntos convexos reducibles Luis Mancera Pascual DECSAI VIP ÍNDICE Motivación Introducción Teórica a POCS POCS y minimización
Más detallesDSAP - Procesado Digital de Audio y Voz
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 230 - ETSETB - Escuela Técnica Superior de Ingeniería de Telecomunicación de Barcelona 739 - TSC - Departamento de Teoría
Más detallesResumen. El análisis de componentes principales (PCA) es una técnica multivariada utilizada
Comparación de las aproximaciones χ 2 para la prueba de igualdad de los valores propios en el PCA Eduard Alexander Gañán Cárdenas a, Juan Carlos Correa Morales b Email: eaganan@unal.edu.co a. Estudiante
Más detallesAnálisis Espacial aplicando Técnicas de Inteligencia Artificial
Análisis Espacial aplicando Técnicas de Inteligencia Artificial OBJETIVO. Proporcionar al estudiante técnicas variadas de inteligencia artificial para el tratamiento de datos espaciales y presentar cómo
Más detallesAplicación de un Filtro Stack en Imágenes con Ruido Speckle
Aplicación de un Filtro Stack en Imágenes con Ruido Speckle María E Buemi, Juliana Gambini, Marta Mejail y Julio Jacobo Berllés Departamento de Computación,FCEyN,UBA,Buenos Aires,Argentina {mebuemi; jgambini;
Más detalles