Representaciones corticales auditivas aproximadas
|
|
- Clara Montes Moya
- hace 5 años
- Vistas:
Transcripción
1 Representaciones corticales auditivas aproximadas Hugo Leonardo Rufiner UNL-UNER-CONICET, SINC - Lab. Cibernética, Argentina
2 Organización 1. Introducción y Motivación 1. Nociones preliminares 2. Representaciones ralas y/o independientes 3. Representación cortical auditiva aproximada: 1. Inferencia 2. Aprendizaje 4. Experimentos y resultados 5. Conclusiones y trabajos futuros 6. Bibliografía 2
3 Introducción y Motivaciones
4 Motivación Formulación del mensaje Codificación Acciones neuromusculares IDEA IDEA Comprensión del mensaje Decodificación Transducción neuronal Tracto vocal Fuente del sonido Onda acústica Ruido ambiente Movimiento membrana basilar Hablante Aire Oyente 4
5 Motivación Figura: Tasa de errores (WER) en diferentes pruebas de DARPA 5
6 Motivación Tabla: Comparación del WER entre humanos y máquinas 6
7 A m p l i t u d F r e c u e n c i a ( K H z ) A m p l i t u d A m p l i t u d F r e c u e n c i a ( K H z ) F r e c u e n c i a ( K H z ) 4 k o m o s e L a m a e l m a R 4 k o m o s e L a m a e l m a R A m p l i t u d F r e c u e n c i a ( K H z ) x x x x 10 4 k o m o s e L a m a e l m a R Tiempo (mseg.) k o m o s e L a m a e l m a R Tiempo (mseg.) 7
8 RP (%) Motivación "DIME EL CAUDAL DE TODOS LOS RIOS QUE DESEMBOCAN EN EL MAR MEDITE- RRANEO. "DIME EL CAUDAL DE TODOS LOS RIOS QUE DESEMBOQUEN EN EL MAR MEDITE- RRANEO "DIME EL CAUDAL EL NOMBRE DE MENOR EN EL MAR MENOR" Humanos (ambos ruidos) Maq. ruido murmullo Maq. ruido blanco acgp SNR (db) 8
9 A m p l i t u d C u e f r e n c i a t ( m s e g ) F r e c u e n c i a ( K H z ) C o e f i c i e n t e s F r e c u e n c i a ( K H z ) F r e c u e n c i a ( K H z ) F r e c u e n c i a ( K H z ) E s c a l a 4 k o m o s e L a m a e l m a R 5 k o m o s e L a m a e l m a R x k o m o s e L a m a e l m a R Tiempo (mseg.) k o m o s e L a m a e l m a R Tiempo (mseg.)
10 Motivación Cuál es la representación o análisis óptimo de una señal?: Evidencie claramente los rasgos o pistas significativas (depende del problema). Preserve esta información en condiciones adversas (depende del ruido o distorsión). 10
11 Motivación Cuál es la representación o análisis óptimo de una señal?: Posibles problemas ( señales): Clasificación Filtrado o limpieza Compresión Más de uno a la vez? Pregunta abierta: cuando la respondamos solucionamos el problema! 11
12 Motivación Las técnicas clásicas funcionan muy bien pero generalmente bajo hipótesis poco realistas: Linealidad. Estacionariedad. Estadística significativa de hasta 2 do orden. Muchas veces se imponen restricciones artificiales por razones de simplicidad: Ortogonalidad. Pequeña cantidad de dimensiones. 12
13 Motivación Hacen falta nuevas ideas en el campo (o repensar las abandonadas prematuramente). Es necesario fijarse en como los humanos solucionamos estos problemas. Se requiere un nuevo enfoque basado en técnicas no convencionales. 13
14 Motivación Las técnicas no convencionales suelen ser más complejas que el enfoque clásico. Por lo tanto esto no significa desechar el enfoque clásico, sino plantear alternativas para aquellos casos más allá de sus límites de aplicación. 14
15 Representación cortical auditiva aproximada (AACR)
16 Vía auditiva Ápex cóclea Corteza auditiva primaria (A1) Corteza auditiva secundaria (A2) Fisura de Silvio Tonotopía A1 Base cóclea 5 cm Área de asociación auditiva Corteza auditiva Núcleo geniculado medio Corteza auditiva Núcleo geniculado medio Área de asociación auditiva 100 millones de neuronas Colículo inferior Colículo inferior cóclea Núcleo olivar superior Núcleo olivar superior cóclea fibras nervio auditivo Núcleo coclear Núcleo coclear nervio auditivo 16
17 Frecuencia (KHz) Frecuencia (KHz) Pistas acústicas /f/ /m/ /l/ El ruido enmascara las pistas acústicas /s/ /n/ /r/ Tiempo 17
18 k o m o s e L a m a e l m a R 4 A m p l i t u d F r e c u e n c i a ( K H z ) x El ruido enmascara las pistas acústicas k o m o s e L a m a e l m a R Tiempo (mseg.) 18
19 Representación cortical La caracterización de la respuesta a nivel cortical basada en la utilización de tonos puros es inaplicable para un sistema no-lineal y variante en el tiempo como este. La no-linealidad intrínseca no es un accidente de la implementación biológica, sino que constituye un aspecto fundamental que le otorga características funcionales especiales. Por ello la respuesta frente a tonos puros constituye solo una primera aproximación al problema (tonotopías). 19 / 86
20 Campos receptivos espectro-temporales La caracterización completa de la respuesta neuronal cortical constituye un desafío importante aún sin resolver. Estudios recientes utilizando estímulos complejos combinados con análisis lineal y no-lineal han provisto una nueva visión acerca del problema. Se estima el estímulo óptimo (STRF) para una neurona mediante la exposición de la misma a una batería de entradas complejas. La mayoría de estos estudios utilizan para ello el denominado método de la correlación inversa. 20
21 Frecuencia (KHz) Octavas por encima 110 Hz Campos receptivos mamíferos Tiempo (mseg.) Tiempo (mseg.) Tiempo (mseg.) Tiempo (mseg.) Tiempo (mseg.) Tiempo (mseg.)
22 Representación cortical El sistema auditivo aplica principios de codificación eficiente para procesar a los sonidos naturales, especialmente el habla. Esto parece razonable si se piensa que son los sonidos más importantes de nuestro entorno. 22
23 Representación cortical Hipótesis: El rol de los sistemas sensoriales tempranos es remover la redundancia estadística. Tienden a crear representaciones internas sumamente ralas. El cerebro crea un código eficiente mediante una representación consistente principalmente en detectores de pistas acústicas. 23
24 Representación cortical Estas hipótesis nos remiten a la utilización de técnicas de inferencia y aprendizaje de diccionarios discretos para obtener representaciones ralas e independientes que se comporten aproximadamente como sus contrapartes biológicas 24
25 Representación cortical Puede armarse un modelo sensorial a partir de estas hipótesis y tratar de contrastar las predicciones realizadas con las respuestas reales. Entre las predicciones que han logrado validarse se puede mencionar la representación sensorial interna a nivel cortical a partir de los campos receptivos espectro-temporales (Klein 2003). 25
26 A c o u s t i c p r e s s u r e Esquema obtención AACR Speech signal (Time) Ear model A u d i t o r y n e r v e f i b e r s s x F Early auditory representation (Time-frequency) f n... x = F a + e a... S T R F n STRF n Primary auditory cortex model App. auditory cortical representation (Time-STRF n ) 26
27 Espectrograma auditivo (Shamma) 27
28 Experimentos y resultados
29 Experimentos: Diccionarios óptimos: Diccionario temporal (método Lewicki 00). Representaciones corticales aproximadas (Rufiner 02, Rufiner 05, Rufiner 05, Martinez 09). Aplicaciones: Clasificación de fonemas. Limpieza de ruido. Comparación alternativas propuestas con clásicas para cada caso. 29
30 Diccionario temporal (NOCICA) Dicc. óptimos: Sobrecompleto 64x128 (NOCICA). Albayzin: 10 oraciones, 1 hablante femenino. 30
31 Diccionario temporal (espectros) Densidad de Potencia Espectral de las señales de la base anterior 31
32 Diccionario temporal (activaciones) 32
33 STRF a partir de átomos temporales Espectrog. de átomos NOCICA comparados con STRF biológicos 16 mseg. 200 mseg. 33
34 STRF a partir de un espectrograma auditivo Campos receptivos: Proceso para generar los patrones espectro-temporales que permiten estimarlos. El sistema sensorial humano procesa de una manera particular las señales temporales. 34
35 Cuánto dura un fonema? Histogramas de duración de los fonemas 35
36 STRF s a nivel de sílabas Diccionario (análisis cualitativo) 128 mseg. real 36
37 STRF s a nivel de fonemas Diccionario (análisis cualitativo) 32 mseg. reales 37
38 Clasificación fonemas AACR 38
39 Clasificación fonemas AACR 39
40 Clasificación fonemas AACR % de tramos bien clasificados Figure: Initial tuning of the number of selected coefficients in the algorithm and hidden units in the neural networks. The best performance is obtained for 8 selected coefficients and 32 nodes in the hidden layer of the MLP. 40
41 Clasificación fonemas AACR % de tramos bien clasificados Figure: Recognition rates in percent for the classification of the 5 phonemes in the presence noise at different SNR, from clean speech up to same energy levels of speech and noise (SNR=0 db). 41
42 Limpieza de ruido AACR (a) Figure : Diagram of the proposed NCD method for denoising in the cortical domain. (a) Forward stage: cortical representation. (b) Backward stage: denoised reconstruction. (b) 42
43 Limpieza de ruido AACR 43
44 Limpieza de ruido AACR 44
45 Limpieza de ruido AACR 45
46 Limpieza de ruido AACR 46
47 Conclusiones y trabajos futuros
48 Conclusiones generales Las técnicas presentadas constituyen una alternativa interesante frente a las clásicas. Importantes conexiones con los sistemas sensoriales biológicos. Permiten extraer las características significativas de la señal de voz en forma robusta y eficiente. Enfoque novedoso y prometedor. 48
49 Temas de interés futuro Métodos discriminativos para estimar diccionarios. Tratamiento del ruido. Medidas de calidad de la representación. Redes pulsadas y deep learning. Integración con sistemas artificiales actuales 49
50 Bibliografía
51 Algunos artículos C. Martínez, J. Goddard, L. Di Persia, D. Milone, H. Rufiner, Denoising sound signals in the non-negative auditory cortical domain, en preparación C. Martinez, J. Goddard, D. H. Milone, H. L. Rufiner, Approximated auditory cortical representation of speech with intrinsic robustness, enviado a Computer, Speech and Language, Elsevier Science, Junio H.L. Rufiner, C.E. Martínez, D.H. Milone and J. Goddard, "Auditory cortical representations of speech signals for phoneme classification", Lecture Notes in Computer Science, Springer- Verlag / Berlin Heidelberg, Vol. 4827, pp , H.L. Rufiner, C.E. Martínez, D.H. Milone, J. Goddard, Extracción de características bioinspirada basada en un Modelo Cortical Auditivo, Anales de la Academia Nacional de Ciencias Exactas, Físicas y Naturales, Tomo 58, pp , 2006 (por invitación). H.L. Rufiner, J. Goddard, L. F. Rocha, M. E. Torres, "Statistical method for sparse coding of speech including a linear predictive model", Physica A, Vol. 367 (1), , July H.L. Rufiner, C. Martínez, J. Goddard, "Clasificación de fonemas mediante representaciones corticales auditivas", Memorias XV Congreso SABI, Paraná, Argentina, Sept H.L. Rufiner, J. Goddard, L.F. Rocha, Representación rala de la señal de voz, Revista Argentina de Bioingeniería, Ed. Universitas, ISSN , Vol. 10, Nº 2, pp.3-12, Noviembre
52 Libros: H.L. Rufiner, Análisis y modelado digital de la voz: Técnicas recientes y aplicaciones, Editorial UNL, (Capítulo 2). 52
Procesamiento de la señal de voz
Procesamiento de la señal de voz Leandro Vignolo Procesamiento Digital de Señales Ingeniería Informática FICH-UNL 29 de mayo de 2014 L. Vignolo (PDS II FICH UNL) Procesamiento de la señal de voz 29 de
Más detallesProcesamiento de la voz
Procesamiento de la voz Diego Milone Leandro Vignolo Muestreo y Procesamiento Digital Ingeniería Informática FICH-UNL 18 de mayo de 2011 Organización de la clase Aparato fonador y oído Generalidades del
Más detallesReconocimiento Automático de Voz
Reconocimiento Automático de Voz Presentación basada en las siguientes Referencias: [1] Rabiner, L. & Juang, B-H.. Fundamentals of Speech Recognition, Prentice Hall, N.J., 1993. [2] Rabiner, L. & Juang,
Más detalles$63(&7267e&1,&26'(/ /,0,7$&,21(6. Ángel de la Torre Vega. Dpto. Electrónica y Tecnología de Computadores. Universidad de Granada
$63(&7267e&1,&26'(/,03/$17(&2&/($5 )81&,21$0,(172326,%,/,'$'(6< /,0,7$&,21(6 Ángel de la Torre Vega Dpto. Electrónica y Tecnología de Computadores Universidad Ángel de la Torre Vega G.I. Procesamiento
Más detallesQué es una RNA? Cómo surgieron y para qué? Aplicaciones? Lic. Leticia Seijas SdC Departamento de Computación - FCEyN - UBA
Para qué sirven las Redes Neuronales? SdC 2010 Departamento de Computación Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Qué es una RNA? Cómo surgieron y para qué? Aplicaciones?
Más detallesTECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS
UNIVERSIDAD POLITECNICA DE CATALUÑA Departamento de Teoria de la señal y comunicaciones TECNICAS DE PROCESADO Y REPRESENTACION DE LA SEÑAL DE VOZ PARA EL RECONOCIMIENTO DEL HABLA EN AMBIENTES RUIDOSOS
Más detallesAnálisis Espectral de una Lista de Palabras empleada en Logoaudiometría 1
Análisis Espectral de una Lista de Palabras empleada en Logoaudiometría 1 Lic. Alma Martinez Licona (*); M. en I. Leonardo Rufiner Di Persia (*); M. en I. Juan Manuel Cornejo C (*); M. en C. Miguel Cadena
Más detallesCURSO PRÁCTICO PARA EL FUNCIONAMIENTO Y MANEJO DEL PROCESADOR DE VOZ EN IMPLANTADOS MED-EL
CURSO PRÁCTICO PARA EL FUNCIONAMIENTO Y MANEJO DEL PROCESADOR DE VOZ EN IMPLANTADOS MED-EL Congreso Internacional de Foniatría, Audiología y Psicología del Lenguaje Salamanca, 26-29 de Junio de 2002 Ángel
Más detallesSistema Automático de Reconocimiento Fonético
PROYECTO FIN DE CARRERA para la obtención del título de Ingeniero Industrial Sistema Automático de Reconocimiento Fonético Alumno: Francisco José Cadaval Arrola Tutor: Dr. J. Ramiro Martínez de Dios Departamento
Más detalles1.- tipo, grado y configuración de la pérdida auditiva, 2.- habilidades auditivas: discriminación e identificación de sonidos ambientales y verbales,
Valor de la Audiofisiología en la detección precoz de la hipoacusia aspectos funcionales de la exploración audiológica sensorial, perceptivo y lingüístico El diagnóstico audiológico define: 1.- tipo, grado
Más detallesCarrera de Posgrado: Doctorado en Ingeniería Curso: TÓPICOS SELECTOS EN APRENDIZAJE MAQUINAL Año Académico: 2012
Carrera de Posgrado: Doctorado en Ingeniería Curso: TÓPICOS SELECTOS EN APRENDIZAJE MAQUINAL Año Académico: 2012 1. Objetivos. Que el alumno: Conozca los fundamentos teóricos de las técnicas más utilizadas
Más detallesAsignaturas antecedentes y subsecuentes
PROGRAMA DE ESTUDIOS Reconocimiento de Patrones Área a la que pertenece: Área de Formación Integral Profesional Horas teóricas: 3 Horas prácticas: 1 Créditos: 7 Clave: F0182 Asignaturas antecedentes y
Más detallesMétodos de modelado y clasificación de patrones. clasificación de patrones
FUNDAMENTOS DEL RECONOCIMIENTO AUTOMÁTICO DE LA VOZ Métodos de modelado y clasificación de patrones Agustín Álvarez Marquina Introducción. Modelado y clasificación de patrones Objetivos: Agrupar el conjunto
Más detallesMSc. Bioing Rubén Acevedo Señales y sistemas
Potenciales evocados MSc. Bioing Rubén Acevedo racevedo@bioingenieria.edu.ar Señales y sistemas 30 de Octubre de 2013 Instrumentación Potenciales evocados 30 de Octubre 1 / 56 Organización 1 Introducción
Más detallesREDES NEURONALES. Una esquema simplificado de una neurona se muestra en la siguiente figura. Cuerpo celular. Dendrita. Axón.
REDES NEURONALES Las redes neuronales constituyen una poderosa herramienta para modelar sistemas, especialmente no lineales, sean dinámicos o estáticos. En el cuerpo celular se realizan la mayoría de las
Más detallesDiagnóstico da xordeira por ruído
Xordeira por ruído Diagnóstico da xordeira por ruído Dra. Estrella Pallas Pallas Facultativo ORL del CHUVI Cualquier persona expuesta a ruido de forma repetida, puede desarrollar una hipoacusia progresiva,
Más detallesAsignatura: TRATAMIENTO DE SEÑALES ACUSTICAS, AUDIO Y VOZ. Horas/Semana:4 Teoría + 0 Laboratorio. Objetivos
Asignatura: TRATAMIENTO DE SEÑALES ACUSTICAS, AUDIO Y VOZ Curso académico: 2007/2008 Código: 590000978 Créditos: 6 Curso: 3 Horas/Semana:4 Teoría + 0 Laboratorio Departamento: DIAC Objetivos Introducir
Más detallesPodriamos conversar con las maquinas como lo hacemos con los humanos?
Que veremos? 1. Introducción 2. Trabajos Previos 3. Procesamiento de la Señal 4. Coeficientes MFCC 5. Trasformada Wavelet 6. Extracción de características usando wavelets 7. Experimentos y Resultados 8.
Más detallesTeoría de la Comunicación
3.5. Ejercicios Ejercicio 3.1 Una misma señal de entrada se aplica a 4 moduladores analógicos diferentes. Se monitoriza la respuesta en frecuencia a la salida de los cuatro moduladores, dando lugar a los
Más detallesTEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS
Procesado y Análisis de Datos Ambientales. Curso 2009-2010. José D. Martín, Emilio Soria, Antonio J. Serrano TEMA 1: INTRODUCCIÓN N AL PROCESADO Y ANÁLISIS DE DATOS ÍNDICE Introducción. Selección de variables.
Más detallesUNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO ANÁLISIS DE SEÑALES ALEATORIAS 1560 5 06 Asignatura Clave Semestre Créditos Ingeniería Eléctrica Ingeniería en Telecomunicaciones
Más detallesUNIVERSIDAD DE GRANADA PROCESAMIENTO DE VOZ
UNIVERSIDAD DE GRANADA PLAN DE ESTUDIOS: DIPLOMADO EN LOGOPEDIA PROCESAMIENTO DE VOZ Ángel de la Torre Vega Dpto. Teoría de la Señal, Telemática y Comunicaciones Procesamiento de Voz ATV Dpto. Teoría de
Más detallesCAPÍTULO 2 MARCO TEÓRICO
CAPÍTULO 2 MARCO TEÓRICO Reconocimiento de Patrones El reconocimiento de patrones es utiliza actualmente para la solución de tareas tales como el reconocimiento de caracteres, de huellas digitales y reconocimiento
Más detallesSeguimiento de los parámetros del modelo del tracto vocal
Algoritmos para el seguimiento de los parámetros del modelo de tracto vocal Monografía de Tratamiento Estadístico de Señales parias@fing.edu.uy Instituto de Ingeniería Eléctrica Facultad de Ingeniería
Más detallesDeep Learning. Aplicaciones en Patología. Marcial García Rojo. Patólogo. Cádiz. Gloria Bueno. VISILAB Group. Universidad de Castilla-La Mancha
Deep Learning. Aplicaciones en Patología Marcial García Rojo. Patólogo. Cádiz. Gloria Bueno. VISILAB Group. Universidad de Castilla-La Mancha Para qué necesitamos análisis de imagen en Patología? Reducir
Más detallesPSAVC - Procesado de Señal Audiovisual y de Comunicaciones
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2018 230 - ETSETB - Escuela Técnica Superior de Ingeniería de Telecomunicación de Barcelona 739 - TSC - Departamento de Teoría
Más detallesManuel S Malmierca, M.D., Ph.D. University of Salamanca and Institute of Neuroscience
Manuel S Malmierca, M.D., Ph.D. University of Salamanca and Institute of Neuroscience El sistema auditivo First musical instrument 35 000 a.c., Grubgrabenflöte Hickmann & Eichmann (eds.) Archaeology of
Más detallesPontificia Universidad Católica del Ecuador
1. DATOS INFORMATIVOS: MATERIA O MÓDULO: CÓDIGO: CARRERA: NIVEL: INTELIGENCIA ARTIFICIAL II (Aprendizaje Automático) IS-12653 INGENIERIA DE SISTEMAS SEPTIMO No. CRÉDITOS: 4 CRÉDITOS TEORÍA: 2 CRÉDITOS
Más detallesTema 6. Reconocimiento de voz
Tema 6. Reconocimiento de voz 6.1.- Introducción 6.2.- Problemática 6.3.- Clasificación 6.4.- Esquema de trabajo 6.5.- Técnicas de reconocimiento 6.6.- Conclusiones 6.1.- Introducción Reconocimiento de
Más detallesTema 1. Producción de Voz y Fonética
Tema 1. Producción de Voz y Fonética 1.1.- La señal de voz 1.2.- Características temporales de la señal de voz 1.3.- Naturaleza de las señales habladas 1.4.- Características estadísticas de la señal hablada
Más detallesUNIVERSIDAD DE LOS ANDES FACULTAD DE ARQUITECTURA Y DISEÑO ESCUELA DE ARQUITECTURA
UNIVERSIDAD DE LOS ANDES FACULTAD DE ARQUITECTURA Y DISEÑO ESCUELA DE ARQUITECTURA DEPARTAMENTO DE TECNOLOGÍA DE LA CONSTRUCCIÓN AOPE Acondicionamiento Acústico Prof. Alejandro Villasmil Nociones Generales
Más detallesATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION
ATRIBUTOS PNCC PARA RECONOCIMIENTO ROBUSTO DE LOCUTOR INDEPENDIENTE DEL TEXTO PNCC FEATURES FOR ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION Fecha de recepción: 17 de mayo 2016 Fecha de aceptación: 20
Más detallesPOR QUÉ LOS NIÑOS NECESITAN EVALUACIÓN AUDITIVA ANTES DE INICIAR LA ETAPA ESCOLAR? POR: PAULA FERRER BOTERO ASESORA: ALMA AGUIRRE FERNÁNDEZ
POR QUÉ LOS NIÑOS NECESITAN EVALUACIÓN AUDITIVA ANTES DE INICIAR LA ETAPA ESCOLAR? POR: PAULA FERRER BOTERO ASESORA: ALMA AGUIRRE FERNÁNDEZ COLEGIO MARYMOUNT PROYECTO DE GRADO MEDELLÍN 2013 Tabla de Contenidos
Más detallesINTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Más detallesANX-PR/CL/ GUÍA DE APRENDIZAJE
PROCESO DE COORDINACIÓN DE LAS ENSEÑANZAS PR/CL/001 ASIGNATURA 105000164 - PLAN DE ESTUDIOS 10II - CURSO ACADÉMICO Y SEMESTRE 2017/18 - Segundo semestre Índice Guía de Aprendizaje 1. Datos descriptivos...1
Más detallesCoeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla
Coeficientes Cepstrales en Frecuencia Mel y Dynamic Time Warping para Reconocimiento Automatico del Habla Jorge Luis Guevara Diaz Semana ciencia de la Computación Escuela de Informática Universidad Nacional
Más detallesCodificación neural de ancho de banda realzada por resonancia estocástica en el sistema sensorial de las cercas del grillo
Codificación neural de ancho de banda realzada por resonancia estocástica en el sistema sensorial de las cercas del grillo Jacob E. Levin & John P. Miller Biología sensorial animal 2018 Modelo utilizado:
Más detallesInterfaces conversacionales
Interfaces conversacionales Índice Fernando Díaz de María, DTSC, UCIIIM 1 El tamaño de los terminales móviles Prototipos 3G Fernando Díaz de María, DTSC, UCIIIM 2 Posibilidades de interacción Interfaces
Más detallesReconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales
Reconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales Dra. Ma. de Guadalupe García Hernández Departamento de Ingeniería Electrónica Objetivo general Aplicar
Más detallesModelización de secuencias para el reconocimiento automático de patrones
UNIVERSIDAD NACIONAL DEL LITORAL Facultad de Ingeniería y Ciencias Hídricas Modelización de secuencias para el reconocimiento automático de patrones César Ernesto Martínez Tesis remitida al Comité Académico
Más detallesTeoría Estadística de las Comunicaciones.
Teoría Estadística de las Comunicaciones. Profesor: Dr. Valeri Ya Kontorovich Mazover. OBJETIVOS: Ampliar y profundizar los conceptos de las comunicaciones, formar el sistema de los conceptos teóricos
Más detallesISSN ANALES DE LA ACADEMIA NACIONAL DE CIENCIAS EXACTAS, FISICAS Y NATURALES BUENOS AIRES TOMO 58
'., ISSN 0365-1 185 ANALES DE LA ACADEMIA NACIONAL DE CIENCIAS EXACTAS, FISICAS Y NATURALES BUENOS AIRES TOMO 58 BUENOS AIRES 2006 SUMARIO 1. INCORPORACIONES DE ACADEMICOS Presentación del Dr. Allen J.
Más detallesProcesamiento de la Señal
Filtrado I: Ruido 8 de abril de 2013 Repaso: Teoría de la Información La teoría de la información tiene por objeto la determinación de la manera más eciente de codicar un mensaje para su correcta entrega
Más detallesLA FRECUENCIA FUNDAMENTAL DE LA VOZ Y SUS EFECTOS EN RECONOCIMIENTO DE HABLA CONTINUA
LA FRECUENCIA FUNDAMENTAL DE LA VOZ Y SUS EFECTOS EN RECONOCIMIENTO DE HABLA CONTINUA RESUMEN C. García, D. Tapias División de Tecnología del Habla Telefónica Investigación y Desarrollo, S.A. Unipersonal
Más detalles4.1 Introducción al filtrado adaptativo
41 Introducción al filtrado adaptativo El problema del filtrado Clases básicas de estimación Filtrado adaptativo Estructuras de filtrado lineal Algoritmos Criterios para la elección del filtro adaptativo
Más detallesDSAP - Procesado Digital de Audio y Voz
Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2016 230 - ETSETB - Escuela Técnica Superior de Ingeniería de Telecomunicación de Barcelona 739 - TSC - Departamento de Teoría
Más detallesCarrera de Posgrado: Doctorado en Ingeniería Curso: TÓPICOS SELECTOS EN APRENDIZAJE MAQUINAL Año Académico: 2018
Carrera de Posgrado: Doctorado en Ingeniería Curso: TÓPICOS SELECTOS EN APRENDIZAJE MAQUINAL Año Académico: 2018 1. Objetivos. Que el alumno: Conozca los fundamentos teóricos de las técnicas más utilizadas
Más detallesInteligencia Artificial II
Misión del Centro Universitario Somos un centro que forma parte de la Red Universitaria de la Universidad de Guadalajara. Como institución de educación superior pública asumimos el compromiso social de
Más detalles- Apellidos:... Nombre:... N o de matrícula o DNI:... Grupo... Firma
Grados en Ingeniería GISC / GI COMUNICACIONES DIGIALES PARE A (iempo: 60 minutos. Puntos /0) Apellidos:............................................................ Nombre:..............................................................
Más detallesANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Aplicaciones de la biometria de la voz. CURSO ACADÉMICO - SEMESTRE Segundo semestre
ANX-PR/CL/001-02 GUÍA DE APRENDIZAJE ASIGNATURA Aplicaciones de la biometria de la voz CURSO ACADÉMICO - SEMESTRE 2015-16 - Segundo semestre GA_10II_105000164_2S_2015-16 Datos Descriptivos Nombre de la
Más detallesEl Sistema de Producción de Voz
El Sistema de Producción de Voz Rafael Martínez Olalla Grupo de Informática Aplicada al Procesamiento de Señal e Imagen (GIAPSI) Universidad Politécnica de Madrid, Campus de Montegancedo, s/n, 28660 Boadilla
Más detallesEXPLORACIÓN AUDITIVA PEDIÁTRICA Y POTENCIALES EVOCADOS AUDITIVOS DE ESTADO ESTABLE
Dra. Teresa Rivera EXPLORACIÓN AUDITIVA PEDIÁTRICA Y POTENCIALES EVOCADOS AUDITIVOS DE ESTADO ESTABLE DIAGNÓSTICO CLÍNICO Exploración ORL Exploración audiológica Historia clínica de Pediatría Anamnesis
Más detallesV. Espinoza a, R. Venegas b,s. Floody c.
paper ID: A027 /p.1 Modelo de Sonoridad usando Redes Neuronales Artificiales V. Espinoza a, R. Venegas b,s. Floody c. a Universidad Tecnológica de Chile, Brown Norte 290, Santiago, Chile, vespinozac@gmail.com
Más detallesRedes Neuronales. Introducción a las redes neuronales Carlos Andrés Delgado S.
Redes Neuronales Introducción a las redes neuronales carlos.andres.delgado@correounivalle.edu.co Carlos Andrés Delgado S. Facultad de Ingeniería. Universidad del Valle Agosto de 2017 Contenido 1 Neurofisiología
Más detallesPrograma. Introducción 1. Generación y percepción de la señal de voz 2. Técnicas avanzadas
Programa Introducción 1. Generación y percepción de la señal de voz 2. Técnicas avanzadas Análisis localizado en tiempo y en frecuencia Predicción lineal Cepstrum Realce 3. Reconocimiento automático del
Más detallesAsignaturas Temas Asignaturas Temas
1 Datos de la Asignatura Nombre de la asignatura: Carrera: Clave de la asignatura: Reconocimiento de Patrones Ingeniería en Sistemas CIE-0701 Horas teoría / práctica / Créditos: 2 2 6 2 Historia del Programa
Más detallesPsicoacústica. Campos de Aplicación: Psicología. Medicina. Acústica. Audio. Electroacústica. Higiene industrial. Comunicaciones. Etc.
PSICOACÚSTICA Psicoacústica Es la ciencia que estudia las reacciones del Ser Humano ante la percepción sonora. Su objetivo es la evaluación cuantitativa de sensaciones subjetivas originadas a partir de
Más detallesbanda, mayor es la distorsión, y mayor es la probabilidad de que se cometan errores en el receptor.
banda, mayor es la distorsión, y mayor es la probabilidad de que se cometan errores en el receptor. Figura 1.10 Componentes en frecuencia de una onda cuadrada (T = 1/f). En la figura 1.11 se muestra una
Más detalles11. FUENTES DE INFORMACIÓN
multidimensionales Unidad 3: Tratamiento del color Identificar las características del histograma y su uso para el tratamiento del color Obtener el histograma de diferentes imágenes para indicar las características
Más detallesIntro a Grabación. Sonido I - Cátedra Seba. Saturday, June 9, 18
Intro a Grabación Contexto Contexto Grabaciones RODAJE Sonido Directo Sonidos Solos Ambientes y Efectos Doblajes POSTPRODUCCIÓN Foley Ambientes y Efectos MÚSICA Ejemplos Grabación El Clan (2015) (Pablo
Más detallesIntroducción a Las redes Neuronales (Neurales) CO-6612
a Las redes Neuronales (Neurales) CO-6612 Coordenadas iniciales: Prof. Minaya Villasana Oficina: CBI-112 Extension: 906 3386 forma más fácil (preferida) de contacto: mvillasa@usb.ve Bibliografia: Simon
Más detallesCENTRO DEL PROFESORADO DE MÁLAGA
Jornadas Provinciales de la Red de Orientación CENTRO DEL PROFESORADO DE MÁLAGA Taller. 3 Nombre: Alicia Domínguez Málaga, 12/Nov/2014 Funcionamiento del oído Pérdida auditiva Disminución en la capacidad
Más detallesRed Pulsante con Aprendizaje Hebbiano para Clasificación de Patrones Ralos
Red Pulsante con Aprendizaje Hebbiano para Clasificación de Patrones Ralos Iván Peralta, José T Molas, César E Martínez,2, and Hugo L Rufiner,2,3 Laboratorio de Cibernética, Facultad de Ingeniería, Universidad
Más detallesTesis de Máster. Alejandro Legrá Rios. Directores: Javier Macías Guarasa & Daniel Pizarro Pérez
Tesis de Máster Estudio, implementación y evaluación de un sistema de localización de locutores basado en el modelado de arrays de micrófonos como cámaras de perspectiva Alejandro Legrá Rios Directores:
Más detallesÍndice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
Más detallesINGENIERIA ELECTRICA PROGRAMA DE ASIGNATURA
INGENIERIA ELECTRICA PROGRAMA DE ASIGNATURA ACTIVIDAD CURRICULAR: Análisis de señales y Series de tiempo Aplicados a la Ingeniería Eléctrica Código: 950566 Año Académico: 2016 Área: Electrotecnia Bloque:
Más detallesAnálisis de Rasgos Prosódicos en el Español Rioplatense y su Aplicación en el Reconocimiento del Habla
Análisis de Rasgos Prosódicos en el Español Rioplatense y su Aplicación en el Reconocimiento del Habla Tesista: Diego Evin Director: Ing. Jorge Gurlekian Codirector: Dr. Diego Milone Organización de la
Más detallesLa econometría : una mirada de pájaro
La econometría : una mirada de pájaro Contenido Objetivo Definición de Econometría Modelos determinista y estocástico Metodología de la econometría Propiedades de un modelo econométrico Supuestos de un
Más detallesMinería Multimedia. Minería de datos NO estructurados (Textos, Imágenes, Audios y Videos)
Minería Multimedia Minería de datos NO estructurados (Tetos, Imágenes, Audios y Videos) Ana Isabel Oviedo Docente Universidad Pontificia Bolivariana ana.oviedo@upb.edu.co Medellín, octubre 19 de 2017 Motivación
Más detallesPrograma Regular. Asignatura: Señales y Sistemas. Carreras: Bioingeniería. Ciclo lectivo: Docentes: Ing. Fernando Ballina, Ing.
Programa Regular Asignatura: Señales y Sistemas Carreras: Bioingeniería. Ciclo lectivo: 2016 Docentes: Ing. Fernando Ballina, Ing. Melina Podestá Carga horaria semanal: 6 horas. Tipo de asignatura: Es
Más detallesCURSO CORTO DE MONITOREO ESTRUCTURAL DICTADO POR CHARLES FARRAR Y MICHAEL TODD. EXPERTOS DE LOS ALAMOS DYNAMICS.
Chacabuco 1085, of. 502. Concepción, Chile. +56 41 269 7213, +56 9 9833 0367 contacto@lind.cl CURSO CORTO DE MONITOREO ESTRUCTURAL DICTADO POR CHARLES FARRAR Y MICHAEL TODD. EXPERTOS DE LOS ALAMOS DYNAMICS.
Más detallesEstadística Descriptiva
Estadística Descriptiva Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Estadística Descriptiva Es una etapa de la metodología estadística,
Más detallesProcesamiento de voz - Reconocimiento de voz I
Procesamiento de voz - Reconocimiento de voz I Marc S. Reßl Roxana Saint-Nom 2009 Ingeniería Electrónica Instituto Tecnológico de Buenos Aires Reconocimiento de voz El reconocimiento automático de voz
Más detallesIntro a Grabación. Sonido I - Cátedra Seba
Intro a Grabación Contexto Contexto Grabaciones RODAJE Sonido Directo Sonidos Solos Ambientes y Efectos Doblajes POSTPRODUCCIÓN Foley Ambientes y Efectos MÚSICA Objetivos de Grabación FIDELIDAD Cuán precisamente
Más detallesCodificación de audio MPEG. Álvaro Pardo
Codificación de audio MPEG Álvaro Pardo Características del sistema auditivo La sensibilidad del oído es logarítmico respecto a la frecuencia Varía con la frecuencia La discriminación en frecuencia es
Más detallesContenidos. Señales y Sistemas. Procesamiento de la señal de voz. Contenidos. Procesamiento de la señal de voz. Producción del habla
Señales y Sistemas Procesamiento de la señal de voz H Leonardo Rufiner y Gastón Schlotthauer lrufiner@bioingenieriaeduar Laboratorio de Cibernética Facultad de Ingeniería Universidad Nacional de Entre
Más detallesRepresentación y Codificación de Señales Audiovisuales en Televisión Digital MPEG-2 Audio
Representación y Codificación de Señales Audiovisuales en Televisión Digital MPEG-2 Audio José M. Martínez, SPAIN JoseM.Martinez@uam.es tel:+34.91.497.22.58 2011-2012 INDICE Representación y Codificación
Más detallesLa fonética judicial. La comparación de muestras de habla
La fonética judicial!ámbitos de la fonética judicial!la identificación del hablante en el contexto judicial!la comparación entre muestras de habla!el reconocimiento de voces por parte de testigos o de
Más detallesPlanificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6
Planificaciones 6109 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la
Más detallesPlanificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6
Planificaciones 8104 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la
Más detalles3. Señales. Introducción y outline
3. Señales Introducción y outline Outline Señales y Sistemas Discretos: SLIT, Muestreo, análisis tiempo-frecuencia, autocorrelación, espectro, transformada Z, DTFT, DFT, FFT Filtros y Estimación: Filtros
Más detallesINDICE Prefacio 1. Introducción 2. Fundamentos de la imagen digital
INDICE Prefacio XVII 1. Introducción 1.1. Fundamentos 1 1.2. Representación digital de imágenes 6 1.3. Etapas fundamentales del procesamiento de imágenes 8 1.4. Elementos de los sistemas de procesamiento
Más detallesRed Neuronal para el Reconocimiento de Patrones
Conferencia Taller Sistemas Neuro borrosos 26 de abril de 2017 Red Neuronal para el Reconocimiento de Patrones Juan Carlos Alvarado Pérez juan.alvarado@aunar.edu.co Facultad de Ingeniería Programa de ingeniería
Más detallesPrograma Oficial de Asignatura. Ficha Técnica. Presentación. Teoría de la Comunicación
Ficha Técnica Titulación: Grado en Ingeniería de Tecnología y Servicios de Telecomunicación Plan BOE: BOE número 108 de 6 de mayo de 2015 Asignatura: Módulo: Señales y Comunicaciones Curso: 2º Créditos
Más detallesAplicaciones. Inteligencia Computacional Carrera de Ingeniería Informática
Aplicaciones Inteligencia Computacional Carrera de Ingeniería Informática Aplicaciones de IC Unidad VIII: Configuración del problema y aplicación de las técnicas de inteligencia computacional en: clasificación
Más detallesModelos basados en autómatas probabilísticos
Modelos basados en autómatas probabilísticos Bioingeniería I FI-UNER Organización Parte I Autómatas determinísticos Autómatas celulares. Aplicación modelos tejido excitable. Parte II Autómatas probabilísticos
Más detallesINDICE Capitulo 1. Introducción Descripción del Libro Revisión de los Enfoques Teóricos de la Sensación y la Percepción
INDICE Prefacio XV Capitulo 1. Introducción 1 Descripción del Libro 4 Revisión de los Enfoques Teóricos de la Sensación y la Percepción 6 Enfoques Empirista Enfoque de la Gestalt Enfoque Gibsoniano Enfoque
Más detallesRedes y Comunicaciones
Departamento de Sistemas de Comunicación y Control Redes y Comunicaciones Solucionario Tema 3: Datos y señales Tema 3: Datos y señales Resumen La información se debe transformar en señales electromagnéticas
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesSISTEMAS SENSORIALES
SISTEMAS SENSORIALES El procesamiento sensorial comprende cuatro fenómenos: 1. Los receptores sensoriales absorben la energía del mundo externo 1 El procesamiento sensorial comprende cuatro fenómenos:
Más detallesTécnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
Más detallesLa cóclea y la membrana basilar. El oído. El órgano de Corti. Orden Estrigiformes. La captura de la presa 16/02/2011
16/02/2011 Obteniendo y usando información sensorial para cazar Modelo de animales especializados en la caza nocturna mediante sonidos Miguel Escudero Máster Biología Evolutiva Universidad de Sevilla 2
Más detallesCompetencia del curso: Elementos de competencia: Perfil del docente: Elaboró: Marco Antonio Gutiérrez Rosete Agosto 2014
Universidad Estatal de Sonora Secuencia Didáctica Curso: Probabilidad y Estadística Clave: EMAT103 Antecedente: Ninguno Horas aula: 3 (a la semana) Horas plataforma: 1 (a la semana) Competencia del área:
Más detallesConceptos básicos de modelado de procesos
Conceptos básicos de modelado de procesos Apellidos, nombre Departamento Centro Torregrosa López, Juan Ignacio (jitorreg@iqn.upv.es) Ingeniería Química y Nuclear Universitat Politècnica de València 1 Resumen
Más detallesPlanificaciones Procesamiento de Señales I. Docente responsable: GIRIBET JUAN IGNACIO. 1 de 6
Planificaciones 8651 - Procesamiento de Señales I Docente responsable: GIRIBET JUAN IGNACIO 1 de 6 OBJETIVOS CONTENIDOS MÍNIMOS PROGRAMA SINTÉTICO 1. Diseño de filtros digitales. 4. Banco de filtros. 5.
Más detalles