Modelos de producción de voz. Curso de doctorado 2001/2002 Inmaculada Hernáez

Documentos relacionados
Modelo de producción de la voz

3.6. Resonancia y formantes

Los Modos de Articulación

FÍSICA Y QUÍMICA Cuaderno de ejercicios ONDAS

Procesamiento digital de voz

Juegos Interactivos para la Rehabilitación Fonatoria

Diseño de un Sistema de Codificación de Predicción Lineal (LPC)

6.542J, J, HST.712J CURSO PRÁCTICO EN FISIOLOGÍA, ACÚSTICA Y PERCEPCIÓN DEL HABLA Otoño del Programa 06/09/01 TEMAS A CUBRIR

Fundamentos de la producción y percepción de la señal de voz

UNIVERSIDAD DE GRANADA PROCESAMIENTO DE VOZ

Aplicaciones del análisis acústico en los estudios de la voz humana

Mecanismos fisiológicos implicados en la adquisición del lenguaje verbal oral:

Fonética y Fonología españolas

FONETICA Y FONOLOGIA

Teoría acústica de la producción del habla

Los sonidos del habla

El aparato fonatorio

La existencia en las lenguas de vocales y consonantes, diferentes por su articulación, hace necesaria una clasificación separada de estos sonidos.

Capítulo I. El reconocimiento de voz

FONÉTICA ARTICULATORIA. El aparato fonador humano

La fonación es el proceso mediante el cual se produce la voz Voz Resultado de la acción de la laringe

GLOSARIO 349. intensidad relativa de una vocal o una sílaba en una palabra. morfema ligado, que se añade a otro morfema

Aplicaciones de Filtros digitales. clase 14

LA ADQUISICIÓN DEL LENGUAJE: MECANISMOS FISIOLÓGICOS IMPLICADOS

La creación de la corriente de aire

MOVIMIENTO ONDULATORIO

Tema 1: Las ciencias lingüísticas

TEMA 1: LA FONÉTICA ARTICULATORIA

TECNOLOGIAS DE LA VOZ

Fonética y fonología Introducción al lenguaje Material de clase: semana del 4 de marzo de 2002

9TU^dYVYSQSY ^TU\_cC_^YT_c

EL APARATO RESPIRATORIO

TEMA 7: VOCALES 1. LOS FONEMAS VOCÁLICOS Y SUS REALIZACIONES

Introducción a los Filtros Digitales. clase 10

2.1. El aparato fonador

Mª Raquel PEÑA BEDIA (Jefe de Departamento) Curso/Etapa:

La fonación. Tipos de fonación

Prevención de Daño a la Voz

PRINCIPIOS BASICOS DE AUDIO COMO ESCUCHA EL SER HUMANO

TÉCNICAS DE VOZ Y FONIATRÍA -- AGRUPACIÓN DE PERSONAS SORDAS DE ZARAGOZA Y ARAGÓN. y foniatría

Sistemas Lineales e Invariantes PRÁCTICA 2

Revisión de Técnicas de Estimación de Pulso Glotal basadas en Filtrado Inverso *

La ORTOGRAFÍA, pues, consiste en un conjunto de normas que regulan la escritura de la lengua.

Herramientas software para la docencia de la señal de voz en Ingeniería Técnica de Telecomunicaciones

TEMA 6: LA VOZ HUMANA COMO MEDIO DE EXPRESIÓN Y COMUNICACIÓN

LA VOZ HUMANA. Un Mecanismo que lo haga sonar: La Respiración Un material que vibra: Las Cuerdas Vocales Una caja de resonancia: Los Resonadores

780:241 Old Spanish Juan Carlos Castillo. Fonética y Fonología:

Vamos a clasificar la producción de los sonidos en tres bloques:

Asignatura: SISTEMAS LINEALES. Horas/Semana:4 Teoría + 0 Laboratorio. Objetivos

CAPÍTULO 7. /b/ /d/ /g/ [ ] [ ] [ ] FONÉTICA Y FONOLOGÍA ESPAÑOLAS. Claves

DEPARTAMENTO DE FÍSICA COLEGIO "LA ASUNCIÓN"

1.- Qué es una onda?

6.- Cuál es la velocidad de una onda transversal en una cuerda de 2 m de longitud y masa 0,06 kg sometida a una tensión de 500 N?

Universidad Nacional Autónoma de Honduras. Escuela de Física. Electricidad y magnetismo II Fs-415. Filtros Eléctricos y sus aplicaciones

Filtros Digitales II Lic. Matías Romero Costas

FUNDAMENTOS FÍSICOS DE LA INGENIERÍA PROPAGACIÓN DE ONDAS DE AGUA

Cómo se ve la voz? Recibido: 19 de julio de 2007 Aceptado: 26 de julio de 2007

Ondas. Opción Múltiple

Ejercicios de Ondas Mecánicas y Ondas Electromagnéticas.

Fonética acústica (IV) El análisis espectrográfico Los rasgos acústicos I

Síntesis de voz en el dialecto venezolano por medio de la concatenación de difonos

Yurimaguas, 25 de enero 2012

Recomendaciones ergonómicas

Mecánica de Sistemas y Fenómenos Ondulatorios Práctico 4

Proporciona el oxígeno que el cuerpo necesita y elimina el dióxido de carbono o gas carbónico que se produce en todas las células.

Redes y Comunicaciones

A: Amplitud λ : Longitud de onda

Asignatura: SISTEMAS LINEALES. Horas/Semana:4 Teoría + 0 Laboratorio. Objetivos. Programa

F2 Bach. Movimiento ondulatorio

FACULTAD DE INGENIERÍA Y CIENCIAS AGROPECUARIAS / INGENIERÍA EN SONIDO Y ACÚSTICA

EL NIVEL FÓNICO 1. EL APARATO FONADOR.-

ÁREA DE FÍSICA GUÍA DE APLICACIÓN TEMA: ACÚSTICA Y ÓPTICA GUÍA: 1203 ESTUDIANTE: FECHA:

LA VOZ Y SUS CUALIDADES

Codificación de Audio

El aparato fonador. Física (Fisiología II) C r i s t i n a H e r r e r a F e r n á n d e z. B e g o ñ a M o r a n t e M i g u e l. 1º Grado Logopedia

PROGRAMA DE ESTUDIO. Práctica. Práctica ( ) Semestre recomendado: 8º. Requisitos curriculares: Sistemas Digitales 2

La articulación

Mora Elsa, Martínez Hernán Análisis acústico de los sonidos del español venezolano Universidad de Los Andes p.

Retardo de transporte

II. MOVIMIENTOS RESPIRATORIOS.

Tecnologías del habla

INSTRUCTIVO DE USO DE LA VOZ EN LA DOCENCIA DE MANERA SEGURA en La U.N.R.C.

Primero, Secundaria. III. La voz y el canto Incorpora la técnica vocal para identificar las posibilidades expresivas de la voz y el canto.

SINTESIS INFORMATICA MUSICAL DISTINGUIR: "sonido real" de uno digital o análogo sonidos, naturales humanos tecnologícos.

A) FÍSICA II (CURSO DE LA FACULTAD DE CIENCIAS, CLAVE : T91F2) B) DATOS BÁSICOS DEL CURSO C) OBJETIVOS DEL CURSO

Tema 2. La Generación de la Señal de Voz Introducción

LA VOZ HUMANA 1. CONCEPTOS PRELIMINARES. Federico Miyara Comunicación y lenguaje

18 CONGRESO INTERNACIONAL MEXICANO DE ACÚSTICA (18th MEXICAN INTERNATIONAL CONGRESS ON ACOUSTICS)

1. Señales y sistemas Sistemas lineales e invariantes en el tiempo (SLI) 13.5

FACULTAD DE INGENIERÍAS Y ARQUITECTURA SÍLABO

LENGUA CASTELLANA Y LITERATURA 2º BACHILLERATO UNIDAD 1 LA COMUNICACIÓN. EL NIVEL FÓNICO

FACULTAD DE INGENIERÍAS Y ARQUITECTURA SÍLABO

Estudios de las cualidades del sonido

Tema 2. Sistema fonológico español

PREVENCIÓN DE LOS TRASTORNOS DE LA VOZ

Algoritmo robusto para la detección de la frecuencia fundamental de la voz basado en el espectrograma

ACÚSTICA Y ELECTROACÚSTICA (CURSO ) Tema I: Principios básicos del sonido y acústica medioambiental

HIDRODINÁMICA. Profesor: Robinson Pino H.

Acústica musical. Escuela Universitaria de Música eme, Leonardo Fiorelli Martín Rocamora. Curso dirigido a docentes de IPA

En la figura 1 se observan los cambios de polaridad (positivo y negativo) y las variaciones en amplitud de una onda de ca.

Transcripción:

Modelos de producción de voz Curso de doctorado 2001/2002 Inmaculada Hernáez inma@bips.bi.ehu.es

Modelos de producción de voz Teoría de la producción del habla El sintetizador de formantes

Teoría de la producción del habla Sistema sub-glotal: pulmones, bronquios y tráquea, son la fuente de energía Tracto vocal (longitud media 17cm, sección de 0 a 20 cm: Glotis (aloja las cuerdas vocales) Faringe Cavidad bucal Tracto nasal: velo del paladar y nariz Sonidos nasales: el velo del paladar baja y el tracto vocal y nasal se acoplan acústicamente (producción de los sonidos nasales). Voz: Onda acústica radiada cuando los pulmones expulsan el aire y el flujo resultante es perturbado por alguna constricción en el tracto vocal.

Teoría de la producción del habla

Teoría de la producción del habla Sonidos sonoros: el flujo del aire procedente de los pulmones es periódicamente interrumpido por la apertura y cierre de las cuerdas vocales. Es un flujo periódico de frecuencia fundamental F0 (frecuencia de pitch). Sonidos sordos: No hay vibración de las cuerdas vocales. El flujo de aire encuentra una constricción en el tracto vocal, tomando gran velocidad y formando turbulencias. Tracto vocal y tracto nasal: Actúan de cavidades resonantes, cuyas frecuencias de resonancia se conocen como Formantes. Los valores de los formantes dependen de la forma y dimensiones del tracto vocal. Por ello, las características espectrales de la voz varían en el tiempo como varía la forma del tracto vocal.

Teoría de la producción del habla Hombres: Glotis de mayor tamaño, cuerdas vocales más largas, voz más grave. Mujeres y niños: Glotis más pequeña, cuerdas vocales más cortas, voz más aguda.

Teoría de la producción del habla

Teoría de la producción del habla Excitación Cavidad Resonante Radiación labios g(t) Pulso de Rosenberg G(f)

Teoría de la producción del habla Resonancias orales:

Teoría de la producción del habla Vocales: Desde la glotis, el aire atraviesa la cavidad bucal sin obstáculos. Las vocales siempre son sonoras. Consonantes: La lengua o los labios ayudados por los dientes y por el paladar interrumpen total (oclusivas) o parcialmente (fricativas, africadas) el paso del aire.

Modelo del tubo sin pérdidas

Modelo del tubo sin pérdidas

Modelos digitales a) Modelo Tubo sin pérdidas b) Sistema discreto equivalente c) Retardos enteros

Modelos digitales Línea discontínua: terminación en cortocircuito º

Modelos digitales

Modelos digitales A V GENERADOR de PULSOS PULSO GLOTAL G(z) x EXCITACIÓN SONORA F0 TRACTO VOCAL V(z) RADIACIÓN LABIOS R(z) s(n) GENERADOR de RUIDO x A U EXCITACIÓN SORDA COEFICIENTES REFLEXIÓN GENERADOR de EXCITACIONES u(n) TRACTO VOCAL H(z) G(z) V(z) R(z)

Modelos digitales Modelo de fuente y tracto vocal: Separa totalmente características de fuente y de tracto vocal. Funciona mejor cuando los parámetros varían lentamente: sonidos más estacionarios. Filtro V(z) todo polos: solo tiene resonancias, no puede modelar los ceros de las nasales. Separa fuente ruidosa y sonora: no válido para todos los sonidos. Cambio brusco de una fuente a otra: no realista.

Modelos de producción de voz Teoría de la producción del habla El sintetizador de formantes

El sintetizador de formantes Esquema general basado en el modelo de fuente y tracto vocal. Es uno de los primeras técnicas utilzadas para síntesis de voz y conversión de texto a voz (Holmes-63, Klatt-80). El tracto vocal se implementa con tipos de configuraciones de filtros, en función del sonido de que se trate:

El sintetizador de formantes La rama paralelo está formada por resonadores de segundo orden conectados en paralelo. La propuesta de Holmes únicamente incluía esta rama (Holmes-83). Es muy flexible, pero muy difícil de ajustar.

El sintetizador de formantes La rama serie está formada por una serie de resonadores de segundo orden conectados en cascada (o serie). Tiene menos parámetros de configuración (no pueden ajustarse las amplitudes) y modela muy bien la producción de las vocales. No puede utilizarse para las sordas.

El sintetizador de formantes Circuito resonador digital de segundo orden: y( n) = a x( n) + b y( n 1) + c y( n 2) El valor de la respuesta aumenta con la frecuencia y disminuye con el ancho de banda. Esto debe considerarse cuando se combinen las respuestas de varios resonadores. a H ( z) = 1 1 b z c z a = 1 b c b = 2 g cos(2 π c = g g = e 2 2π B F s P F s ) 2 P=Frecuencia del polo (500, 1500, 2500, 3500Hz) B=Ancho de banda (50 y 100Hz para P1 y P2, y 50 para P3 y P4)

F s B s e g g a c F P g a b c b a z c z b a z H π π 2 2 2 1 ' ) cos(2 2 ' ' 1 1 ' ' ' ' ) ( = = = = + + = 2) ( ' 1) ( ' ) ( ' ) ( + + = n x c n x b n x a n y Circuito antirresonador digital de segundo orden: P=Frecuencia del cero (500, 1500, 2500, 3500Hz) B=Ancho de banda (50 Hz) El sintetizador de formantes

El sintetizador de formantes Excitación sonora: hay muchas propuestas para la configuración del pulso glotal.

El sintetizador de formantes Excitación sorda:

El sintetizador de formantes Vocales: valores de los formantes constantes. 2200Hz F2 F1 300Hz i e a o u

Bibliografía Rabiner, L.R. Schfer, R.W (1978) Digital Processing of Speech Signal. Prentice-Hall Signal Processing Sreries Alan V. Oppenheim. Series Editor. 1978.Rabiner Klatt, D., (1980) Software for a Cascade/Parallel Formant Synthesizer. Journal of the Acoustical Society of America, vol.67, pp.971-995 Holmes, J. (1983), Formant Synthesizer- Cascade or Parallel? Speech Communication, vol 2, pp.251-273 Holmes, J., Mattingly, I., Shearme, J. (1964) Speech Synthesis by Rule. Language an Speech, vol. 7, pp. 127-143