Asignación de Prosodia en Sistemas TTS

Documentos relacionados
Síntesis Concatenativa. Introducción a las Tecnologías del Habla 2 o cuatrimestre 2014 Agustín Gravano

Tema No. 3 La microestructura de los textos: Los párrafo

Cuantificación: Los Cuantificadores y el resto de la oración

RECONOCIMIENTO DE PALABRAS

Capítulo 5. Conclusiones

1.- Enunciado / oración 2.- Estructura de la oración 3.- Las funciones sintácticas 4.- Clasificación de la oración simple

UNIVERSIDAD CARLOS III DE MADRID PROGRAMA DE LA ASIGNATURA: LENGUA CASTELLANA

Inteligencia artificial

Modelo del Lenguaje. N-gramas.

7 Esp. U 2. L 18 Elaborar un plan textual, organizando los elementos para producir oralmente un texto narrativo. 7 Esp. U 2. L 19

Lengua Española I. Tema 7. Los elementos suprasegmentales: el acento y la entonación en español

Capitulo I. Introducción

INGLÉS. CONTENIDOS TRAMO I. 1. Contenidos léxico-semánticos

Fonética y Fonología españolas

ETIQUETAS EFICACES CON NEUROMARKETING : EL PODER DEL EMPAQUE EMOCIONAL HENRY CASTILLO. PhD. NEUROMIND Neuromarketing Solutions

MKTE BOOKING. Por puntos de interes. Por destino. Ciudad de destino. Salida. Cantidad de habitaciones 1 habitacion BUSCAR

PRIMERO DE BACHILLERATO

EL ADVERBIO. Juegas bien. (En este caso, el adverbio bien, es el núcleo de una frase adverbial que complementa al verbo al que acompaña).

PRUEBA DE ACCESO A LA UNIVERSIDAD MAYORES DE 25 AÑOS Y MAYORES DE 45 AÑOS FASE GENERAL COMENTARIO ORIENTACIONES PRUEBA SOLUCIONARIO

Acentuación de palabras, signos de puntuación y vicios del lenguaje

Presentación y generalidades

PRUEBAS SOLEMNES II SEMESTRE DE 2011 APRENDIZAJES ESPERADOS Y CONTENIDOS A EVALUAR APRENDIZAJES ESPERADOS

Reporte de la prueba de habilidad

CURSO: PRESENTE Y DESAFIOS DE LA GESTION PARLAMENTARIA

FACULTAD DE INGENIERÍA

Síntesis de Voz. Prof. Eduardo López Gonzalo Dpto. Señales, Sistemas y Radiocomunicaciones

ACTIVIDADES PARA ESTUDIANTES

PROCESO SELECTIVO 2010 ADMINISTRACIÓN DE EMPRESAS PROPUESTA DE CRITERIOS DE VALORACIÓN

Nueva Ortografía de la Lengua Española

Se realizarán 10 preguntas, valoradas con un punto cada una.

Fundamentos de Bases de Datos Facultad de Ciencias UNAM

DESARROLLO DE PRODUCTOS

El adjetivo determinativo y el pronombre. [4.1] Cómo estudiar este tema? [4.2] Introducción T E M A

Lección 2. EXPRESAR EXISTENCIA Y UBICACIÓN: hay o estar

UNIVERSIDADES PÚBLICAS DE LA COMUNIDAD DE MADRID MATERIA: LENGUAJE Y PRÁCTICA MUSICAL

Lectura complementaria

TAREAS 5º Grado PRIMARIA Sede Chapultepec. Lunes 3 de marzo Materia Descripción Referencias ESPAÑOL Haz las actividades de anexo 1.

Hay varias clases de pronombres: personales, posesivos, numerales, indefinidos, interrogativos, exclamativos y relativos.

Fidelización de clientes en un entorno de crisis y Low Cost

LENGUAJE, LENGUA Y HABLA. EL SIGNO LINGÜÍSTICO.

Programa de Inglés Lectura Nivel I

TÉCNICAS DE ESTUDIO (I): SUBRAYADO

IDENTIDAD CORPORATIVA

Qué es una rúbrica? Segundo Congreso de Educación Formando Formadores «Hay Talento 2010»

ORACIÓN GRAMATICAL DEFINICIONES

INTRODUCCIÓN La lengua como sistema El signo lingüístico Las articulaciones La lengua como pluralidad de sistemas 24

MARIA. -Plan de Estudios- Doctorado en Marketing

PROGRAMA INSTRUCCIONAL OPTATIVA: REDACCIÓN Y ESTILO

INSTITUCIÓN EDUCATIVA GABRIEL TRUJILLO CORREGIMIENTO DE CAIMALITO, PEREIRA

RESPUESTA A PREGUNTAS INFORMÁTICAS FRECUENTES.

COMENTARIO DE TEXTO (LENGUA CASTELLANA Y LITERATURA) Coordinadora: Nuria Polo Cano

3. DOCUMENTACIÓN 3.1. DOCUMENTACIÓN DE APLICACIONES. OBJETIVOS PARA MODIFICAR HACE FALTA COMPRENDER/ESTUDIAR:

Guía del Curso MF0984_3 Inglés Profesional para la Asistencia a la Dirección

Clase 4. Primavera 2011

Partes de la oración. Funciones sintácticas. Julián Cosmes-Cuesta

White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por:

PROCESO SELECTIVO CRITERIOS DE VALORACIÓN ESPECIALIDAD: AUDICIÓN Y LENGUAJE

CLASES DE PALABRAS CATEGORÍAS GRAMATICALES

Datamining Introducción

Ana Pascual Nobajas Jefe de Servicio de Desarrollo Junta de Comunidades de Castilla-La Mancha

Evaluación de las dificultades prosódicas en niños con trastornos del desarrollo, con especial referencia a los trastornos del espectro autista

PARTE I: ANTECEDENTES

LENGUA CASTELLANA. 1º

OPCIÓN A. 1. Explique, según las normas de acentuación del castellano, por qué la siguiente palabra va acentuada: césped.

Del texto al habla GTP-UPC. Procesamiento previo del texto Transcripción fonética automática. Análisis lingüístico

TÉCNICAS DE REDACCIÓN Código: 0000

ESCUELA OFICIAL DE IDIOMAS DE ZALLA PRUEBA DE A1 (NIVEL BÁSICO 1) DE LOS IDIOMAS EUSKERA, FRANCÉS E INGLÉS. CANDIDATOS OFICIALES ÚNICAMENTE

Identificación y uso de las formas deícticas

DIRECCIÓN GENERAL DE RECURSOS HUMANOS

NIVEL 4 (B1 del Marco Europeo Común de Referencia) Parte 1: Comprensión Auditiva TAREA TIPO DE TAREA Y FORMATO OBJETIVO

PLANES DE RECUPERACIÓN DE 1º ESO PARA SEPTIEMBRE - curso 2013/14 LENGUA CASTELLANA Y LITERATURA

Reclutamiento Selección de Personal

DESARROLLO DE NUEVOS PRODUCTOS. Giovanni Herrera E. PhD 2016

La fonología es esencialmente la descripción del sistema y de los patrones de los sonidos de una lengua (Yule 1998:66).

[Escriba texto] CÓMO ESCRIBIR UN TFG

USAR EL PLUG-IN PARA MS OUTLOOK

«Mi personaje no es una caricatura» R. G.

Li n g ü í s t i c a / Vol. 29 (2), diciembre 2013:

Unidad 5 Morfosintaxis I:

Obtener un resumen de un nuevo tema de forma rápida: refine

La noticia que han publicado hoy todos los periódicos es falsa. D N CN( Prop subor adjetiva)

LAS EMOCIONES EN EL COMPORTAMIENTO DE COMPRA

Preliminares Métodos de Derivación Numérica DERIVACIÓN NUMÉRICA DERIVACIÓN NUMÉRICA

UNIDAD 5: SUBRAYADO. TALLER DE HÁBITOS Y TÉCNICAS DE ESTUDIO Tercer ciclo de Educación Primaria. SERVEI D ORIENTACIÓ EDUCATIVA Curso 2012/13

DETERMINANTES: A. ARTÍCULOS: Masculino Femenino Neutro. 1ª persona 2ª persona 3ª persona Masculino Femenino Masculino Femenino Masculino Femenino

Borrador del temario de la guía PAA. PRIMERA PARTE: RAZONAMIENTO VERBAL.

ANEXO III 2.º DE EDUCACIÓN SECUNDARIA

Rige a partir de la convocatoria

Sistemas de Diálogo Hablado

Síntesis de voz utilizado Selección de Unidades

24 - OR AC I Ó N C O M P U E S T A

PERFIL DE EGRESO INSTITUCIONAL

OPCIÓN A. 1. Explique, según las normas de acentuación del castellano, por qué la siguiente palabra va acentuada: cántaro.

Lenguaje. Hay muchos esquemas que muestran cómo es ese proceso de la comunicación. Éste es uno de ellos (QUILIS, 1993:13):

EXAMEN CERTIFICACION TOEIC. (Listening & Reading)+ (Speaking & Writing)

Es importante respetar algunas condiciones a la hora de utilizar el material y presentar las tareas:

Elaboración de Documentos en Procesadores de Textos

En escenarios de incertidumbre: Medir para tomar decisiones.

LENGUA CASTELLANA. 1º Primer contacto

Transcripción:

Asignación de Prosodia en Sistemas TTS Introducción a las Tecnologías del Habla 2 o cuatrimestre 2014 Agustín Gravano

Prosodia en sistemas TTS Dos tareas separadas: 1) Dado un texto, determinar una prosodia adecuada. Front end. 2) Dada una prosodia elegida para un texto, generarla de manera aceptable. Back end. Selección de unidades: elegir las unidades (ej. dífonos) de la BD que más se aproximen a la prosodia elegida. Síntesis de dífonos, articulatoria y por formantes: manipular la señal para lograr la prosodia deseada.

Prosodia en sistemas TTS Dos tareas separadas: 1) Dado un texto, determinar una prosodia adecuada. Front end. 2) Dada una prosodia elegida para un texto, generarla de manera aceptable. Back end. Selección de unidades: elegir las unidades (ej. dífonos) de la BD que más se aproximen a la prosodia elegida. Síntesis de dífonos, articulatoria y por formantes: manipular la señal para lograr la prosodia deseada.

Predicción de frases prosódicas Texto de entrada: En enero quería ir a Brasil, pero no encontré nada barato.

Predicción de frases prosódicas Candidatos a límites prosódicos: En? enero? quería? ir? a? Brasil,? pero? no? encontré? nada? barato.?

Predicción de frases prosódicas Posible asignación de límites prosódicos: En enero? quería ir a Brasil,? pero no encontré? nada barato.?

Predicción de frases prosódicas Qué atributos lingüísticos y contextuales están relacionados con la estructura prosódica? Información sintáctica Qué trozos (chunks) tienden a ir juntos? (Abney 1996) Qué trozos tienden a separarse entonacionalmente? En enero quería ir a Brasil, pero no encontré nada barato. Clase de palabras (POS tags) ir:vb? a:prep? Brasil:NP? pero:cc? no:rn

Predicción de frases prosódicas Información ortográfica : ;,. ( )?! Longitud de la oración Lleva a más o menos frases prosódicas. Esta oración es muy? pero muy larga,? lo cual nos lleva a sospechar? que debe disponerse? en unas cuantas frases prosódicas,? o acaso no les parece? Esta? no.

Predicción de frases prosódicas Contexto #1: Las palabras a cada lado del potencial límite prosódico están acentuadas? No había? nadie? en? la estación. Contexto #2: Dónde ocurrió el último límite prosódico? No había nadie en la estación pero? el tren paró igual....

Métodos de aprendizaje automático Árboles de decisión (C4.5), aprendizaje de reglas (Ripper), SVM, HMMs, redes neuronales,... Atributos: w i ; w i-1 ; POS(w i ) ; POS(w i-1 ) ; signo de puntuación entre w i-1 y w i ; w i-1,w i mismo chunk?; etc. Extraídos automáticamente. Clase: Límite prosódico entre w i-1 y w i. (0-4 según ToBI) Rotulado a mano.

Predicción de acentos tonales Texto de entrada: En enero quería ir a Brasil, pero no encontré nada barato.

Predicción de acentos tonales Palabras candidatas a ser acentuadas: En? enero? quería? ir? a? Brasil?, pero? no? encontré? nada? barato?.

Predicción de acentos tonales Posible asignación de acentos tonales: En enero quería ir a Brasil, pero no encontré nada barato.

Predicción de acentos tonales Qué atributos lingüísticos y contextuales están relacionados con los acentos tonales? Categoría de palabra: contenido vs. función a, de, y, su, mi, el, entre, por,...: en general no se acentúan. Information status: Given/new Odio a los perros, y los perros me odian a mí. Contraste No le gustan los gatos, sino los perros. Inferibles Se me descompuso el auto. El mecánico cree que se rompió el carburador.

Predicción de acentos tonales Función gramatical Tu perro se comió mi teléfono. vs. Mi teléfono tiene poca batería. Posición en la oración (surface position): Ayer Jorge faltó al curso. vs. Jorge faltó al curso ayer. Frases nominales complejas: City hall; parking lot; city hall parking lot.

Predicción de acentos tonales Asociación con el foco: John only introduced Mary to Sue. vs. John only introduced Mary to Sue. Paralelismo semántico: A Juan le gusta el vino, pero María prefiere la cerveza. Cuáles de estos fenómenos lingüísticos pueden computarse automáticamente?

Cómo podemos aproximar esta información? Atributos computados automáticamente: Ventana de POS tags alrededor de la palabra candidata a acentuar (w i ). Posición de w i en la oración, párrafo, sección. Pseudo given/new e inferibles (WordNet). Atributos de parsing sintáctico (tan complejo como se pueda ejecutar). Detección de frases nominales complejas + predicción de ubicación del acento tonal. Clase rotulada a mano: Tipo de acento tonal (, H*, L*, L+H*, etc.)

Cómo se evalúan los resultados? Cómo definir un Gold Standard? Corpus de habla natural. Muchos hablantes / mismo texto. Elecciones subjetivas de frases y acentos. No existe un mapeo simple texto prosodia. Muchas variantes son aceptables. En enero quería ir a Brasil, pero no encontré nada barato. Estudios perceptuales para evaluar la calidad subjetiva del resultado. Caros y lentos!

Presente y futuro... Predicción de la prosodia: yendo más allá de las frases y los acentos tonales. Asignación de emoción desde el texto. Personalización de TTS: modelado de estilos individuales de entonación. Comunicar rasgos de personalidad, carisma. Temas abiertos de investigación.