Traductor de Español a LSE 1 basado en reglas gramaticales y morfológicas



Documentos relacionados
Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

FIGURA DEL INTÉRPRETE DE LENGUA DE SIGNOS EN EDUCACIÓN

Centro de Capacitación en Informática

Nueva generación de materiales. Sincronismo video/web

(Altas de prestaciones por ERE S): guía para las empresas

Unidad VI: Supervisión y Revisión del proyecto

DISEÑO DE INDICADORES DE DESIGUALDAD SOCIAL EN LAS CIUDADES.-

Manual de usuario. Tramitación de inspecciones periódicas de ascensores: La visión de los organismos de control autorizado (OCAs)

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

Caso práctico de Cuadro de Mando con Tablas Dinámicas

TEMA 3: EN QUÉ CONSISTE?

El proceso de edición digital en Artelope y CTCE

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

Informe de transparencia del sector fundacional andaluz

Para llegar a conseguir este objetivo hay una serie de líneas a seguir:

Servicio de interpretación. para transferencia de información a personas sordas. Sandra Aguirre Herrera TELECOM Colombia. Servicio de interpretación

UNIDAD DE TRABAJO Nº2. INSTALACIONES DE MEGAFONÍA. UNIDAD DE TRABAJO Nº2.1. Descripción de Componentes. Simbología AURICULARES

INTRODUCCIÓN A LOS SISTEMAS GESTORES DE BASE DE DATOS

La ventana de Microsoft Excel

Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión.

Manual para Empresas Prácticas Curriculares

Biografía lingüística

(altas de trabajadores afectados por EREs): guía para las empresas

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

Microsoft Office: EXCEL. Objetivos curso

Instalación del programa PSPP y obtención de una distribución de frecuencias.

Inter American Accreditation Cooperation. Grupo de prácticas de auditoría de acreditación Directriz sobre:

Estructuras de Datos y Algoritmos. Árboles de Expresión

PROYECTO DISEÑO Y CONSTRUCCIÓN DE LA MAQUETA DE UNA CASA

ZCARTAS: Iniciación a la suma y resta de números enteros Introducción Actividad 1: Escenario con cartas numeradas desde -2 hasta 2...

Capítulo 1. Introducción

Contraseñas seguras: Cómo crearlas y utilizarlas

Receta: Entorno de Movilidad

Cálculo Simbólico también es posible con GeoGebra

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

TÉCNICAS DE ESTUDIO EN EL TERCER CICLO DE EDUCACIÓN PRIMARIA

GESTIÓN Y CONTROL DEL DESARROLLO E IMPLANTACIÓN DE APLICACIONES

Aplicación móvil guía del usuario

Uso de la Herramienta Taller de Moodle para la Corrección entre alumnos en la asignatura de Informática del Grado de Biología.

MEMORIA DE LAS ACCIONES DESARROLLADAS

Por qué es importante la planificación?

Programa Presupuestos de Sevillana de Informática.

Haga clic en Siguiente para comenzar.

Los actuales contact center ofrecen a sus. RACE, un ejemplo de. crecimiento profesional y organizacional sostenido

GOOGLE NOTICIAS Y ALERTAS

Los números racionales

Sistema de Gestión Académica TESEO. Revisión 1.0. Servicio de Informática Área de Gestión (GESTIÓN DE RESÚMENES DE TESIS DOCTORALES)

VAST: Manual de usuario. Autores: Francisco J. Almeida-Martínez Jaime Urquiza-Fuentes

Para ingresar a la aplicación Microsoft PowerPoint 97, los pasos que se deben seguir pueden ser los siguientes:

LUIS GALINDO PÉREZ DE AZPILLAGA HÉCTOR JOSÉ GARCÍA FERNÁNDEZ. Instituto Cibernos. Master Sistemas de Información Geográfica de Sevilla

Manual de usuario para Android de la aplicación PORTAFIRMAS MÓVIL

Propuesta de Trabajo de Iniciación Investigadora. Definición de una notación avanzada y síntesis de Lengua de Signos Española

Comercial Cartas de Fidelización

Estás en: Nos comunicamos > Ayudas técnicas y profesionales > Oirá más si le ponen dos implantes?

Aprender español vía proyectos en niveles avanzados: una experiencia docente

Manual de OpenOffice Impress

Ejercicio 1. Desarrollar un pequeño juego para practicar mecanografía.

Es una persona que ayudará a que los derechos de las personas con discapacidad se hagan realidad

DESCRIPCIÓN TÉCNICA SYSTEM MANAGER SOFTWARE (SMS)

EJERCICIO 3: DOCUMENTO MAESTRO

LA WEB ESCOLAR COMO MEDIO DE INTEGRACIÓN ENTRE EL CENTRO Y LA COMUNIDAD EDUCATIVA: LA BIBLIOTECA ESCOLAR

GUÍA BÁSICA DE USO DEL SISTEMA RED

Manual de usuario de Solmicro BI. Página 1

Módulo II - PowerPoint

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Servicio de telefonía ip de la Universidad Carlos III de Madrid

comunidades autónomas, en accederéis a las direcciones de dichas federaciones.

NORMA INTERNACIONAL DE AUDITORÍA 706 PÁRRAFOS DE ÉNFASIS Y PÁRRAFOS SOBRE OTRAS CUESTIONES EN EL INFORME EMITIDO POR UN AUDITOR INDEPENDIENTE

Capítulo 11. Conclusiones y trabajo futuro

QUÉ ES Y PARA QUÉ SIRVE UML? VERSIONES DEL LENGUAJE UNIFICADO DE MODELADO. TIPOS DE DIAGRAMAS. INGENIERÍA DEL SOFTWARE (DV00205D)

En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.

LINEAMIENTOS PARA LA ELABORACIÓN DEL PROGRAMA ANUAL DE TRABAJO

La perspectiva de género en la sistematización de experiencias

(Periodos de actividad): guía para las empresas

Guía de usuario web. [EL RECUERDO DE LA TIERRA Y EL AMOR A NUESTRA VIRGEN DEL MAR]

CÓMO CREAR NUESTRO CATÁLOGO

Curso Auditor Interno Calidad

Revisión ISO 9001:2015 Preguntas frecuentes

Construcción de Escenarios

Problemas y ventajas de medir con BIM

1. Introducción (justificación del trabajo, contexto, experiencias previas, etc.).

Una experiencia piloto de aplicación del inglés en los estudios de Turismo y Empresariales de la Universidad de Córdoba

RESOLUCIÓN DE ERRORES EN MOODLE CAMPUS VIRTUAL-BIRTUALA UPV-EHU

GESTION DE REQUISICIONES VIA WEB MANUAL DEL USUARIO

Módulo III. Aprendizaje permanente Tema 4: Aprendizaje de actividades laborales Entrevista. El papel de las familias como impulsoras del empleo

WinHIPE: edición, compilación y ejecución de programas; y generación de animaciones web. Manual de usuario.

GUÍA RÁPIDA DE TRABAJOS CON ARCHIVOS.

8. RESULTADOS PREVISTOS

Sistemas de Calidad Empresarial

Diagramas del UML. A continuación se describirán los diagramas más comunes del UML y los conceptos que representan: Diagrama de Clases

LA SELECCION DE PERSONAL

COMENTARIOS SOBRE LAS EXPOSICIONES EN CLASE.

Instrucción IrA (GoTo). Saltos no naturales en el flujo normal de un programa. Pseudocódigo y diagramas de flujo. (CU00182A)

NUEVAS SOLUCIONES y CAMBIOS EN LA GESTION DEL NEGOCIO. JOSE LUIS LENCE Socio Director de Gesfarm Consultoria Farmacias

El reto de la Gestión Documental

Metodología de trabajo

Tiempo libre y vida social Cómo es la comunicación a estas edades?

PROGRAMACIÓN ORIENTADA A OBJETOS

ISO14001: disponer de un certificado bajo la versión de 2008 en vigor - superar una auditoria bajo los requisitos de la nueva versión

Marketing Jurídico, generando negocios online Por: Equipo Mi Guía Legal, El Salvador 23 de febrero de 2016

Transcripción:

Accesibilidad de la Información Traductor de Español a LSE 1 basado en reglas gramaticales y morfológicas Sandra Baldassarri, Francisco J Royo Santas Grupo de Informática Gráfica Avanzada (GIGA) Departamento de Informática e Ingenería de Sistemas Instituto de Investigación en Ingeniería de Aragón (I3A) Universidad de Zaragoza sandra,497328@unizar.es Resumen Este artículo presenta un sistema de traducción de español a Lengua de Signos Española basado en el uso de reglas gramaticales y morfológicas, de modo que se asegura su versatilidad. El sistema está dividido en cuatro módulos: un analizador morfo-sintáctico, un transformador gramatical, un transformador morfológico y, finalmente, un generador de signos. Se trata de un paquete que acepta entradas de cualquier sistema que produzca frases en español escrito y las salidas obtenidas son fácilmente adaptables e interpretables por otro sistema que genere las correspondientes animaciones. El sistema ha sido probado con éxito con una serie de frases extraídas de una presentación de uno de los trabajos del grupo, obteniendo unos tiempos de traducción en torno a los 20 ms. 1. Introducción 1.1. La problemática de las personas sordas En los últimos años, el diseño de interfaces de aplicaciones informáticas ha ido evolucionando con el objetivo de conseguir la mejora de la eficiencia, eficacia y satisfacción del usuario, por medio del uso de los planteamientos de la ingeniería de la usabilidad. Hoy en día diseñar un dispositivo o un programa sin tener en cuenta al usuario final y a sus capacidades carece de sentido. El diseño universal trata de garantizar el uso correcto de aplicaciones y tecnologías, independientemente de si los usuarios presentan alguna discapacidad. De este modo, es necesario desarrollar herramientas que garantizan la accesibilidad para todos los posibles usuarios. Un grupo de usuarios especialmente estudiado por esta disciplina es el constituido por la comunidad sorda. Aunque a simple vista pueda parecer que la mera transformación de la información a mensajes de texto podría servir para solucionar sus problemas, la realidad es más compleja. Las personas sordas no tienen la capacidad de comprender el español de la misma manera que los oyentes, especialmente si su sordera es de nacimiento (sordos prelocutivos). De esta manera, su facilidad para leer y escribir en español, es inferior a la que presentan en su auténtica lengua, la de signos, ya que no disponen de una imagen mental de las palabras o no son capaces de extraer la semántica de todas las palabras y construcciones, como ocurre con las preposiciones. Surge entonces la necesidad de disponer de herramientas que permitan la traducción a la lengua de signos. Sin embargo, hay que tener en cuenta que el problema de desarrollar herramientas para la traducción automática presenta una complejidad adicional, ya que, contrariamente a lo que usualmente se piensa, esta lengua no es universal y cada país tiene la suya propia e incluso algunos, como es el caso de España, varias. 1 Lengua de Signos Española 13

VIII Congreso de Interacción Persona-Ordenador 1.2. Otros sistemas En este campo existen diversos proyectos a nivel mundial que intentan hacer una adaptación o traducción automática de las lenguas escritas a las lenguas de signos. Especial mención merecen ViSiCAST [1] [2] [5] [10] [17] y esign [11], proyectos de grandes dimensiones dentro de la Unión Europea cuyos objetivos consisten en facilitar a los habitantes sordos el acceso a la información. En estos sistemas se realizó un esfuerzo considerable para conseguir sistemas potentes que permitieran integrar todas las fases de traducción, incluyendo la visualización por medio de un avatar. Sin embargo, en estos trabajos, realizados por el Reino Unido, Alemania y Holanda, las lenguas que intervienen, todas germánicas, distan mucho del español en su gramática, por lo que la forma de proceder con español ha de ser diferente, debido a su complejidad. Otro proyecto interesante es el expuesto por el grupo de Tecnologías del Habla de la Universidad Politécnica de Madrid [18]. Su traducción se fundamenta en la creación de reglas que permiten extraer la semántica de las palabras para luego poder agruparlas y dar lugar a los signos. A pesar de que la idea en la que se basa es buena y de que el proyecto se desarrolla en España, este trabajo también se centra en la gramática inglesa. Este mismo grupo de investigación ha llevado a cabo otro proyecto destinado a las oficinas de renovación del DNI [12]. El proyecto es muy completo ya que incluye todas las fases desde el análisis de voz hasta la generación de los gestos. A pesar de obtener unos buenos resultados, las reglas utilizadas son muy dependientes del contexto y se adaptan únicamente al dominio del problema y a sus características morfológicas. También existen varios proyectos basados en traducción estadística, como, por ejemplo, los expuestos en el concurso ALBAYZIN 06 [4]. Este método de traducción presenta el gran inconveniente de que es demasiado general, se utiliza para cualquier tipo de traducción y, a diferencia de lo que sucede con los basados en reglas, los resultados de una traducción para la que no ha sido entrenado, pueden ser más imprevisibles. 1.3. El sistema desarrollado Con el objetivo de desarrollar un sistema completo y versátil, se decidió realizar en primer lugar un estudio exhaustivo de la Lengua de Signos Española, mediante el uso de varios libros [3][15][16], páginas web [9][8][7] (entre otras) y también mediante entrevistas con traductores para poder comparar la forma de construcción de la LSE con el español y poder determinar qué patrones se siguen en las traducciones. Hay que destacar que actualmente la LSE está en proceso de aceptación por el Gobierno Español [13] y que se está trabajando también en la extracción de una gramática de la lengua, aunque ésta presente variantes según las zonas del país. En base a los estudios de la LSE y a la investigación de los trabajos previos en herramientas de traducción automática a LSE, se decidió realizar un sistema que utiliza como base la gramática española y que realiza una serie de transformaciones en las que se tienen en cuenta, por una parte, las características sintácticas y morfológicas de las palabras y, por otra, la semántica de sus significados. De este modo se puede obtener un sistema adaptado al problema específico de traducir de español a LSE. Este uso de la gramática y la adaptación a la lengua española y la LSE son las dos principales novedades de este diseño. Nuestro sistema presenta la ventaja, como ya se ha comentado, de estar basado en reglas, de modo que, para entradas para las que no haya sido preparado, generará unas salidas que siempre cumplirán las reglas de la LSE. Otra característica que diferencia a nuestro sistema de los trabajos anteriores consiste en la capacidad de modificar las traducciones dependiendo del estado de ánimo del intérprete. Para ello se admite la entrada de un parámetro que indica el estado de ánimo (por ejemplo, si está contento, si está enfadado, etc.) de forma que las traducciones pueden variar tal y como ocurre cuando es una persona la que realiza una interpretación a LSE. 14

Accesibilidad de la Información Figura 1. Visión general del sistema 1.4. Estructura del artículo Este artículo se encuentra dividido en siete secciones. En esta primera sección se ha visto una introducción al problema tratado así como una aproximación a algunas soluciones existentes y las características de la solución adoptada para la realización de nuestro sistema automático de traducción del idioma español a LSE. La sección 2 presenta un esquema general del sistema desarrollado. En la sección 3 se realiza una descripción detallada del proceso seguido, paso por paso. La sección 4 expone, con más detalle, las modificaciones del proceso anterior necesarias para incluir el estado de ánimo del intérprete. Los trabajos de integración dentro del sistema Maxine [19], desarrollado por el grupo, se exponen en la sección 5. En la sección 6 se presentan algunos resultados de las pruebas a las que se sometió al sistema para, finalmente en la sección 7 extraer las conclusiones y líneas de trabajo futuro. 2. Visión general del sistema El sistema diseñado se compone de cuatro bloques, como se puede ver en la Figura 1. La traducción de una oración o frase se realiza en cuatro pasos, siendo cada uno realizado por un módulo diferente. Módulo de Análisis Morfo-sintáctico: Toma como entrada una frase en español y obtiene de ella una serie de parámetros que contienen toda la información morfológica de las palabras así como las relaciones y dependencias sintácticas entre ellas. Este módulo utiliza el analizador FreeLing [6], el cual fue portado al sistema Windows para la integración con el resto del proyecto. Este paquete fue elegido por su gran versatilidad, su potencia y su tipo de licencia. Transformación gramatical: A partir de la información sintáctica obtenida del paso anterior, y mediante una serie de reglas gramaticales, genera una secuencia de glosas 2 que, aunque cumplen las reglas gramaticales todavía no son del todo correctas en LSE. Transformación morfológica: Algunas de las glosas que se obtienen en el paso anterior son incorrectas. Esto puede deberse a que la palabra original del español no tiene correspondencia directa con un signo en LSE, bien porque es un sinónimo el que sí la tiene o bien porque en LSE se requieren varios signos 2 Una glosa es una representación en forma de palabra de un signo, similares a las palabras españolas 15

VIII Congreso de Interacción Persona-Ordenador Figura 2. Árbol de dependencias de la frase El padre de mi amigo ha comido un segundo plato en el comedor para una única palabra del español. También sucede a veces que el español utiliza varias palabras para expresar una idea que en LSE se corresponde con un único signo como es el caso de dar un beso que, pese a ser correcto expresarlo en dos palabras en español, se signa únicamente como BESAR, agrupando las correspondientes a DAR y BESO. En este paso se realizan todas estas transformaciones de las palabras dando como resultado unas glosas correctas y cuya gramática también es correcta. Generación de signos: Una vez se han obtenido las glosas apropiadas (aquéllas que se corresponden directamente con signos), en este paso son traducidas a un formato de representación que permita al sistema encargado de interpretar los resultados generar las correspondientes animaciones. 3. Proceso detallado En esta sección se encuentran explicados en detalle cada uno de los cuatro pasos involucrados en el proceso de traducción de una frase. Cada uno de los pasos se corresponde con uno de los procesos expuestos en la Figura 1. 3.1. Paso 1: Análisis morfo-sintáctico El primer paso consiste en el análisis tanto morfológico como sintáctico de cada oración o frase para obtener las características de las palabras (raíz, tipo, género, número, etc.) y las relaciones de dependencia sintáctica que se establecen entre ellas. Las frases se pueden ver como un conjunto de bloques relacionados tales como el sujeto, el objeto, el verbo, etc. Cada uno de estos bloques, por ejemplo el sujeto, a su vez está compuesto por subbloques también relacionados, como son un sintagma nominal, un genitivo, etc. De este modo, la frase puede ser descompuesta sucesivamente en bloques más pequeños hasta llegar a la unidad mínima, que son las palabras. Cada uno de los bloques tiene un núcleo que es la palabra más importante del mismo de modo que una relación de dependencia entre bloques superiores e inferiores se puede representar como una dependencia entre sus núcleos. El núcleo de la frase principal será, por tanto, su palabra más importante, que generalmente se corresponde con el verbo. Para almacenar esta información se utiliza un árbol de dependencias que permite representar las relaciones por medio de un árbol cuyos nodos son las palabras núcleo. Además estos nodos almacenan toda la información morfológica asociada a la palabra y al bloque que representa 16

Accesibilidad de la Información Figura 3. Gráfico explicativo del flujo de datos en el bloque el padre de mi amigo (tipo de bloque, función dentro de la frase, etc.). Esta representación se basa en el análisis por dependencias que efectúa el paquete FreeLing [6]. Ejemplo En la Figura 2 se ve un ejemplo del árbol de dependencias obtenido de analizar la frase El padre de mi amigo ha comido un segundo plato en el comedor. La palabra más importante del ejemplo es el verbo comido, de la que cuelgan los núcleos de los bloques que dependen del verbo: padre (de el padre de mi amigo ), ha (auxiliar del verbo), plato ( un segundo plato ) y en (de en la mesa ). A su vez de padre cuelgan el y de (que representa el genitivo de mi amigo ). 3.2. Paso 2: Transformación gramatical Este paso es el más importante del proceso y en él se aplican las reglas de transformación gramatical a los parámetros obtenidos previamente, para conseguir una frase que cumpla la gramática de la LSE, aunque sus glosas pueden no ser correctas todavía. La transformación gramatical se realiza en orden inverso, utilizando técnicas bottom-up. De este modo, se comienza por las hojas del árbol y la información de la traducción se va transmitiendo a los niveles superiores. Cada nivel nuevo al que se accede recibe todas las informaciones de los nodos que cuelgan de él. En función del tipo de nodo del que se trate (si es un sintagma nominal, un genitivo, un grupo verbal, etc) tiene asociadas unas reglas propias que determinan cómo agrupar esas palabras. Por ejemplo, un sintagma nominal se traduce colocando en primer lugar el sustantivo y, a continuación, los adjetivos y genitivos. El tipo de información que un nivel obtiene de los inferiores a él comprende dos tipos: la información semántica (que se explica a continuación) y la traducción correspondiente a esa parte de la oración. La información semántica sirve para obtener información extra sobre los elementos. Por ejemplo, en una frase tanto el lugar como el tiempo son el mismo tipo de bloque (sintagma nominal con preposición) pero se 17

VIII Congreso de Interacción Persona-Ordenador diferencian únicamente por su semántica. La semántica comprende significados, informaciones de tiempo, de número o de tipo de bloque. Para poder obtener esta información ha sido necesario implementar un diccionario que comprende diversos tipos de informaciones asociadas a las palabras, tales como el significado que aportan (temporal, local, etc.), que en muchos casos resultan indispensables para poder realizar una traducción. Ejemplo En la Figura 3 se encuentra un gráfico explicativo del flujo de información en la traducción del bloque el padre de mi amigo del ejemplo visto en el apartado anterior. Tal y como se ha comentado, el proceso comienza en las hojas del árbol. La palabra mi se analiza como un posesivo de primera persona y se traduce como PROPIO. Esta información se pasa a amigo que la fusiona con la suya propia como sustantivo, generando AMIGO-PROPIO y la información propia de un sintagma nominal. A su vez lo envía a de que añade la suya propia y lo envía a padre. Esta palabra, al juntar las informaciones procedentes de todos sus hijos, el y de y con la de la palabra padre envía al nivel superior toda la información resultante, en este caso, que se trata de un sintagma nominal cuya función es la de sujeto y que se traduce como PADRE-AMIGO-PROPIO. La información final que obtenga la raíz corresponde a la traducción final de toda la frase. En este caso, sería: COMEDOR-PADRE AMIGO- PROPIO-SEGUNDO-PLATO-COMER. 3.3. Paso 3: Transformación morfológica Si bien la oración obtenida en el paso anterior cumple las reglas gramaticales de la LSE, las glosas que la conforman no son correctas porque no son directamente traducibles a signos, al no respetar las reglas morfológicas de la LSE. En este paso del proceso de traducción se realizan las transformaciones necesarias para que sea posible su traducción directa a signos. El incumplimiento de las reglas morfológicas de la LSE se puede producir por diferentes hechos. El caso más sencillo es aquél en el que la palabra en español no tiene correspondencia directa con un único signo pero sí lo tiene algún sinónimo. Este tipo de caso corresponde a los denominados 1-a-1, porque una palabra puede ser sustituida por una glosa. Otra situación que puede darse es que una palabra del español no tenga correspondencia directa sino que sea necesario signar varias palabras, como es el caso de los hiperónimos [15][16]. También es posible que una palabra del español requiera de varios signos simplemente porque se realiza una descripción de la misma para signarla. Así, en LSE no existe un único signo que represente a la palabra COMEDOR sino que se signa mediante HABITACIÓN-COMER. Estas correspondencias son del tipo 1-a-N (una palabra da lugar a varias). En la Figura 4 se ve la transformación que sufre el ejemplo que se ha venido desarrollando en los pasos anteriores en esta parte del proceso de traducción. Figura 4. Transformación 1-a-N en la que COMEDOR se transforma en HABITACIÓN-COMER Pero también puede aparecer el caso contrario, es decir, que la LSE represente en un único signo varias palabras del español. Este problema se da, sobre todo, en expresiones compuestas de varias palabras como TENER-RAZÓN (tener la razón) o DAR-BESO (dar un beso) que serán signadas por un único signo. Estas transformaciones se denominan N-a-1 ya que varias palabras se transforman en una única glosa. Un ejemplo de este caso se observa en la Figura 5. 18

Accesibilidad de la Información 3.4. Paso 4: Generación de signos Figura 5. Transformación N-a-1 en la que DAR y BESO se transforman en BESAR Para llevar a cabo estas transformaciones se decidió diseñar un diccionario que contiene todas estas equivalencias de la forma A=B representando A la secuencia de palabras que se han de buscar en la frase original y B aquéllas por las que han de ser sustituidas. La metodología seguida para realizar las transformaciones consiste en recorrer la oración y efectuar las sustituciones para cada una de las palabras. El algoritmo que se aplica a cada una de ellas consiste en obtener del diccionario todas las posibles transformaciones que comiencen por dicha palabra. Para cada una de éstas se obtiene su porcentaje de sustitución, es decir, qué cantidad de las palabras que forman parte de ella se encuentran en la frase original. Este recorrido de las posibles sustituciones se realiza comenzando por aquéllas que comprenden un mayor número de palabras y se acaba con las de una única palabra de modo que se asegura que, en caso de existir varias sustituciones realizables, siempre se llevará a cabo aquélla que comprenda más palabras. Cuando se ha obtenido un porcentaje del 100%, es decir, cuando todas las palabras de la parte izquierda (A) se han localizado en la frase, se suprimen éstas en la frase original excepto la primera que será sustituida por todas las correspondientes de la parte B. Este efecto se puede observar en la Figura 5, donde BESO desaparece una vez que se han localizado las dos palabras a sustituir (DAR y BESO). Como resultado de este proceso, tras recorrer toda la frase, se obtiene una sucesión de glosas correctas y signables directamente. El último paso del proceso de traducción realiza la conexión entre las glosas corregidas y el sistema encargado de generar y visualizar las animaciones (ver Figura 1). Este módulo transforma los resultados de la traducción a un sistema de representación que permite al sistema de animación generar las correspondientes a los gestos de la frase. Dado que el sistema está pensado para ser integrado en uno mayor capaz de tomar las salidas producidas e interpretarlas, el método final elegido para representar los signos será el que determine este sistema de animación. Para llevar a cabo esta transformación, el módulo se ha dividido en tres: Traducción de palabras: Realiza la traducción de las glosas a un formato intermedio que luego el intérprete de los signos debe ser capaz de interpretar. En este campo se han estudiado varios formatos, como el HamNoSys (Hamburg Notation System) [14] o el SiGML (Signing gesture markup language) [5], pasando por scripts propios de órdenes. Sin embargo, la elección final del formato es dependiente del sistema que vaya a realizar la animación. En cualquier caso, hay que comentar que la versatilidad es máxima ya que el sistema desarrollado trabaja con ficheros XML. En el caso de la integración con Maxine (ver sección 5) el método empleado son los scripts de animación aunque se prevé el cambio a un sistema distinto de representación de los movimientos basado en sus parámetros, como se utiliza en otros sistemas, de modo que sea posible representar cualquier signo. Módulo de deletreo: En LSE existen algunas glosas que requieren su deletreo dactilológico. Concretamente, se deletrean aquellas que no poseen una traducción en el diccionario anteriormente mencionado. Para ello se crea un módulo específico que divide las palabras en sus letras, atendiendo a características propias del español como son la existencia de las agrupaciones RR, CH o LL, que en LSE poseen signos propios. Otros signos: Aparte de las palabras propiamente traducibles a signos, existen otros elementos importantes como son los cambios 19

VIII Congreso de Interacción Persona-Ordenador de humor del traductor o algunos gestos relacionados con su expresión. Estos signos especiales requieren de una traducción especial, aunque ésta es compatible con el diccionario de palabras. Para representar estas informaciones se crean una serie de glosas especiales, encerradas entre <> que contienen órdenes explícitas, por ejemplo hacer hincapié con la mirada o poner cara de disgusto. 4. Inclusión del estado de ánimo El estado de ánimo en que se encuentra una persona sorda influye en la manera de comunicarse, al igual que ocurre a las personas hablantes. En este caso, por una parte se modifica la manera de construir las frases y los signos que las componen y, por otra, la realización final de los signos. En el sistema desarrollado la inclusión del estado de ánimo provoca cambios en dos de las etapas de traducción: se modifican las reglas gramaticales y también la transformación final de los signos. 4.1. Transformación gramatical Como ya se ha visto, cada tipo de bloque lleva asociadas una serie de reglas propias de la forma y función que tiene. Estos procedimientos se modifican para cambiar la manera de generar las traducciones, en función del estado de ánimo. El estado influye haciendo que algunas palabras, como el núcleo, se repitan más veces o aparezcan nuevas (similares a las muletillas o coletillas). Aunque también puede darse el caso de que algunos bloques cambien el orden de sus palabras, para hacer énfasis en algunas de ellas. 4.2. Generación de signos El estado de ánimo también influye en la manera de signar las palabras concretas. Así, por ejemplo, la palabra no puede presentar diferentes gestos. Cuando el que signa está contento mueve el dedo mientras que si está enfadado suele recurrir a la dactilología y realizar N-O. Para tener en cuenta estos casos, el diccionario que se utiliza para la traducción final de las glosas al lenguaje de representación elegido (ver 3.4) se ha modificado, permitiendo que una misma palabra tenga diferentes traducciones en función del parámetro estado de ánimo. 5. Integración en el sistema Maxine El objetivo que se perseguía era la construcción de un módulo de traducción que fuera integrable en otro que necesitara estas traducciones para poderlas signar. Dentro del grupo se ha desarrollado un sistema de este tipo denominado Maxine[19]. Se trata de un entorno basado en librerías de código abierto capaz de generar escenas 3D en tiempo real y de incluir en ellas actores virtuales a los que se han añadido diferentes características como pueden ser, entre otras, las animaciones, la dotación de expresión facial que varía en función del estado de ánimo del actor, la capacidad para hablar y vocalizar aquello que se dice, la habilidad de modificar su voz de acuerdo con su estado o la capacidad de realizar presentaciones basadas en transparencias tipo PowerPoint [19] en función del contenido de las mismas y las anotaciones hechas. Dentro de las características de Maxine se considera de gran importancia que los actores virtuales puedan hacer sus presentaciones en lengua de signos. Actualmente, el sistema Maxine se basa en ejecución de comandos, bien introducidos por el usuario, bien ejecutados en forma de scripts. Con la inclusión de este sistema de traducción de lenguaje español a LSE, se ha creado un nuevo comando del tipo di esta frase en lengua de signos. Actualmente está en proyecto el aumento de capacidad de este software para animar correctamente las órdenes extraídas del traductor. Ahora el sistema ya es capaz de interpretar algunos de estos signos producidos por el traductor, aunque se han de crear las animaciones correspondientes en un proceso que no es trivial. El sistema incluye también un módulo de captura de voz y transformación a texto que produce entradas válidas para el sistema traductor, de modo que, con su integración, se puede 20

Accesibilidad de la Información alcanzar el nivel de traducción de texto hablado a signos. Como ya se ha comentado, los actores virtuales poseen también un estado de ánimo que, al ser proporcionado al traductor, puede influir en la manera que éste tiene de realizar las traducciones, dotando a las mismas de un gran dinamismo y asemejándolas a las realizadas por un traductor humano. Aunque la integración completa no se ha terminado de implementar, todas las pruebas realizadas hasta el momento, han concluido con éxito tanto su integración como librería como sus resultados temporales. 6. Resultados: Medida de prestaciones Los resultados obtenidos en las pruebas realizadas para comprobar la velocidad de traducción del sistema fueron muy satisfactorios. Dado que el objetivo inicial era integrarlo en una plataforma de tiempo real y dotar a ésta de capacidad de traducción, era necesario obtener un sistema rápido. Para comprobar los tiempos empleados en las traducciones se realizaron una serie de pruebas de medición de tiempos al sistema e, incluso en la versión de depuración, el tiempo invertido en cada traducción oscila alrededor de los 20 milisegundos, lo cual permite su integración en sistemas de tiempo real donde haga falta una traducción automática de frases. Las frases empleadas en las mediciones son de diversa longitud, desde frases simples del tipo Cómo estás? hasta más complejas, alcanzando incluso las 25 palabras y varios verbos, con estructuras de subordinación. La verificación de la calidad de las traducciones se está realizando actualmente, y se espera obtener resultados cuantitativos y cuantitativos próximamente. Hay que destacar que para garantizar la calidad se está trabajando de forma conjunta con profesoras de Lengua de Signos del módulo de intérpretes de lengua de signos del Instituto María Moliner de Zaragoza. 7. Conclusiones y Trabajo futuro En este proyecto se ha realizado un prototipo de traductor de la lengua española a LSE que se basa en el uso de reglas gramaticales y morfológicas y que permite la traducción de frases en tiempo real. Admite como entrada frases en español escrito que pueden provenir de cualquier sistema capaz de generarlas y sus salidas pueden ser generadas en diferentes formatos, adaptables a sistemas de generación de animaciones. El sistema desarrollado permite incluir el estado de ánimo del intérprete de forma tal que se consigue una modificación de los signos obtenidos dependiendo de si el intérprete se encuentre alegre, enfadado, etc. En cuanto al trabajo futuro, una línea muy importante correspondería a la ampliación de sus reglas gramaticales, de modo que su capacidad de traducción aumente. Por otra parte, el sistema desarrollado no cuenta actualmente con ningún módulo de sustitución de pronombres. Aunque, en principio, este módulo no fue necesario debido a las características de las frases que se querían traducir, sería una línea interesante de ampliación del sistema. Agradecimientos Nos gustaría agradecer su colaboración a todas las personas que nos ayudaron con la lengua de signos, especialmente a Lourdes Gil y Esperanza Heredia, profesoras del módulo de intérprete de lengua de signos del I.E.S. María Moliner, por el tiempo dedicado. Este trabajo ha sido parcialmente financiado por la Dirección General de Investigación a través del Proyecto Nº TIN2004-07926 y por el Gobierno de Aragón gracias al Convenio Walqa Ref. 2004/04/86 y al Proyecto Nº CTPP02/2006. Referencias [1] Bahngham, JA, Cox, SJ, Elliott, R, Glauert, JRW, Marshall, I, Virtual Signing: Capture, Animation, Storage and Transmission an Overview of the ViSiCAST Project. [2] Bahhgham, JA, Cox, SJ, Lincoln, M, Marshall, I, Signing for the deaf using virtual humans. [3] CNSE, SIGNAR. Aprende lengua de signos española. Nivel Inicial. Fundación CNSE. Madrid. 2002. 21

VIII Congreso de Interacción Persona-Ordenador [4] Comité Organizador de las IV Jornadas en Tecnologías del Habla, Libro de actas de las jornadas. http://jth2006.unizar.es/actas/4jth_actas.html [5] Elliott, R, Glauert, JRW, Kennaway, JR, Marshall, I, The Development of Language Processing Support for the ViSiCAST Project [6] FreeLing. http://garraf.epsevg.upc.es/freeling desarrollado por el Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla de la Universidad Politécnica de Cataluña. [7] http://personal2.redestb.es/martingv/ls.htm [8] http://www.merida.es/lenguaje_signos/portada.html [9] http://www.planetavisual.net/right/diccio/inde x.htm [10] http://www.visicast.sys.uea.ac.uk/ [11] http://www.visicast.sys.uea.ac.uk/esign/ind ex.html [12] Ibáñez, E, Huerta, A, San-Segundo, R, D Haro, LF, Fernández, F, Barra, R, Prototipo de traducción de voz a lengua de signos española. IV Jornadas en Tecnología del Habla. [13] Noticia aparecida en el diario 20 minutos. http://www.20minutos.es/noticia/81489/0/esp ANA/LENGUAJESIGNOS/ [14] Página del proyecto HamNoSys (en alemán). http://www.sign-lang.unihamburg.de/projekte/hamnosys/default.html [15] Pérez Corbacho, J, García Fernández, JM, Guillén Gosálbez, C, Sánchez Caravaca, M, Introducción a la lengua de signos española: una experiencia piloto, Diego Martín. Murcia. 2001 [16] Rodríguez, MA, Lenguaje de signos. Tesis doctoral. CNSE y ONCE. Madrid. 1992 [17] Safar, E, Marshall, I, The Architecture of an English-Text-to-Sign-Languages Translation System [18] San-Segundo, R, Macías-Guarasa, J, Montero, JM, Fernández, F, Translating Spoken Language into Sign Language [19] Serón F., Baldassarri S., Cerezo E.: "MaxinePPT: Using 3D Virtual Characters for Natural Interaction". Proc. 2nd International Workshop on Ubiquitous Computing & Ambient Intelligence, pp. 241-250, 2006. 22