2. Traducción Automática. Dimensiones y Estrategias

Documentos relacionados
traducción audiovisual

1. Idiomas y direcciones tratados. Diseño de sistemas de TA. 2. Intervención humana (1/2) Sistemas multilingue. 2. Intervención humana (2/2)

0834 GRADO EN ESPAÑOL: LENGUA Y LITERATURA

Guía Docente: Guía Básica

Mundos en palabras. Learning Advanced Spanish through Translation. Ángeles ^arreres María Noriega-Sánchez Carme Calduch

Fansub VS Fastsub. Qué es la traducción?

TEMARIO DE PROFESORES DE ESCUELAS OFICIALES DE IDIOMAS INGLÉS. (Publicado en el B.O.E. de 21 de Septiembre de 1.993) INGLÉS

AMBIENTES DE COMPILACION

Idioma y traducción C5 (chino) Código: Créditos ECTS: 6. Titulación Tipo Curso Semestre Traducción e Interpretación OB 4 1

TEMARIO DE PROFESORES DE ESCUELAS OFICIALES DE IDIOMAS ITALIANO. (Publicado en el B.O.E. de 21 de Septiembre de 1.993) ITALIANO

IDIOMAS: T-Inglés Profesional para actividades comerciales. Gestión comercial de venta

La comunicación y sus elementos. La lengua y su organización. La literatura

PROCEDIMIENTO DE EVALUACIÓN Y ACREDITACIÓN DE LAS COMPETENCIAS PROFESIONALES CUESTIONARIO DE AUTOEVALUACIÓN PARA LAS TRABAJADORAS Y TRABAJADORES

TEMARIO DE PROFESORES DE ESCUELAS OFICIALES DE IDIOMAS ESPAÑOL. (Publicado en el B.O.E. de 21 de Septiembre de 1.993) ESPAÑOL

- ESTRATEGIAS PARA LA COMPRENSION LECTOERA

CRITERIOS DE EVALUACIÓN

1. Utilización básica de una lengua extranjera en la recepción y relación con el cliente.

Capítulo 9. Introducción a los lenguajes formales. Continuar

Los tipos de textos. Tomar apuntes

Descripción de las competencias lingüísticas de cada perfil

INGLES NM4 4º EM. Unidad temáticas CONOCIMIENTOS BÁSICOS DEL PROFESOR

COMPETENCIA BÁSICA N.º 1. COMPETENCIA LINGÜÍSTICA (1)

UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE ADMINISTRACIÓN Y CONTADURÍA LENGUAJE INSTRUMENTAL Y COMUNICACIÓN

Traducción inversa (Portugués) - TR

EL RESUMEN DOCUMENTAL. PARADIGMAS, MODELOS Y MÉTODOS.

Lengua Extranjera Inglés

Clasificar un texto por sus características

CONVOCATORIAS DE EXAMEN. CURSO 2016/2017. Graduado en Filología Hispánica

Curso. Lingüística Aplicada II (Sistemas de aplicación lingüística)

cuadernos DIGITALES La lengua española

Colegio Beato Carlos Manuel Rodríguez Departamento de Español

+ 8 = / 11 = * 9 = - 10 = 8

Grado en Traducción e Interpretación

1. ESCUCHAR, HABLAR Y CONVERSAR:

Contenidos Criterios de evaluación Estándares de aprendizaje evaluables Bloque 1. El latín, origen de las lenguas romances Bloque 2.

ARAMEO MODERNO II. Código Plan 2010 ECTS 4.5. Carácter Obligatoria Curso 4º Periodicidad Semestral

Cátedra: Lógica Unidad II: Lógica y Lenguaje. Profesora: Ana Rodríguez. Definición de lenguaje: Tipos de lenguaje:

Ampliación del Modelo de Jakobson

Tabla de equivalencias Licenciatura en Filología Inglesa - Grado en Estudios Ingleses

DEPARTAMENTO DE LENGUA CASTELLANA Y LITERATURA CURSO ESCOLAR APRENDIZAJES IMPRESCINDIBLES NIVEL 2º ESO

MAPA DE COMPETENCIAS DEL MÁSTER EN TRADUCCIÓN PARA EL MUNDO EDITORIAL

PROGRAMACION CURSO 2018 / Página web

APRENDIZAJE Y USO DEL ESPAÑOL COMO LENGUA MATERNA

Procesamiento del Lenguaje Natural Comparación de algoritmos de lematización

Información de inicio de curso. Lengua Castellana y Literatura

Horas teóricas: Horas practicas: Área de conocimiento a la que pertenece

Secuenciación de contenidos y objetivos. Endecha: Segundo curso de primer ciclo

LENGUA, LENGUAJE HABLA, NORMA Y VARIEDADES LÉXICAS

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY CAMPUS MONTERREY DEPARTAMENTO DE LENGUAS MODERNAS INGLÉS REMEDIAL I (H )

ASIGNATURA : LENGUA Y LITERATURA UNIDADES/BLOQUES/ OBJETIVOS CONTENIDOS

Características del lenguaje científico

DEPARTAMENTO DE CULTURA Y LENGUAS CLÁSICAS

GRIEGO CRITERIOS DE EVALUACIÓN

Índice general. Introducción... 23

OBJETIVOS Y COMPETENCIAS-MTP

Las tecnologías del habla Docencia, investigación y empresa. Docencia

AREA/MATERIA: Griego II (LOMCE) (00,07,50,01,21,20,02,51,90,40,30) CURSO: 2º ETAPA: Bachillerato de Humanidades y Ciencias Sociales

PROGRAMACIÓN DEL CURSO - NIVEL C2.2 (60 horas, 6 ECTS)

Curso. Tecnologías de lenguaje natural

1º DE BACHILLERATO I) CONTENIDOS Y CRITERIOS DE EVALUACIÓN MÍNIMOS 1-CONTENIDOS MÍNIMOS. 1-Escuchar, hablar y conversar

LICENCIATURA EN SERVICIO SOCIAL. Inglés I. Profesores. Titular: Trad. Públ Cecilia A. Irrazábal

Guía Docente: Guía Básica. Datos para la identificación de la asignatura. Grado en Traducción e Interpretación. Inglés-Francés


0886 GRADO EN LINGÜÍSTICA

INFORME DE MATERIAS NO SUPERADAS: LATÍN II CURSO 2017/2018 GRUPO 2º Bachillerato DEPARTAMENTO DE FILOSOFÍA Y CULTURA CLÁSICA OBJETIVOS DE LATÍN II

ESCUELA OFICIAL DE IDIOMAS DE ZALLA PRUEBA DE A1 (NIVEL BÁSICO 1) DE LOS IDIOMAS EUSKERA, FRANCÉS E INGLÉS. CANDIDATOS OFICIALES ÚNICAMENTE

LICENCIATURA EN TRADUCCIÓN. Este programa educativo se ofrece en las siguientes sedes académicas de la UABC: Unidad académica donde se imparte

Ortografía y gramática para traductores

AREA/MATERIA: Latín II (LOMCE) (00,07,50,01,21,20,02,51,90,40,30) CURSO: 2º ETAPA: Bachillerato de Humanidades y Ciencias Sociales

Lenguaje y Comunicación Enseñanza Media

Introducción al Diseño de Compiladores. Año

Idioma y traducción C4 (chino) Código: Créditos ECTS: 9. Titulación Tipo Curso Semestre Traducción e Interpretación OB 3 2

Universidad Fermín Toro. Cabudare Lara

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Lingüistica computacional. CURSO ACADÉMICO - SEMESTRE Primer semestre

CARRERA: TÉCNICO SUPERIOR EN COMERCIO EXTERIOR Y MARKETING INTERNACIONAL MATERIA: INGLES TECNICO I

BLOQUE 1. ESCUCHAR, HABLAR Y CONVERSAR

FACULTAD DE FILOSOFÍA Y LETRAS GRADO DE TRADUCCIÓN E INTERPRETACIÓN CURSO 2010/11 ASIGNATURA: HERRAMIENTAS INFORMÁTICAS PROFESIONALES

Lengua y literatura, lengua A. Grado en Lenguas Modernas

LATÍN II 2º BACH CONTENIDOS, CRITERIOS DE EVALUACION Y ESTANDARES DE APRENDIZAJE

Curso de traducción automática de lenguas naturales

FICHA TÉCNICA DE LA ASIGNATURA

RÚBRICAS POR ÁREA Inglés para D. C.

PONDERACIÓN DE LOS CRITERIOS DE EVALUACIÓN LATIN 4º

C1 AVANZADO CONTENIDOS GRAMATICALES

INGLES NM3 3º EM. Unidad temáticas CONOCIMIENTOS BÁSICOS DEL PROFESOR

GRIEGO 1º BACHILLERATO CRITERIOS DE EVALUACIÓN

0886 GRADO EN LINGÜÍSTICA

INSTITUCIÓN EDUCATIVA MANO AMIGA

Guía Docente: Guía Básica

Tema U. T. Título de la Unidad de Trabajo Contenidos Horas Sesiones Evaluación. 5 5 Por cada Unidad de Trabajo: 2 History of computers 5 5 1

1 Tema 1: Internet. 2 Tema 2: La web. 3 Tema 3: Principios de Recuperación de Información. 4 Tema 4: Búsqueda de información en la web

INGLÉS TÉCNICO NIVEL II

Syllabus. Curso:Noveno. Materia:Lengua y Literatura

Guía Docente: Guía Básica

LATÍN II DE 2º DE BACHILLERATO

Colegio Episcopal Santísima Trinidad. Ponce, P.R.

FICHA DE ASIGNATURA Los problemas derivados de la transferencia cultural Técnicas de traducción de los referentes culturales

Inglés. Traducción de textos legales, administrativos y económico-empresariales

Transcripción:

Traducción Automática: Dimensiones y Estrategias Luciana BENOTTI lubenotti@infovia.com.ar Sandra ROGER sroger@uncoma.edu.ar Departamento de Informática y Estadística. Universidad Nacional del Comahue. Buenos Aires 1400, CP 8300, Neuquén, Argentina. FAX: (54)(0299)4490313. Palabras Claves: Procesamiento en Lenguaje Natural, Traducción Automática, Arquitectura por Transferencia. 1. Introducción Entre las dificultades históricas de la comunicación podemos mencionar a la barrera del lenguaje. Es por ello que la traducción ha cobrado gran interés aún antes del nacimiento de la informática. Los avances tecnológicos, han propiciado el desarrollo de herramientas para la automatización de este proceso. La traduccíón automática 1 (en adelante: TA) es sin duda un desafío científico. Sin embargo la razón por la cual despierta tanto interés no es de índole científica, sino por una necesidad netamente práctica. No existe en la bibliografía una definición formal de lo que significa TA, podemos encontrar definiciones recursivas y/o aproximaciones de lo que debería entenderse: es el proceso por el cual una máquina traduce un texto de una lengua a otra, subdividiendo la sintaxis, identificando las partes del discurso, intentando resolver eventuales ambigüedades y, por último, traduciendo los componentes y la estructura en la lengua de destino [Mer02]. El propósito de este trabajo es presentar la motivación de nuestra línea de investigación, metas y desarrollos futuros. Fundamentalmente, nuestro interés estará en poder capturar el potencial de las técnicas y paradigmas actualmente desarrollados en el área traducción automática, para luego realizar una comparación y evaluación de los mismos. 2. Traducción Automática La comunicación existe cuando el receptor logra reconocer la intención del emisor y no sólo el significado literal del mensaje. En este sentido, la traducción automática posee un punto 1 Se ha optado por denominar Traducción Automática al concepto en inglés Machine Traslation(MT), el cual ser refiere a los sistemas informáticos que realizan traducciones con o sin ayuda humana.

débil, y no es una tarea fácil el lograr poder transmitir la intención o la doble intención al receptor. Un traductor automático no tiene en cuenta las condiciones extralingüísticas (la intención, el contexto situacional, histórico o cultural), y, por lo tanto, no puede hacerse cargo de las ambigüedades del lenguaje. De la misma manera, carece de sentido común, no distingue matices, posee una flexibilidad limitada y no puede apoyarse en un nivel pragmático ni incorporar su experiencia ni su conocimiento del mundo para solucionar problemas, cosas que sí puede hacer el traductor humano. 2.1. Arquitecturas del sistema de traducción automática En la traducción automática podemos contar con cinco tipos de conocimiento[as94]: lenguaje origen(lo), lenguaje meta(lm), correspondencia entre términos del LO y el LM (diccionario), conocimiento sobre el dominio de lo que se traduce(sentido común) y conocimiento del entorno cultural, convenciones sociales, costumbres, etc. del LO y del LM. 1. Arquitectura directa o transformer: La idea principal en esta arquitectura consiste en la traducción directa palabra por palabra del lenguaje origen al lenguaje meta usando para ello, un diccionario bilingüe. Luego de ésto, las palabras, son reordenadas según reglas específicas de la lengua meta en cuestión. Ejemplo de este tipo de TA son: SYSTRAN (grupo GAT de la Universidad de Georgetown y CEE), SPANAM (utilizado por la Pan-American Health Organization), GTS, PC-TRANSLATOR, etc. 2. Arquitectura de traducción por transferencia y el uso de patrones. En este tipo de traducción contamos con 3 fases: análisis, transferencia y síntesis. La primera fase consite en procesar la lengua origen a una representación dependiente de ésta (entrada de la siguente fase). La transferencia (dependiente del LO y del LM) se puede producir en varios niveles: léxico, sintáctico y semántico, Transferencia léxica: la búsqueda del término equivalente en el LM se realiza a partir de información contenida en el diccionario. Transferencia sintácica: el árbol de análisis de la oración origen se transforma en un árbol de generación equivalente para la oración meta. Transferencia semántica: se transforman representaciones profundas (patrones semánticos). Podemos mencionar los siguienes ejemplos en este tipo de traducción: METAL (Universidad de Texas, Siemens-Nixdorf), GETA (Universidad de Grenoble, Vauquois, 1985), TAUM-METEO/AVIATION (Universidad de Montreal, Isabelle, 1985), EUROTRA (CEE, Johnson, 1985), etc. 3. Arquitectura de traducción por interlingua: En este tipo de arquitectura es más antiguo que el anterior y consiste en traducir el lenguaje origen a una representación independiente (interlingüa o pivot). Dicha representación es utilizada como entrada en la generación de la traducción al lenguaje meta. Ejemplos de este tipo de TA son: ULTRA (New Mexico State University) y PANGLOSS (CMU, NMSU y University of Southern California), entre otros.

En la figura anterior se distinguen los tres enfoques principales enunciados anteriormente, es decir, enfoques directos, los de interlingua y los de transferencia (normalmente sintáctica y en contados casos también semántica). Esta pirámide se basa en las diferencias de longitudes relativas de los tres componentes de la traducción: análisis, transferencia y síntesis o generación. 2.2. Dimensiones de la TA Una dimensión es un factor que permite clasificar el ámbito de aplicación de la TA, acotando así su diseño con el objetivo de mejorar su efectividad. Se distingue entre seis dimensiones [Aba02]: Tipología del texto: Para afrontar las peculiaridades de los distintos textos se suele recurrir a los siguientes conceptos: Registro (o jerga): Se relaciona con la variedad del lenguaje elegido para la comunicación. Se puede distinguir entre distintos lenguajes de especialidad definidos por una terminología o fraseología particular, en contraste con la lengua común cuyas expresiones y vocabulario son de uso genérico. Estilo: Dentro de un mismo registro se pueden encontrar diferentes estilos (directo o indirecto, formal o informal, etc.). La noción de estilo distingue los textos por sus propiedades lingüísticas: longitud de oraciones, uso de conectores, etc. Género: Distingue los textos según su pragmática (novela, poesía, teatro, ensayo, etc.). Tipo: Diferencia textos dentro de un mismo género. Por ejemplo, dentro del género periodístico se puede distinguir entre: noticias, reportajes, columnas, anuncios, etc. Densidad y granularidad: La densidad léxica de un texto es inversamente proporcional a su granularidad. La granularidad de un texto se define en términos del tamaño de las unidades léxicas en las que se puede segmentar un texto. Los textos de granularidad más gruesa son aquellos que tienen una mayor combinación de palabras: fórmulas, frases hechas y términos compuestos. Un sistema de TA debe ser capaz de reconocer las unidades mayores primero, antes de tratar cada palabra por separado. Una lengua con una densidad mayor (como un lenguaje de especialidad) es más apropiado para la TA.

Distancia lingüística y cultural: Cuando el LO y el LM son lenguas afines (por ejemplo, un par de lenguas latinas), es posible obtener resultados aceptables con un sistema simple de traducción palabra por palabra. Los problemas típicos de la traducción son minimizados por la proximidad lingüística. Por el contrario, la estrategia de traducción entre lenguajes más distantes debe ser necesariamente más elaborada. Al problema de la lingüística, hay que sumarle el de la distancia cultural; principalmente cuando alguno de los lenguajes intervinientes pertenece a una cultura con convenciones exóticas. Desarrollo lingüístico: El grado de disponibilidad de recursos lingüísticos como diccionarios, gramáticas y, sobre todo, corpus (tanto para el LO como para el LM), afectará la facilidad de desarrollo de una herramienta de TA. Medio y modo: Podemos distinguir tres modos de traducción según el medio involucrado: Interpretación: Cuando el medio es oral el lenguaje es espontáneo, contextualizado, discontinuo y, muchas veces, agramatical. Traducción: Un traductor de textos escritos generalmente se enfrenta a textos cuidadosamente redactados. Localización: Tratamiento automático de textos en soporte electrónico. Fin: El factor más importante a tener en cuenta cuando se diseña un programa es definir claramente su objetivo. Las herramientas de TA no son la excepción a esta regla. Algunos propósitos comunes de los sistemas de TA son: dar una idea del contenido, informar y publicar. 3. Conclusiones y Trabajos Futuros Se ha presentado una de las líneas de investigación que se está desarrollando dentro del marco de un proyecto de investigación de la Universidad Nacional del Comahue. Los objetivos específicos de esta línea están encuadrados dentro de la TA, definidos dentro de las arquitecturas de transferencias expuestas en el punto 2 de la sección 2.1. Aunque aún estamos en sus primeras etapas, se ha comenzado a desarrollar un análisis de las herramientas a fin de poder establecer el grado de complejidad de los algoritmos, orientando nuestro desarrollo trabajos sobre textos informáticos, de estilo formal(en inglés) para poder realizar una traducción al idioma español. Referencias [Aba02] Joseba Abaitua. Introducción a la traducción automática. http://sirio.deusto.es/abaitua/konzeptu/ta/mt10 es/ta10h 1es.htm. Material preparado para los cursos de postgrado en Traducción por la UD y en Tecnología Linguística por la UEU/EHU, 2002. [AS94] D. Arnold, L. B. S. M. R. L. H. and L. Sadler. Machine translation: An introductory guide. London: Blackwel l-ncc, 1994. [Mer02] Pilar Hernández Mercedes. En torno a la traducción automática. http://internet.cervantes.es/internetcentros/cultura/pdf/traduc-cionautomatica.pdf. Cervantes N o 2., 2002.

[Tru00] Arturo Trujillo. Estrategias de traducción automática. Quark. Ciencia, Medicina, Comunicación y Cultura, 19:53 57, 2000.