Gramáticas de dependencias de FreeLing Jordi Carrera (UPC) Irene Castellón (UB) Marina Lloberes (UB) Lluís Padró (UPC) Nevena Tinkova (UB)
Gramáticas de dependencias de FreeLing Marco general Analizador TXALA y gramáticas Trabajos en curso Trabajos futuros
Proyecto KNOW Desarrollo de tecnologías multilingües a gran escala TIN2006 15049 C03 01 Período: 2006 2009 Universidades: EHU/UPV, UPC, UB, UOC
Proyecto Opentrad/EuroOpentrad Proyecto de Traducción Automática Avanzada de código abierto para la Integración Europea de las lenguas del Estado Español FIT 350401 2006 5 Período: 2006 2007 Universidades: UPC, UA, EHU/UPV, UVIGO Empresas: Fundación Elhuyar, Eleka, imaxin software
Análisis sintáctico profundo Desarrollo de gramáticas de amplia cobertura y análisis profundo Adquisición de información Subcategorización Preposiciones Nominalizaciones y preposiciones Nombres propios Marcadores
FreeLing: TXALA Analizador TXALA (Atserias et al., 2006) Input chunks (TACAT: Civit et al., 1998) Gramática Reglas de compleción del árbol (parsing) Etiquetación de funciones (labeling) Output árbol de dependencias
FreeLing: TXALA Reglas de compleción del árbol Composición Asignación de un núcleo Agrupación de nodos (matching y relabel) Prioridad de reglas Restricciones Contextuales (afirmación, negación, nodos intermedios, etc.) Control del número de aplicación de reglas Acceso a la información asociada a la forma Morfología (PoS, forma y lema) Clases de palabras
FreeLing: TXALA Ejemplos de reglas de compleción del árbol 6001 (conj subord,grup verb) top_left RELABEL subord 7021 $_sn{^n}_sp de_$_grup sp (grup verb[mov],sp de) top_left RELABEL
FreeLing: TXALA Etiquetación de funciones Asignación de etiqueta (sujeto, objeto directo, etc.) Prioridad Restricciones Posición en el árbol Lema Acceso a información léxica Synsets (sinónimos, hiperónimos) Top Ontology Clases de palabras
FreeLing: TXALA Ejemplos de reglas de asignación de funciones grup verb dobj d.label=subord d.side=left d.lemma=on quan quant p.class=que grup verb iobj d.label=grup sp d.side=right d.lemma=a para d:sn.tonto=human p.class=ditr viobj vp a
Gramáticas de TXALA Recursos incorporados Subcategorización verbal Volem Multilingüe (http://grial.uab.es/multi/) SenSem (http://grial.uab.es/search/) Marcadores del discurso Lexicon of prototypical discourse markers (Alonso, 2004) Información semántica Wordnet 1.6
Gramáticas de TXALA Nº reglas / gramática Inglés Español Catalán Parsing 1458 3707 2345 Labeling 40 518 504 Total 1498 4225 2849
Gramáticas de TXALA Fenómenos tratados (I) Oraciones Declarativas Imperativas Interrogativas Completivas Relativas Adverbiales circunstanciales Subordinadas de infinitivo Subordinadas de gerundio
Gramáticas de TXALA Fenómenos tratados (II) Estructuras Transitivas Intransitivas Ditransitivas Preposicionales Copulativas Impersonales Coordinación Sintagmas iguales
Gramáticas de TXALA Reglas específicas del inglés para... Agrupaciones ambiguas Sintagma preposicional Sintagma adverbial Distribución de nodos Argumentos de subordinadas Argumentos de la oración principal Subordinadas sin conjunción
Gramáticas de TXALA En español y catalán, durante el parsing especial atención a Agrupaciones ambiguas Sintagma preposicional Distribución de nodos Argumentos de subordinadas Argumentos de la oración principal Interrogativas
Gramáticas de TXALA En la fase de labeling (español y catalán) Sintagma preposicional DOBJ (sólo en español), IOBJ, SP OBJ, CC, ADOR, SN MOD, etc. Subordinadas Completivas, especialmente las interrogativas indirectas Adverbiales circunstanciales SUJ, DOBJ, SP OBJ, CC, ADOR, etc.
Gramáticas de TXALA Ejemplo del inglés The girl who travel with him is my sister.
Gramáticas de TXALA Ejemplo del español La tuna cambia a las chicas por los turistas. (El Periodico, 23/07/2008)
Gramáticas de TXALA Ejemplo del catalán Samsung trasllada la base comercial de Barcelona a Madrid. (El Periodico, 22/09/2006)
Gramáticas de dependencias de FreeLing Trabajo en curso Mejora de la versión actual (v.1.1) Incorporación de nuevos recursos Evaluación de las gramáticas (en curso)
Gramáticas de dependencias de FreeLing Trabajos futuros (I) Gramática Coordinación (parsing) Oraciones Subordinadas Sintagmas / oraciones estructuralmente diferentes Adjuntos/argumentos Subcategorización verbal (parsing+labeling +semántica) Elementos dislocados (parsing+labeling)
Gramáticas de dependencias de FreeLing Trabajos futuros (II) Analizador (ampliación) Necesidad de acceder a la información PoS en el labeling Contextos en el labeling Tratamiento de dislocaciones
Gramáticas de dependencias de FreeLing FreeLing http://garraf.epsevg.upc.es/freeling/