Reconocimiento e Interpretación de Expresiones Temporales

Documentos relacionados
Desde los programas más simples escritos en un lenguaje de programación suelen realizar tres tareas en forma secuencial.

Nombre y apellidos Nº EXAMEN TEMA 3. ECUACIONES, INECUACIONES Y SISTEMAS 4º E.S.O.

Taller 1 Utilización eficaz de hojas de cálculo Excel

Ficha de Aprendizaje N 13

El curso es de naturaleza aplicativa y teórico-práctica, y se estructura en cuatro unidades:

DOCUMENTACIÓN TÉCNICA. Sesión 11: Los formatos de los documentos

PROYECTOS DE INVERSDIÓN DE CAPITAL

Creación y Mantenimiento de Componentes Software en Sistemas de Planificación de Recursos Empresariales y de Gestión de...

Lógicas para la inteligencia natural y artificial

PROCESO SELECTIVO 2006

UNIDAD 6: ECUACIONES OBJETIVOS

Métodos de Investigación en Psicología (9) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Introducción a la Computación. Capítulo 10 Repertorio de instrucciones: Características y Funciones

PROCEDIMIENTO ALTERNATIVO PARA LA VERIFICACIÓN DE LA DURACIÓN DE LOS REGISTROS DE TEMPERATURA

DISEÑO DE UNA METODOLOGÍA DOCENTE

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICAS DEPARTAMENTO DE MATEMÁTICAS CURSO DE NIVELACIÓN S

Operadores aritméticos: suma (+), resta (-), producto (*), cociente (/) y potencia (**).

UNIDAD 1 GENERALIDADES HTML

UNIDAD 1: NÚMEROS RACIONALES OBJETIVOS

Estatutos de Control C# Estatutos de Decisión (Selección)

Apuntes de Lógica Proposicional

Estadística Inferencial. Estadística Descriptiva

INFORME MENSUAL. Circuito Mintzita 470 Fraccionamiento Manantiales (443)

Materia requisito: DOMINIOS COGNITIVOS (Objetos de estudio, temas y subtemas) I. INTRODUCCION A LAS BASES DE DATOS

Formato para prácticas de laboratorio

Universidad Autónoma Metropolitana Unidad Azcapotzalco. División de Ciencias Básicas e Ingeniería. Licenciatura en Ingeniería en Computación

MANUAL DEL ADMINISTRADOR DEL CHAT

Laboratorio de Arquitectura de Redes. Punteros en lenguaje C

Búsqueda de Patentes Criterios de búsqueda

Programación Estructurada

CONTENIDOS MÍNIMOS BLOQUE 2. NÚMEROS

PROGRAMACIÓN. UNIDAD II. ALGORITMO PROFA : HAU MOY

Principios de Computadoras II

Toda copia en PAPEL es un "Documento No Controlado" a excepción del original.

Algebra Lineal. Gustavo Rodríguez Gómez. Verano 2011 INAOE. Gustavo Rodríguez Gómez (INAOE) Algebra Lineal Verano / 21

GUÍA BÁSICA DE SCHEME v.4

PREGUNTAS DE EJEMPLO ESTUDIOS SOCIALES SEGUNDO NIVEL BÁSICO

Aprender a desarrollar con JavaScript

QUANTUM COMPUTACION CURSO DE PLANILLA ELECTRONICA MICROSOFT EXCEL 2013

BLOQUE I: GEOMETRÍA PLANA Y FIGURAS GEOMÉTRICAS. Ecuaciones y sistemas. 2 (20 horas) Funciones y gráficas. 2 (20 horas) Estadística y probabilidad

Expresiones y sentencias

Clasificador (Classifier) Aprendizaje Automatizado. Atributos. Clases. Conceptos. conceptos.

M.D.T. y TOPOCAL. Técnicas de Representación Gráfica. Curso DIGTEG 2010

Tema: Funciones en Excel (III) Funciones de fecha y hora Las fechas son a menudo una parte crítica de análisis de datos

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

La etiqueta logística

INTRODUCCIóN A LA PROGRAMACIóN APUNTES DE JAVA APUNTES DE JAVA

Jornadas sobre Gnu/Linex: Uso de Software Libre en las Administraciones públicas. Sonia Pizarro Redondo

INTRODUCCIÓN La lengua como sistema El signo lingüístico Las articulaciones La lengua como pluralidad de sistemas 24

GUION TÉCNICO AUDIO. El Conjunto De Los Números Reales. realidad, es una ciencia resultado de más de 4 mil años de

BANCO CENTRAL DE VENEZUELA

PROTOCOLO IP. Vicente Sánchez Patón. I.E.S Gregorio Prieto. Tema 1 SRI

UNIVERSIDAD NACIONAL DE RÍO CUARTO FACULTAD DE CIENCIAS EXACTAS FÍSICO QUÍMICAS Y NATURALES DEPARTAMENTO DE MATEMÁTICA

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

SILABO MATEMÁTICA I Facultad : Ciencias Empresariales Escuela Prof. : Ciencias Contables y Financieras

Informe de Reporte Ejemplo. Análisis de. Aptitudes

Sistemas. POSTREQUISITO: CATEGORÍA: Obligatorio SECCION: A HORAS POR SEMANA

Tema 5. Contraste de hipótesis (I)

INTERFACES INTELIGENTES. ING. MA. MARGARITA LABASTIDA ROLDÁN E mail:

Informática y Computación III Guía de Estudio (50 reactivos)

Qué es una tabla dinámica? Para qué sirve una tabla dinámica?

Computación II. Introducción a Visual Basic

Tema 3.- Predicados y sentencias condicionales

Nociones Básicas de Sémantica: Semántica Denotacional

Fundamentos de Bases de Datos Facultad de Ciencias UNAM

TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES TRABAJO DE PRÁCTICAS. Convocatoria de junio de 2013

MATEMÁTICAS 4. º CURSO UNIDAD 7: DIVISIÓN

JUNTA LOCAL DE CONCILIACIÓN Y ARBITRAJE DEL DISTRITO FEDERAL

CICLO DE NIVELACION ARQUITECTURA FEBRERO/MARZO 2016

Pontificia Universidad Católica del Ecuador

Distancia focal de una lente convergente (método del desplazamiento) Fundamento

Fechas de revisión 16/9/1998, 6/9/2000, 26/10/2004, 19/6/2007, 21/10/ /10/2013, 1/3/2016

MANUAL BÁSICO DE MYSQL

Computación I Representación Interna Curso 2011

UNIVERSIDAD NACIONAL DE ASUNCIÓN FACULTAD DE DERECHO Y CIENCIAS SOCIALES Escuela de Ciencias Sociales y Políticas ECSP/SG/MJFM/COD52 PROGRAMA 2012

PROGRAMACIÓN CON PHP Y MYSQL. 40 horas 60 días

Tema 2 Introducción a la Programación en C.

Conectados con el pasado, proyectados hacia el futuro Plan Anual de Matemática II Año PAI VII Grado

SISTEMA DE NUMEROS REALES

1.9. Requisitos mínimos de asistencia a las sesiones presenciales / Minimum attendance requirement

Curso de Formación del Profesorado

MICROSOFT EXCEL 2010

Fase 2. Estudio de mercado: ESTADÍSTICA

Grado en Ingeniería Informática. Plan de proyecto. Desarrollo de Sistemas de Información Corporativos. Departamento de Informática

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

: Algorítmica y Estructura de Datos I

FACULTAD DE INGENIERÍAS Y ARQUITECTURA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE MINAS GEOMETRÍA DESCRIPTIVA SÍLABO

SILABO DEL CURSO SEMINARIO DE TESIS

RECONOCIMIENTO DE PALABRAS

GML BinaryXML y libgpe

SERVICIO NACIONAL DE APRENDIZAJE SENA SISTEMA INTEGRADO DE GESTIÓN Procedimiento Ejecución de la Formación Profesional Integral GUÍA DE APRENDIZAJE

Sesión VI: Desarrollo de aplicaciones en el entorno MATLAB

Manual de uso Cotizador Vida

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

ÁREA: MATEMÁTICAS UNIDAD : 1 TEMPORALIZACIÓN: OCTUBRE 1ª QUINCENA OBJETIVOS CONTENIDOS CRITERIOS DE EVALUACIÓN

UNIVERSIDAD CARLOS III DE MADRID PROGRAMA DE LA ASIGNATURA: LENGUA CASTELLANA

Universidad Centroccidental Lisandro Alvarado. Decanato de Ciencias y Tecnología Departamento de Sistemas

Crear una tabla dinámica

INSTITUCIÓN EDUCATIVA LICEO DEPARTAMENTAL ÁREA DE TECNOLOGÍA E INFORMÁTICA

Transcripción:

de mathiase@fing.edu.uy Grupo de Procesamiento de Lenguaje Natural Instituto de Computación Montevideo, 2012

Contenido

El proyecto consiste en la construcción de una herramienta para el reconocimiento e interpretación de expresiones temporales en español. Forma parte de un proyecto de mas amplio de tratamiento automático de textos en termino de eventos, expresiones temporales y las relaciones entre estos. (TEMANTEX)

El tiempo cumple un rol activo en varias facetas de nuestras vidas, esto lleva a referirse al tiempo de diversas maneras. Las expresiones temporales son expresiones lingüísticas que indican la duración o localización de un evento respecto al tiempo.

Ejemplos el 7 de abril de 1987 durante 23 minutos algun día de marzo mañana de mañana por algún tiempo el jueves que viene a las 5 de la tarde...

Un problema central al enfrentarse al tratamiento automático de expresiones temporales es su diversidad y abundancia Clasificarlas en función de su información semántica es una alternativa para amortiguar este problema

Duración vs. Localización Las expresiones de localización son aquellas que indican la localización de un evento en el tiempo el 15 de octubre de 2005 los primeros días de abril hoy, mañana, ayer en Navidad Las de duración aquellas que indican su duración durante 4 horas por varios minutos durante mucho tiempo

Absolutas vs. Relativas Las expresiones relativas son aquellas que requieren información temporal adicional para ser interpretadas el año pasado ayer 5 días después el 17 de ese mismo mes el 20 de noviembre de lo contrario son absolutas. algún día de octubre de 2009 en 1997 en el verano de 1995 en el siglo XI a.c

Precisas vs. Difusas Las expresiones precisas son aquellas cuyas cuya información temporal es posible interpretar con exactitud. durante 5 minutos el 5 de enero de 2010 el martes que viene el siglo pasado de lo contrario son difusas o vagas. durante muchas horas por un tiempo algún día del mes que viene algún martes de abril

TimeML Es un esquema de anotación para eventos, expresiones temporales y relaciones entre estos. Está basado en XML. La especificación de la última versión de TimeML se encuentra en http://timeml.org/site/ publications/timemldocs/timeml_1.2.1.html

TimeML Ejemplo

TCNL - Time Calculus for Natural Language TCNL es una especificación para representar información temporal Consiste en la construcción objetos temporales mediante el uso de otros objetos y operadores. Apunta a contar con representaciones amigablemente inferibles de las expresiones temporales.

TCNL - Time Calculus for Natural Language Tipos de Objetos Temporales Existe tres tipos de objetos temporales: Cantidades, Coordenadas y Enumeraciones. Las cantidades (Q) son restricciones numéricas sobre unidades temporales. (ej. 1 hora, 30 min ) Las coordenadas (C) son una conjunción de restricciones de igualdad sobre unidades temporales. (ej. {martes dia_sem, 15 dia, 3 mes }) Las enumeraciones (E) son conjuntos de coordenadas. (ej. [{3 mes }, {4 mes }])

TCNL - Time Calculus for Natural Language Operadores + + / : C Q C suma y resta exacta +/ : C Q C suma y resta con coerción [ : ] : C C E y [ : ] : C Q E intervalos @ : Q E C ordinal

TCNL - Time Calculus for Natural Language Ejemplos a las 3 de la tarde del martes {15 hora, martes dia_sem } durante 20 minutos 20 min mañana foco + 1 dia 1 mes después foco + +1 mes el mes que viene foco + 1 mes

Trabajo realizado Se construyó un repertorio de expresiones temporales Se investigó y extendió TCNL ampliando el espectro de expresiones temporales representables. (CTemp) Se definió un esquema de anotación de expresiones temporales. (ETemp) Inspirado en trabajos realizados sobre TimeML Utiliza CTemp Se investigaron diversos enfoques para llevar a cabo el reconocimiento y la interpretación automáticamente Se construyó una gramática de reglas contextuales

CTemp Agrega al TCNL clásico el uso de cuantificadores con el fin de representar expresiones difusas Agrega la noción de valores compuestos (operadores y a nivel de valores) Agrega el operador @@ : Q E E denominado operador de selección (o cardinal) Considera un operador de coerción según una granularidad ( : C Gran C)(ej. foco mes ) Considera una granularidad ficticia denotada void para indicar vaguedad a nivel de granularidad

CTemp Ejemplos durante algunos minutos alguno min un tiempo después foco + 1 void entre marzo y abril [{marzo mes } : {abril mes }] el 4 y 5 de febrero {2 mes, 4 5 dia } este siglo foco siglo algunos días de abril alguno dia @@{4 mes }

ETemp Es un esquema de anotación basado en XML para la anotación de expresiones temporales que contempla las caracteristicas composicionales de las expresiones temporales. Consiste en tres etiquetas: etemp, stemp (interna) e itemp. etemp y stemp marcan la extensión de expresiones y subexpresiones temporales. itemp marca indices y modificadores temporales etemp contiene los siguientes atributos: id, estructura (rec atom enum rango patron), tipo (dur loc), clase (prec sub abs), precisión (prec vaga), dir (+,-,nula), gran, s_vag, foco y ctemp.

ETemp Ejemplos

Reconocimiento / Interpretación Reglas Contextuales Se construyó una gramática de reglas contextuales que realiza el reconocimiento e interpretación en simultaneo Se utilizó el interprete de reglas contextuales desarrollado por el grupo de PLN del InCo Las reglas contextuales resuelven algunas carencias de las gramáticas con rasgos Tienen la ventaja de poder acceder a información interna de las palabras (lema, categoría, número, genero,...) brindada por Freeling Permiten el uso de contextos en las reglas Tienen la ventaja de permitir procesamiento mediante el uso de condiciones en las reglas Expresiones (predicados Temporales Prolog)

Evaluación Se utilizó un corpus de 12 mil palabras con 220 expresiones temporales. Reconocimiento Prec Recall F Bio 94.8 87.3 90.9 Fútbol 77.2 90 83.1 Tot 81.4 89.1 85.1 Interpretación Prec Recall F Bio 84.5 86.0 85.2 Fútbol 70.6 89.0 78.7 Tot 73.9 88.2 80.4

Apéndice Referencias Referencias I TimeML Working Group. A Formal Specification Language for Events and Temporal Expressions. October, 2005. Benjamin Han, Donna Gates and Lori Levin. From Language to Time: A Temporal Expression Anchorer. Carnegie Mellon University, 4th Workshop on Inference in Computational Semantics, 2003.

Apéndice Referencias Referencias II Dina Wonsever, Marisa Malcuori, Esquema de anotación de expresiones y marcas temporales. Facultad de Ingenieria, UdelaR, Reporte Técnico RT 11-15, 2011.