Este documento presenta la información general sobre el proyecto QALL-ME financiado por la CE. Su contenido está dirigido a la audiencia general y



Documentos relacionados
QALL-ME: Question Answering Learning technologies in a multilingual and multimodal Envinroment

Administración de Bases de Datos; Remota e In-Situ.

Objetos educativos y estandarización en e-learning: Experiencias en el sistema <e-aula>

Por qué deberías adaptar tu página web a la navegación móvil?

Técnica 2(Instrumental)

Introducción a los Servicios Web. Ing. José Luis Bugarin ILUMINATIC SAC jbugarin@consultorjava.com

REPORTE DE CUMPLIMIENTO ISO 17799

Capítulo 5. Cliente-Servidor.

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA

Seminario Electrónico de Soluciones Tecnológicas sobre Content Networking

Oferta tecnológica: Herramienta para el desarrollo de sistemas multimedia de navegación pedestre

Plataformas tecnológicas CRM de datos a conocimiento

Plataformas virtuales


ANEXO : PERFILES. Guía de Comunicación Digital para la Administración General del Estado. ANEXO PERFILES

u Eliminación de cargos de suscripción al tener el sistema en la empresa, puede eliminar los costos de servicio mensuales.

Cómo saber qué modelo de ERP es el más adecuado para su empresa? On-Premise vs. SaaS

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.

La interoperabilidad se consigue mediante la adopción de estándares abiertos. Las organizaciones OASIS y W3C son los comités responsables de la

Docente San Josemariano

Aproximación práctica a ITIL. Proyecto VeredaCS. F r00

IMPACTO DE LAS TICS EN LA SALUD

Capitulo III. Diseño del Sistema.

Introducción. Metadatos

Oferta tecnológica: Herramienta software y método para modelar aplicaciones web independientes de dispositivo

O jeto de apre r ndizaje

Unidad III. Software para la administración de proyectos.

Comunicación interna: Intranets

Portal del Estado Uruguayo. Buscador especializado

INTRODUCCIÓN AL MÓDULO

App para realizar consultas al Sistema de Información Estadística de Castilla y León

UNIVERSIDAD NACIONAL ABIERTA VICE-RECTORADO ACADÉMICO

Microsoft Excel 2013 nivel experto

SUPLEMENTO EUROPASS AL TÍTULO

SUPLEMENTO EUROPASS AL TÍTULO

arquitectura que maneja. Encontraremos también los diferentes servidores que

MATERIA: Proyecto de Desarrollo de Aplicaciones Multiplataforma

- Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.

1.1 EL ESTUDIO TÉCNICO

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

5.2. PROYECTO RODA. (6/07/04).

TRABAJO ESCRITO BASE DE DATOS Y APLICACIÓN DE CONOCIMIENTOS LAURA ISABEL MIRANDA CALDERÓN V B PRESENTADO AL DOCENTE GUILLERMO SANTACOLOMA RIVAS

Centro FP autorizado por: RESOLUCIÓN de 31 de agosto de 2012, de la Conselleria de Educación, Formación y Empleo.

Maximiza los ingresos no aeronáuticos del Aeropuerto

Ciclos Formativos relacionados Técnico Superior en Desarrollo de Aplicaciones Web Técnico Superior en Desarrollo de Aplicaciones Multiplataforma

Las Tecnologías de la Información y las Comunicaciones en Formación Profesional. Contenidos relevantes

La tutoría para la dirección de proyectos de investigación. Darder Mesquida, Antònia Universitat de les Illes Balears.

MINING SOLUTIONS LIMITADA

PLAN DE CONVERGENCIA PROYECTO Nº 32-A

I. OBJETIVOS INTRODUCCIÓN. Oscar Daniel Camuendo Vásquez

AYUNTAMIENTO DE ÚBEDA Departamento de Informática.

ERP y CRM. Abraham Sánchez L. FCC/BUAP Grupo MOVIS

Core Solutions of Microsoft SharePoint Server 2013 CURSO PRESENCIAL DE 25 HORAS

Software de Simulación aplicado a entornos de e-learning

Titulo: Apertura del Sistema SAP R/3 para el diseño de aplicaciones externas, y desarrollo de un caso practico para ambiente WEB.

FUENTES SECUNDARIAS INTERNAS

Proceso Unificado de Rational PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes:

Cómo seleccionar el mejor ERP para su empresa Sumario ejecutivo

Arquitectura de Aplicaciones

Resumen de la Tesina. Autor: Adrià Batet López. Tutor: Víctor Pascual Ayats

soluciones de software

Los servicios más comunes son como por ejemplo; el correo electrónico, la conexión remota, la transferencia de ficheros, noticias, etc.

ARIS Process Performance Manager

Construyendo el Rendimiento de las Empresas

Organización. Elaboró: Ing. Ma. Eugenia Macías Ríos

PROTOCOLO DE EVALUACIÓN PARA LA VERIFICACIÓN DE TÍTULOS OFICIALES (GRADO Y MÁSTER)

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

PRESENTACIÓN-ASPECTOS GENERALES DE LA MATERIA

El universo en la palma de tu mano. El software de gestión para organizaciones políticas e instituciones

SISTEMAS DE INFORMACIÓN I TEORÍA

Bases de Presentación de Propuestas. Consultoría para la implementación de sistemas de gestión de contenidos para comunidades de RedCLARA

BIBLIOTECA VIRTUAL DE CANARIAS. Gobierno de Canarias. Institución: Viceconsejería de Desarrollo Industrial e Innovación Tecnológica.

TÉCNICO SUPERIOR EN SISTEMAS ELECTROTÉCNICOS Y AUTOMATIZADOS

Contact Center Comunicación multicanal integrada

Introducción a las redes de computadores

grado Ingeniería Grado en Ingeniería en desarrollo de contenidos digitales + Experto universitario en Desarrollo de proyectos de software

Nos encargamos del tuyo, tú disfruta

TECNÓLOGO EN INFORMÁTICA PLAN DE ESTUDIOS

Desarrollador de Aplicaciones E-Business Proyecto #2. Curso No. CY770 Versión 2.3

Una educación de calidad para todos y entre todos

CAPÍTULO I EL PROBLEMA. El problema, está compuesto por el planteamiento del problema,

Control del Stock, aprovisionamiento y distribución a tiendas.

CAPÍTULO I INTRODUCCIÓN

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS

Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva

Pliego de Prescripciones Técnicas para la contratación de un servicio para la ejecución de la estrategia digital y la comunicación 2015 de BILIB

Seminario Electrónico de Soluciones Tecnológicas sobre VPNs de Extranets

1. INFORMACIÓN GENERAL

ENSEÑANZAS DE GRADO EN ADMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS

CONEAU. Comisión Nacional de Evaluación y Acreditación Universitaria MINISTERIO DE EDUCACION, CIENCIA Y TECNOLOGIA. Buenos Aires, 16 de julio de 2003

LINEAMIENTOS DE RENDICIÓN DE CUENTAS DE LA CREG

CONSULTA EN BASES DE DATOS

Cacheado de datos procedentes de servicios WFS en la aplicación web del proyecto EuroGeoSource

CAPÍTULO III Formulación de Hipótesis General de Trabajo o de Investigación.

- Facilidad para el manejo de especificaciones, reglamentos y normas de obligado cumplimiento.

Manual de Referencia. Apertura

Modelo para el Aseguramiento de Calidad en el Desarrollo de Software Libre

Inteligencia aplicada a la protección de infraestructuras

Los requisitos de accesibilidad en un proyecto software. Implicaciones de usuarios discapacitados en el proceso software

USO DE LA TECNOLOGIA COMO RECURSO PARA LA ENSEÑANZA. Sistema de búsqueda en Internet. Mtro. Julio Márquez Rodríguez

Transcripción:

QALL-ME EXECUTIVE SUMMARY Author: José Luis Vicedo, Patricio Martínez-Barco Affiliation: Universidad de Alicante, Spain Resumen Este documento presenta la información general sobre el proyecto QALL-ME financiado por la CE. Su contenido está dirigido a la audiencia general y pretende explicar los principales propósitos del proyecto. En el documento se detallan las motivaciones del proyecto, se presenta la Búsqueda de Respuesta (Question Answering - QA) como la tecnología de soporte principal y se esboza el potencial de la aplicación de QA en el contexto de los dispositivos móviles Date: September 2006 Status/Version: Final (based on the English version of B. Magnini) Distribution Level: Public

Índice 1. Detalles del Proyecto... 1 2. El Proyecto... 1 3. Tecnología... 1 4. Objetivos de investigación... 2 5. Búsqueda de respuestas en dispositivos móviles... 2 6. Potencial de Mercado... 3 7. Plan de trabajo... 3 8. El consorcio QALL-ME... 5 ii

1. Detalles del Proyecto Acrónimo: QALL-ME Título: Question Answering Learning technologies in a multilingual and Multimodal Environment Referencia: FP6 IST-033860 Tipo de contrato: Specific Targeted Research Project Fecha de inicio: 1 de Octubre de 2006 Duración: 36 meses Coordinador: ITC-irst, Trento, Italy PM: Bernardo Magnini magnini@itc.it Ph: +39 0461 314528 Contacto: Para ampliar información contactar con: Luisa Perenthaler ITC-irst Via Sommarive, 18, 38050 Povo (Trento) - Italy perenthaler@itc.it Dirección Web : http://qallme.itc.it/ 2. El Proyecto " Dónde puedo comer paella esta noche?". Responder a este tipo de preguntas se ha convertido recientemente en una oportunidad de negocio real, con una gran serie de servicios que van desde la tradicional atención al cliente hasta una oferta cada vez mayor, de servicios de asistencia basados en la web. Actualmente, los portales de voz, (servicios que proporcionan acceso mediante voz a información basada en web) suministran a los usuarios una amplia variedad de información (horarios, información de tráfico, previsiones metereológicas, eventos culturales, etc.), están experimentando un incremento exponencial en popularidad. El número de llamadas recibidas por el servicio 892424 italiano (www.seat.it), por ejemplo, ha crecido rápidamente desde 14 millones en 2003, a más de 17 millones en 2004 y cerca de 19 millones en 2005. La mayor parte del tiempo, el factor común en la demanda, aparte de la información es el dinamismo: el mundo cambia rápidamente con el transcurso del tiempo, los usuarios piden (y pagan) por información completamente actualizada. La recolección y mantenimiento de toda la información relevante, así como el suministro a los usuarios de contenidos completos y actualizados es, indudablemente, además de un cuello de botella, la parte más cara del trabajo desarrollado por los portales de voz y sistemas de información basados en la web. En consecuencia, mejorar el proceso en sus diferentes vertientes puede significar la diferencia entre el éxito y el fracaso. 3. Tecnología La búsqueda de respuestas en dominio abierto (Open Domain Question Answering - QA) es el núcleo de la tecnología que hay detrás del proyecto. QA toma una pregunta en lenguaje natural y devuelve una respuesta desde una colección de fuentes de información (como documentos o bases de datos). A diferencia de las tecnologías que sustentan los actuales motores de búsqueda en la web como Google o Yahoo, el propósito de los sistemas de QA no es devolver un documento que contiene una respuesta, como sucede en la recuperación de información, sino la secuencia exacta de Page 1

palabras que constituyen la respuesta (ver por ejemplo la demo Web de LCC QA en http://www.languagecomputer.com/, y el sistema AnswerBus en www.answerbus.com/). Por otra parte, la tecnología de QA permite el tratamiento de preguntas bien formuladas en lenguaje natural libre en vez de secuencias inconexas de palabras clave o plantillas fijas, como ocurre en los sistemas de Recuperación de Información y Extracción de Información, respectivamente. Como tecnología, QA está en la actualidad lo suficientemente madura como para pasar de las preguntas de hechos concretos aisladas (factual questions) a interacciones mucho más naturales y con conocimiento más profundo. Desde el punto de vista de las perspectivas de aplicación, en estos momentos QA esta reconocida como una de las aplicaciones de mayor interés para la Web Semántica, que requerirá tanto del uso de tecnologías del lenguaje como de la aplicación de técnicas de razonamiento basadas en la explotación intensiva del conocimiento. 4. Objetivos de investigación El objetivo general del proyecto es establecer una infraestructura compartida para búsqueda de respuestas (QA) en dominio abierto multilingüe y multimodal para teléfonos móviles. Los objetivos científicos y tecnológicos persiguen tres direcciones cruciales: QA multilingüe de dominio abierto, QA dirigido por el usuario y sensible al contexto, y tecnologías de aprendizaje automático para QA. Los objetivos de investigación específica incluyen un estado del arte sobre los últimos avances en complejidad de las preguntas que maneja el sistema (como las preguntas del tipo cómo?); el desarrollo de una arquitectura basada en web para la realización de QA interlingua (con la pregunta en una lengua y la respuesta en otra lengua diferente); la realización de sistemas de QA en tiempo real para aplicaciones concretas; la integración del contexto espacial (desde dónde hace el usuario la pregunta) y temporal, tanto para la interpretación de la pregunta como para la extracción de la respuesta; el desarrollo de un marco robusto para la aplicación de algoritmos de aprendizaje automático mínimamente supervisados en tareas de QA y la integración de tecnologías maduras para el reconocimiento automático del habla en el marco de la búsqueda de respuestas en dominio abierto. 5. Búsqueda de respuestas en dispositivos móviles El proyecto experimentará con el potencial del QA de dominio abierto y se evaluará en el contexto de la búsqueda de información para aplicaciones móviles, que es un escenario multimodal que incluye el habla espontánea como entrada y la integración de respuestas textuales con mapas, imágenes y vídeos cortos como salida. El dominio seleccionado está representado por el conjunto de eventos locales en una ciudad, normalmente disponibles bien a través de sitios web especializados o periódicos y publicaciones locales. El propósito es demostrar la viabilidad de las soluciones de QA propuestas a través de su integración en un escenario de aplicación concreto. Dicha integración seguirá cuatro direcciones principalmente relacionadas con la explotación de la Web Semántica y de Tecnologías de Interfaces Multimodales para QA. Más concretamente, se pretende llegar a 4 objetivos de integración relacionados con los Servicios Web para QA, tecnología de Wrappers, QA hablado, y QA multimodal. Se estudiará y diseñará la arquitectura de software distribuido para optimizar las comunicaciones entre los módulos de software y alcanzar un balance computacional adecuado entre los dispositivos cliente y servidor. También se llevará a cabo un Page 2

desarrollo de herramientas (como los Interfaces de Programación de Aplicaciones) que posiblemente seguirán las recomendaciones de Organizaciones Internacionales, como W3C. 6. Potencial de Mercado La búsqueda de respuestas se ha convertido en un área de investigación de rápido crecimiento y con un gran potencial comercial. El análisis y proceso de preguntas formuladas en lenguaje natural en entornos basados en Internet, sobre la base de una infraestructura distribuida para aplicaciones de QA que emplee Tecnología avanzada del lenguaje de carácter multilingüe, permitirá la aparición de entornos orientados a la recuperación, evaluación y navegación de información tremendamente accesibles y adaptados al usuario final. Las funcionalidades de los sistemas de QA, especialmente aquellos métodos que soportan la comunicación interactiva con los usuarios, permitirán su integración en aplicaciones relacionadas con la comunicación móvil, cuya principal forma de interacción es el lenguaje natural. Se atisba un mercado potencial enorme en las diferentes direcciones perseguidas en el proyecto QALL-ME. Tal y como sugiere el crecimiento exponencial que los servicios de suministro de información (call centers) están experimentando, se necesitará de servicios de búsqueda y recuperación de información de alta precisión que reduzcan de forma drástica el tiempo que un empleado necesita para localizar y suministrar dicha información a los usuarios del servicio. En consecuencia, la habilidad de gestionar de forma automática incluso una pequeña parte de todas estas solicitudes de información ofrece nuevas oportunidades de negocio para aquellas empresas relacionadas con las telecomunicaciones y con la prestación de servicios de información web. 7. Plan de trabajo QALL-ME pretende desarrollar una infraestructura distribuida para la realización de QA multilingüe y multimodal que incluye todos los componentes necesarios para proveer las funcionalidades detalladas a continuación: Recopilar, almacenar y actualizar de forma automática información relevante extraída desde diferentes tipos de fuentes de datos (estructurados y no estructurados); Procesar preguntas complejas de carácter multilingüe, ancladas al contexto (tanto temporal como espacial) en el que se realizan; Facilitar el acceso al sistema empleando diferentes modalidades como el texto escrito o la voz; Presentar a los usuarios una información correcta, completa y concisa extraída de fuentes de datos multilingüe y de formatos diversos; Combinar diferentes formatos en la presentación de información al usuario (textos, mapas, imágenes). La figura 1 muestra los módulos principales que componen la espina dorsal de la arquitectura distribuida de QALL-ME. Page 3

Figura 1: Arquitectura distribuida QALL-ME. Todos los módulos se implementarán como servicios Web empleando lenguajes estándar para la definición de servicios Web. El Planificador Central es un componente que se encarga de la interpretación multilingüe de las consultas. Este modulo recibe la consulta como entrada, procesa la pregunta en el lenguaje en el que se formula y, de acuerdo a sus parámetros de contexto, dirige la búsqueda de la información requerida hacia un Extractor de Respuestas local. La extracción de la respuesta se realiza sobre diferentes representaciones semánticas de la información que dependen del tipo de la fuente original de datos de la que se obtiene la respuesta (si la fuente es texto plano, la representación semántica será un documento anotado en XML; si la fuente es un sitio web, la representación semántica será una base de datos construida por un wrapper). Finalmente, las respuestas se devuelven al Planificador Central que determina cual es el mejor medio para presentar la información solicitada. El proyecto tiene una duración de 36 meses y está organizado en 11 módulos de trabajo: WP0: Dirección del proyecto WP1: Requerimientos de usuario WP2: Diseño de la arquitectura del sistema WP3: Interpretación multilingüe de la pregunta WP4: Acceso a los datos WP5: Extracción multilingüe de la respuesta WP6: Interacción multimodal WP7: Integración del sistema WP8: Demostración y exhibición WP9: Evaluación WP10: Diseminación y explotación El proyecto se divide en tres ciclos de desarrollo y pruebas. Cada ciclo incluye una fase de especificaciones funcionales y de usuario (WP1 y WP2), una fase de desarrollo (WP3, WP4, WP5, WP6, WP7) seguida de la realización de demostraciones y experimentos de campo (WP8) y una fase de evaluación (WP9). El final de los tres Page 4

ciclos (meses 12, 24 y 36) se corresponden con las tres principales etapas intermedias del proyecto que mostrarán el estado de desarrollo del proyecto QALL-ME. 8. El consorcio QALL-ME El consorcio QALL-ME está compuesto por siete instituciones de cuatro países miembros de la Unión Europea (Italia, Reino Unido, España y Alemania). Cuatro de los participantes son instituciones académicas (ITC-irst, University of Wolverhampton, Universidad de Alicante y DFKI) y los tres restantes son compañías industriales (Comdata, Ubiest y Waycom). Además, el consorcio dispone de importantes muestras de interés por parte de empresas interesadas en aportar sus datos para la realización de demostraciones y exhibiciones del proyecto. ITC-irst, Project Coordinator TCC-division Povo, Trento Italy http://www.itc.it/irst/ Project Manager: Bernardo Magnini DFKI Language Technology research lab Germany http://www2.dfki.de/web/ Contact Person: Guenter Neumann University of Alicante Departamento de Lenguajes y Sistemas Informáticos Spain http://www.ua.es Contact Person: Jose Luis Vicedo University of Wolverhampton Computational Linguistics Group United Kingdom http://www.wlv.ac.uk Contact Person: Ruslan Mitkov Comdata S.p.A. Torino Italy http://www.comdata.it Contact Person: Giorgio Sangalli Ubiest S.p.A. Treviso Italy http://www.ubiest.com Contact Person: Nicola De Mattia Waycom S.r.l. Albisola Superiore, Savona Italy http://www.waycom.it Contact Person: Paolo Rossi Page 5