LENGUAJES NATURALES. TEMA. Análisis Semántico



Documentos relacionados
UNIDAD I: LÓGICA PROPOSICIONAL

Ingeniería del Software I

Significado de las f.b.f (fórmulas bien formadas) en términos de objetos, propiedades y relaciones en el mundo

PROGRAMACIÓN ORIENTADA A OBJETOS Master de Computación. II MODELOS y HERRAMIENTAS UML. II.2 UML: Modelado de casos de uso

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

CONTENIDOS MÍNIMOS LENGUA CASTELLANA Y LITERATURA

Diagrama de Clases. Diagrama de Clases

Introducción. Metadatos

ANÁLISIS SEMÁNTICO. Especificación formal: Semántica Operacional, semántica denotacional, semántica Axiomática, Gramáticas con Atributos.

2.2.- Paradigmas de la POO

Elementos requeridos para crearlos (ejemplo: el compilador)

Representación del conocimiento. Diferencia entre información y conocimiento (1) Diferencia entre información y conocimiento (2) Notas

DEPARTAMENTO DE LENGUA CASTELLANA PREPARACIÓN PARA EL EXAMEN DE RECUPERACIÓN 1º ESO

2.3.- Modelo relacional de datos (aproximación lógica) La lógica de 1er orden La lógica de 1er orden La lógica de 1er orden

ESPACIOS DE COMUNICACIÓN VIRTUAL

2.3.- Modelo relacional de datos (aproximación lógica)

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Nociones Básicas de Sémantica: Semántica Denotacional

LENGUAJE VISUAL LENGUAJE VISUAL

PROLOG Inteligencia Artificial Universidad de Talca, II Semestre Jorge Pérez R.

Estructura de frase. Teoría X

1.1 Competencia comunicativa: Definición y características. Evolución del. 1.2 Competencia lingüística: Definición y características.

Metodología Orientada a Objetos Clave Maestría en Sistemas Computacionales

M III ABSTRACCIÓN Y CLASIFICACIÓN

Seminario: Expresividad semántica y lógica de segundo orden:

BPMN Business Process Modeling Notation


Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

GENERALIDADES DE BASES DE DATOS

Introducción a la Programación Orientada a Objetos (POO) Introducción a la Programación Orientada a Objetos (POO)

Lo que miden los niveles de dominio

IIC Matemática Discreta

1 Conceptos de PLN: Análisis Morfológico y Etiquetación. 2 Conceptos de PLN: Análisis Sintáctico Superficial. 4 Extracción de Información

Elaboración de Mapas Conceptuales

Patrones de software y refactorización de código

EDUCACIÓN INFANTIL. Objetivos mínimos:

Capítulos 2 y 5: Modelación con UML y Modelo Objeto

Calidad Escuela de Ingeniería de Sistemas y Computación Desarrol o de Software II Agosto Diciembre 2007

Figura 1. Símbolo que representa una ALU. El sentido y la funcionalidad de las señales de la ALU de la Figura 1 es el siguiente:

Diseño orientado a los objetos

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

GESTIÓN DE COMPETENCIAS CLAVE EN LAS ORGANIZACIONES DEL TERCER SECTOR

Introducción a los Tipos Abstractos de Datos

INDICE. XVII Prólogo a la edición en español. XXI 1. Calculo proporcional 1.1. Argumentos y proporciones lógicas

Escenas de episodios anteriores

SEGURIDAD Y PROTECCION DE FICHEROS

Instituto Tecnológico de Celaya

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental

Resortes y fuerzas. Analiza la siguiente situación. Ley de Hooke. 2do Medio > Física Ley de Hooke. Qué aprenderé?

GESTIÓN DE REDES PARTE III

IV. Problemas relativos a la construcción del conocimiento y al cambio cognitivo

UNIDADES FUNCIONALES DEL ORDENADOR TEMA 3

GUÍA METODOLÓGICA DE IMPLANTACIÓN DE PROCEDIMIENTOS Y SERVICIOS TELEMÁTICOS DE LA JUNTA DE ANDALUCÍA

Parte II DISEÑO METODOLÓGICO DE LA INVESTIGACIÓN. Tema 5 TÉCNICAS CUANTITATIVAS DE RECOGIDA DE INFORMACIÓN

Escenarios. Diapositiva 1. Ingeniería de Requerimientos: Escenarios

La Necesidad de Modelar. Diseño de Software Avanzado Departamento de Informática

ACCESO A LA UNIVERSIDAD PARA MAYORES DE 45 AÑOS PROGRAMAS DE LAS MATERIAS. Curso

PRUEBA DE ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR DE FORMACIÓN PROFESIONAL Y ENSEÑANZAS DEPORTIVAS 2007 S1_12_3

Manual de Referencia. Apertura

Tipos Abstractos de Datos

I N T E R P R E T A T I V O

Objetivos. Contenidos. Revisar los principales conceptos de la lógica de primer orden

Capítulo VI. Diagramas de Entidad Relación

Master en Gestion de la Calidad

2.4 Modelado conceptual

Semántica española. César Antonio Aguilar Facultad de Lenguas y Letras 26/05/2015. caguilara@uc.cl

ANÁLISIS DE DATOS NO NUMERICOS

Cliente: CD-ALL Propuesta para el desarrollo de una estrategia de comunicación para el sitio web de la compañía Documento de trabajo 1 Enero 2009

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores

a < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)

LENGUAJES DE CONSULTA ORIENTADOS A OBJETOS

REAL DECRETO POR EL QUE SE ESTABLECEN LAS ENSEÑANZAS MÍNIMAS DEL SEGUNDO CICLO DE LA EDUCACIÓN INFANTIL

Ingeniería en Informática

Funcionamiento de la sección Unidades Centinela (UC)

Tipos de computadoras

La Web Semántica como herramienta para e-learning

Modelo de BASE DE DATOS EBSCO

TELECOMUNICACIONES Y REDES

Page 1. Contenido. Generalidades (1) Pontificia Universidad Católica del Perú Facultad de Ciencias e Ingeniería INTELIGENCIA ARTIFICIAL

INTRODUCCION A LA LÓGICA DE ENUNCIADOS

Lección 1. Representación de números

ES U ESPAÑA 11. Número de publicación: Número de solicitud: A47G 29/00 ( )

ANÁLISIS DE CARGOS. 1. Nombre del cargo 2. Posición del cargo en el organigrama. 3. Contenido del cargo. 1. Requisitos intelectuales

Sistemas de Gestión de Documentos Electrónicos de Archivo (SGDEA)

FICHEROS Y BASES DE DATOS (E44) 3º INGENIERÍA EN INFORMÁTICA. Tema 9. Reglas de Integridad

Base de datos relacional

MLM Matemática Discreta

MODELADO DEL DOMINIO (MODELO CONCEPTUAL)

Capítulo 5. Cliente-Servidor.

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Arquitectura de Aplicaciones

UML. Lenguaje de Modelado Unificado

GESTIÓN COMERCIAL Con nuestras aplicaciones podrá gestionar toda su publicidad de la forma más sencilla e intuitiva Ahorrando tiempo.

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

DOCUMENTOS PARA ELABORAR UNA SECUENCIA DIDÁCTICA SOBRE LA PUBLICIDAD (TEXTO INFORMATIVO).

Gramáticas lógicas. Programación Lógica InCo

Procesadores de lenguaje Tema 1: Introducción a los compiladores

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA.

21/02/2012. Agenda. Unidad Central de Procesamiento (CPU)

Transcripción:

LENGUAJES NATURALES TEMA. Análisis Semántico FJRP. LN, 2005 11 de diciembre de 2006 1. Introducción Sigue al análisis sintáctico, intentando determinar el significado de las frases analizadas. Aproximación más usual: Análisis semántico dirigido por la sintaxis (syntax driven semantic analisys) Semántica compositiva: La representación semántica de un objeto debe poder obtenerse a partir de la de sus componentes (principio de composicionalidad de Frege) representación signif. palabras individuales (semántica léxica) + representación estructura de la frase (gramática) representación signif. de la frase Se ignora por ahora el contexto de la frase y el conocimiento del mundo. La representación resultante podrá dejar cosas sin especificar 1

Dos aproximaciones Interpret. semántica posterior al A. Sintáctico Interpret. semántica en paralelo con A. Sintáctico Representación del significado Diferentes técnicas posibles (relacionadas con el problema de la represent. del conocimiento en IA) Lógica de predicados de primer orden y extensiones Redes semánticas Grafos de dependencias conceptuales Frames y derivados Ejemplo : I have a car

Características deseables en formalismos de representación del significado Verificabilidad debe ser posible determinar la verdad/falsedad de las representaciones (con respecto a la base de conocimiento que defina su mundo) Represent. no ambigua Soporte del concepto de forma canónica posibilidad de asociar a múltiples entradas con un mismo significado un única representación Mecanismos de inferencia + uso de variables capacidad de extraer conclusiones válidas a partir de las representaciones de significados Expresividad el sist. debe poseer suficiente capacidad expresiva para representar cualquier frase de interés para la aplicación concreta

2. Representaciones basadas en lógica de predicados LPPO (lógica de predicados de primer orden) Mecanismo de representación del signif. muy usado Cubre muchos de los requisitos anteriores Existen bases teóricas y computacionales para darle soporte Significado de los lenguajes naturales Existen formas de expresar significado comunes a distintos lenguajes humanos: orden de las palabras, uso de conjunciones y cunatificadores, etc,... En general, la estructura semántica de los lenguajes se puede interpretar en base a construciones predicadoargumento Los verbos suelen corresponderse con predicados lógicos, siendo los componentes que los acompañan (sujeto, complementos, etc) sus argumentos Otras categorías también tienen asociadas estructuras predicado-argumento: preposiciones, adverbios, etc Correspondencia LPPO y elementos del lenguaje constantes se refieren a objetos específicos (suelen corresponderse con nombres propios) funciones se refieren también a objetos específicos, permiten referirse a ellos sin tener que asignarles una constante. Ej.: genitivo sajón en inglés ( my school location LocationOf(M yschool)), sintagmas preposicionales, etc..

variables permiten manejar objetos e inferir sin tener que referenciar un objeto en concreto. Pueden referirse a un objeto anónimo o a un conjunto de objetos. predicados representan relaciones entre un número fijo de objetos. En el caso de presicados con un argumento, suelen representar propiedades de ese obejeto Ej.: Juan lee un libro ( leer(juan, Libro)), Juan es un estudiante ( estudiante(juan)) conectivas lógicas permiten representaciones compuestas complejas, agrupando objetos y relaciones entre objetos Conectivas:,,,, cuantifiadores Especifican el ámbito de las variables y su interpretación un objeto anónimo (cuantif. existencial) todos los objetos de un conjuntos (cuantif. universal) Cuantif. existencial: suelen asociarse con determinantes indefinidos Un restaurante que sirva comida mexicana cerca de la universidad x Restaurante(x) Servir(x, Comida M exicana) Cerca(situacion(x), situacion(u niversidad)) Cuantif. universal: suele estar asociado a determinantes definidos (artículos) y a expresiones como todos, para todo, cualquier,... Todos los restaurantes vegetarianos sirven comida vegetariana x Restaurante(x) T ipo(x, V egetariano) Servir(x, Comida V egetariana)

Análisis dirigido por la sintaxis y LPPO IDEA BASE: Asociar a las reglas de la gramática info. semántica que determine cómo construir las representaciones semánticas a partir de la semántica de los componentes (Aplicación directa del principio de composicionalidad) Notación LPPO no basta Necesidad de instanciar variables Uso del lambda cálculo y λ-reducciones Ejemplo: Cada palabra del lexicon tiene asociada una λ-expresión con su semántica IDEM para las reglas

3. Gramáticas semánticas Combinación de sintaxis y semántica en un mismo formalismo (normalmente CFG) Usadas en dominios restringidos Conjunto de terminales y no terminales específico para el dominio de aplicación concreto Los símbolos de la gramática representan categorías semánticas (conceptos, entidades, relaciones) específicas de ese dominio Las reglas de producción de la gramática derivan del dominio Ejemplo: Dominio de reservas aereas VENTAJAS: Generación de representaciones semánticas más sencilla que con gramáticas generales Gramáticas generales: Orientadas a capturar generalizaciones sintácticas y evitar sobregeneración, no a extraer semántica Los elementos con significado están esparcidos por el árbol sintáctico, que contiene elementos sin valor semántico Gramáticas semánticas: Las reglas y los constituyentes se corresponden directamente con elementos del dominio de aplicación Elementos semánticos relacionados aparecerán en general dentro de la misma regla No se generaliza más de los que es necesario para el contexto de uso

INCONVENIENTES: Número alto de reglas y mayor ambigüedad (no se generaliza) Poca generalidad y potencia expresiva restringida (limitada al dominio) Demasiada dependencia del dominio Difícil aplicarlo en entornos nuevos (requeriría reescribir en profundidad la gramática)

4. Semántica léxica. WordNet Relaciones Semánticas Estudio del significado (sentido) de las palabras (lexemas) y de las relaciones entre palabras y significados Relaciones semanticas Homonimia Palabras con la misma forma y significados no relacionados (homófonos y homógrafos) Ejemplo: banco (asiento), banco (de $) Problemas: Degradan el rendimiento de: sist. de corrección de errores, sist. reconocimiento del habla, sist. recuperación de información Polisemia Una misma palabra con múltiples significados relacionados Ejemplo: banco (de sangre), banco (de $) Problemas: Difícil descubrir el significado correcto de una palabra en un contexto dado. WORD SENSE DISAMBIGUATION: Técnicas (estadísticas y/o basadas en reglas) para determinar el significado de una palabra en un contexto concreto (suelen basarse en el uso de bases de datos de conocimiento semántico) Sinonimia Diferentes palabras con el mismo o similar significado CONCEPTO CLAVE: intercambiabilidad Dos palabras son sinónimas (puras) si se pueden intercambiar en cualquier contexto sin afectar al significado global

Hiponimia/Hiperonimia Relación entre palabras donde una de ellas denota a una subclase de la otra más específica (relación IS A ), estable una jerarquía (normalmente con herencia) Ejemplo: coche vehículo, niño hombre ser humano mamífero... Hiperónimo: concepto más general Hipónimo: concepto más específico Otras relaciones antonimia, meronimia/holonimia (relación PARTE DE, jerarquía con herencia)

WORDNET (http://www.cogsi.princeton.edu/ wn) Base de datos de información léxica (el original es en inglés, EUROWORDNET es una versión en varios idomas europeos). Evolución de los diccionarios electrónicos (forma una red semántica de conceptos) Contine 3 bases de datos (nombres, verbos, adjetivos+adverbios) que asignan a cada lexema individual el cojunto de de sentidos que puede tener asociados y establecen las relaciones entre formas y sentidos Entradas en WordNet para cada palabra devuelve: conj. de sinónimos+definición+ejemplos de uso PRINCIPAL APORTACION: Soporte de un conjunto de relaciones semánticas independientes del dominio Relaciones soportadas en la red semántica Para NOMBRES: Hyperonym, Hyponym, Has Member, Member Of, Has Part, Part Of, Antonym Para VERBOS: Hyperonym, Troponym ( hiponimia, verbos que son formas particulares de otros [caminar/pasear]), Entail (implicación, causa entre verbos [roncar dormir]), Antonym Para ADJ./ADV.: Antonym

CONCEPTO BÁSICO: SYMSETS (conjuntos de sinónimos) Encargados de soportar la relación de sinonimia entre palabras. Todas las demás relaciones semánticas se definen entre pares symsets Cada symset representa un CONCEPTO que puede ser lexicalizado en el lenguaje mediante diferentes palabras (SYSSET CONCEPTO) WordNet repsesenta cada symset como la lista de entradas léxicas que pueden emplearse para expresar el concepto que representa. Las relaciones que define WordNet se establecen entre symsets, no entre los lexemas o sentidos individuales Ejemplo: Relación de Hiponimia Cada SYMSET se relaciona con su SYMSET inmediatamente más general mediante la relación de HIPER- ONIMIA y con los los SYMSETS más especifícos mediante HIPONIMIA Para la forma "bajo": <sentido 1> (symset XXXXXX) {bajo}... (cantante con un tono de voz...) => {cantante, vocalista} => {artista,...} => {persona, individuo, ser humano,...} => {ser, entidad,...} <sentido 2> (symset YYYYYY) {bajo, guitarra baja}... (instrumento musical...) => {instrumento musical} => {instrumento, aparato, artefacto} => {entidad, objeto,...}