Uso de cadenas de Markov para la desambiguación morfológica y su aplicación al castellano
|
|
- Juan Manuel Bustos Serrano
- hace 6 años
- Vistas:
Transcripción
1 Uso de cadenas de Markov para la desambiguación morfológica y su aplicación al castellano JOSÉ LUIS TRIVIÑO RODRIGUEZ RAFAEL MORALES BUENO FRANCISCO TRIGUERO RUÍZ JOSÉ LUIS PÉREZ DE LA CRUZ MOLINA Universidad de Málaga RESUMEN: El problema de la desambiguación morfológica es la elección del análisis morfológico correcto para una palabra dentro del contexto de una frase entre todos los análisis morfológicos válidos para esta palabra. El uso de cadenas de Markov ha constituido un método sencillo y eficaz para el cálculo de la dependencia del análisis con el contexto de la frase y, por tanto, para la desambiguación morfológica. En este informe se describe tanto el entrenamiento y cálculo de la matriz de transición de una cadena de Markov como su uso para la desambiguación en sus dos modalidades: a partir de texto etiquetado y a partir de texto sin etiquetar mediante modelos de Markov ocultos (HMM). 1INTRODUCCIÓN El inglés es donde más tiempo se lleva estudiando el análisis morfológico de las palabras mediante el ordenador. En este idioma, las palabras tienen una única forma poco relacionada con la clase gramatical a la que pertenecen debido a su escasa riqueza flexiva. Esto ha hecho que los esfuerzos por realizar un análisis morfológico automático se hayan basado en el estudio de la palabra dentro del entorno de la frase más que en contemplar la palabra de forma aislada. De esta forma, todos los análisis válidos para una palabra se obtienen a partir de un diccionario léxico. Dentro del diccionario se almacena cada palabra junto a todos sus posibles análisis. La elección del análisis correcto para la palabra dentro del contexto de la frase de entre todos los posibles asignados en el diccionario léxico para esa palabra constituye el verdadero problema del análisis morfológico de textos en inglés. A esta elección del análisis correcto en función del contexto se denomina desambiguación morfológica. En cambio en el español ocurre todo lo contrario, ya que la mayor flexibilidad de este idioma no hace tan dependiente la clase gramatical de una palabra con su contexto. De esta forma aparecen las dos siguientes líneas de desarrollo de análisis morfológico del español: Métodos basados en la morfología en dos niveles descrita por Koskenniemi (Koskenniemi 1983): "Analizador morfológico del Español" (Triviño 1993), "Using a morphological analyzer to teach theoretical morphology" (Klanvas 1991: ) y "A morphological processor for Spanish implemented in prolog" (Moreno y Goñi 1995: ). Métodos basados en el aprendizaje automático: "A study of english word category prediction based on neural networks" (Nakamura y Shikanom 1989: ) y "SEAM: Sistema Experto para Análisis Morfológico" (Triviño y Calle 1997). Sin embargo, una vez realizado el análisis de la palabra fuera del contexto de la frase, en la mayoría de los casos este proceso produce más de un etiquetado posible para la palabra. De esta forma, se hace necesario un proceso desambiguador posterior similar al realizado para textos en inglés que, en función del contexto de la palabra, seleccione el etiquetado correcto entre todos los posibles para esa palabra. A continuación se analizará uno de los modelos más utilizados para la desambiguación morfológica, esto es, el análisis probabilístico de secuencias de etiquetas mediante un modelo matemático basado en cadenas de Markov, descrito entre otros por Merialdo (Merialdo 1994: ). El uso de cadenas de Markov permite estudiar la probabilidad de un determinado análisis en
2 función de los precedentes, tomando como correcto aquel con mayor probabilidad. En función de la probabilidad que se maximiza existen dos tipos diferentes de etiquetado probabilístico: tomar la secuencia de etiquetas más probable para la frase (Viterbi Tagging) y tomar las etiquetas más probables para cada palabra dentro de la frase (Maximum Likelihood Tagging). El cálculo del modelo se puede realizar mediante entrenamiento a partir de un texto previamente etiquetado o bien mediante un modelo inicial impreciso calculado a partir del método anterior y un refinamiento del modelo de Markov oculto (HMM) a partir de texto sin etiquetar. A continuación, en la sección dos, se definirá el modelo matemático de cadena de Markov que permitirá estudiar el problema del etiquetado como función matemática y su formulación en términos probabilísticos para, posteriormente, describir el modelo triclásico para la desambiguación morfológica basado en cadenas de Markov y los métodos de entrenamiento del mismo. Por último se expondrán los resultados experimentales obtenidos y la aplicación al castellano de estos métodos, finalizando con una series de conclusiones obtenidas a partir de estos resultados. 2ANÁLISIS DE TEXTOS MEDIANTE UN MODELO PROBABILÍSTICO. 2.1Formulación probabilística Para el estudio probabilístico de la desambiguación morfológica resulta adecuado el modelo matemático formado por Cadenas de Markov y definido de la siguiente forma: Definición. Una Cadena de Markov es una fuente de información en la que, la probabilidad de aparición de cada símbolo, solo depende de un número finito m de símbolos que le han precedido y del tiempo. A m se le llama el orden de la cadena. Definición. En un instante t, se define el estado de una fuente de Markov de orden m como la cadena formada por los m símbolos precedentes. Habrá como máximo n m estados posibles. Donde n es el número de símbolos del alfabeto. Una cadena de Markov de orden m viene definida por un conjunto finito de estados E={e 0, e 1,..., e M} y un conjunto de probabilidades de transición π ij(t), definidas por: ( t) = Pr{ E( t + 1) = e E( t) = e } π ij j i donde E(t) es una variable aleatoria temporal que toma sus valores en E en cada instante de tiempo. Este modelo permite la formulación probabilística del problema de análisis, para lo cual supondremos que las alineaciones son generadas por un modelo probabilístico de acuerdo a una distribución de probabilidades: Pr(W,T) En este caso, dependiendo del criterio elegido para la evaluación, el análisis óptimo es el siguiente: Para una evaluación en el nivel de frase (Viterbi Tagging), elegiremos la secuencia de etiquetas más probable para una frase: φ( W) = T / T, Pr( T W) Pr( T / W) T cumple ademas: T, Pr(W, T ) Pr(W, T) Para evaluación en el nivel de palabra (Maximum Likelihood Tagging), elegiremos el análisis más probable para cada palabra en la frase: φ( W) = t / t,pr( t = t W) Pr( t = t W) t, i i i t cumple ademas Pr( W, T ) Pr( W, T) T : ti = t T: ti = t Donde φ(w) i es el análisis dado a la palabra Wi por la función de análisis φ en el contexto de la frase W. 2
3 Es interesante notar que el método más comúnmente usado es Viterbi tagging (Church 1989: ) a pesar de que no es el método óptimo para la evaluación a nivel de palabra. Las razones para esta preferencia en su uso son: Es más simple de implementar que ML tagging y requiere menos computación (aunque ambos tengan la misma complejidad asintótica). Viterbi tagging proporciona una mejor interpretación para las frases, lo cual es lingüísticamente aceptable. ML tagging puede producir secuencias de análisis que son lingüísticamente imposibles (debido a que la elección de un análisis depende de todos los contextos tomados juntos). Sin embargo, en las experiencias desarrolladas por Merialdo, se observó que Viterbi y ML tagging producen resultados de similar rendimiento. 2.2El modelo triclásico El modelo triclásico supone una simplificación del modelo matemático probabilístico con objeto de facilitar el estudio del mismo. Para ello partiremos de la siguiente expresión: n i 1 1 i 1 i 1 i i 1 1 i 1 i 1 i= 1 Pr( W, T) = Pr( W W T... W T T ) p( T W T... W T ) El modelo triclásico está basado en las siguientes aproximaciones: La probabilidad de un análisis depende sólo de los últimos dos análisis (Cadena de Markov de orden 2): Pr( Ti W1T 1... Wi 1T i 1) = h( Ti Ti 2Ti 1) La probabilidad de una palabra depende sólo de su análisis: Pr( Wi WT i 1... Wi 1T i 1Ti ) = k( Wi Ti ) Con objeto de definir completamente el modelo es necesario especificar los valores de las probabilidades h y k. Para ello es posible utilizar dos tipos diferente de entrenamiento: Entrenamiento de frecuencia relativa (RF). Si disponemos de cierta cantidad de texto analizado podemos calcular el número de veces N(w,t) que una palabra dada w aparece con el análisis t, y el número de veces N(t 1,t 2,t 3 ) que la secuencia (t 1,t 2,t 3 ) aparece en el texto. Podemos también estimar las probabilidades h y k mediante el cálculo de las frecuencias relativas a los correspondiente sucesos Entrenamiento de máxima probabilidad (Maximum Likelihood) realizado mediante el algoritmo Forward Backward (FB). Este problema corresponde con el entrenamiento de un modelo de Markov oculto. Una solución conocida a este problema es el Forward Backward (FB) o Baum Welch algorithm (Baum y Eagon 1967: ), el cual construye iterativamente una secuencia de modelos que mejoran la probabilidad de los datos de entrenamiento. La ventaja de este enfoque es que no requiere texto analizado para el entrenamiento, pero supone que el modelo correcto es aquel en el que los análisis son usados para conseguir una predicción mejor de la secuencia de palabras. 2.3Resultados experimentales A continuación se muestran los resultados experimentales obtenidos por Merialdo (Merialdo 1994: ) para los dos entrenamientos anteriormente descritos. Esta experiencia se realizó sobre textos en lengua inglesa procedentes de "treebank". Estos textos estaban formados por frases (aproximadamente un millón de palabras). Datos de entrenamiento Número de errores % de análisis correctos (frases) (palabras) ,0 El porcentaje de análisis correctos es relativamente alto, sin embargo hay que considerar que: 3
4 Más de la mitad de las palabras del texto tienen un único análisis posible, por lo que no es posible cometer ningún error al analizarlas. Aproximadamente un cuarto de las palabras del texto tienen sólo dos posibles análisis, por lo que la probabilidad de asignar el análisis correcto es del 50%. 3APLICACIÓN AL CASTELLANO Aunque es posible la aplicación directa del modelo triclásico para la desambiguación morfológica de textos en castellano, la riqueza flexiva de este lenguaje plantea varias dificultades de índole práctica. Una de las mayores dificultades viene producida por el aumento del número de etiquetas posibles para el análisis. En el análisis de textos en castellano hay que considerar, además de la clase gramatical de la palabra (nombre, adjetivo, etc.), otros accidentes gramaticales como son el género, número, tiempo verbal, etc. Debido a que los algoritmos de etiquetado Viterbi Tagging y Maximum Likelihood Tagging estan diseñados para generar una única cadena de etiquetas, es necesario combinar estos nuevos atributos con la clase gramatical para formar un conjunto de nuevas etiquetas. La combinación de las etiquetas de los diferentes atributos de una palabra (clase, género, etc.) aumenta considerablemente el número de etiquetas posibles en el proceso de análisis. Esto provoca un aumento del número de estados de la cadena de Markov necesaria para el análisis, pasando de 72 2 = estados para el inglés a = estados para el español, lo cual supone un importante incremento tanto de requisitos computacionales como de capacidad de almacenamiento. 4CONCLUSIONES Como puede observarse, el uso de cadenas de Markov permite desarrollar algoritmos de desambiguación morfológica relativamente sencillos en base a una teoría probabilística que, si bien no alcanza una efectividad del 100%, obtienen resultados aceptables. Por otro lado, el uso de modelos de Markov ocultos (HMM) permite entrenar el algoritmo sin necesidad de una gran cantidad de texto etiquetado difícil de conseguir salvando, de este modo, el inconveniente de otros algoritmos de aprendizaje supervisado como pueden ser las redes neuronales. Sin embargo, el mayor inconveniente del uso de cadenas de Markov para la desambiguación morfológica viene dado por el límite superior de acierto intrínseco al método, ya que se pretende emular un sistema no probabilístico como es el lenguaje natural mediante un modelo probabilístico. En principio, esta límite superior podría mejorarse aumentando el orden de la cadena de Markov haciendolo superior a 2 (utilizado en el modelo triclásico). Sin embargo esto plantearía problemas de cálculo al aumentar exponencialmente el número de estados e incluso puede llegar a disminuir el número de acierto para ciertas construcciones sintácticas. 5REFERENCIAS 1. Baum, L. E. y Eagon, J. A. (1967): "An inequality with application to statistical estimation for probabilistic functions of Markov processes and to a model for ecology", en Bulletin of the American Mathematicians Society 73, Church, Kenneth W. (1989). "A stochastic parts program noun phrase parser for unrestricted text", en IEEE Proceeding of the ICASSP, Glasgow, Klanvans, Judith L. y Chodorow, Martin S. (1991): "Using a morphological analyzer to teach theoretical morphology", en Computers and the Humanities 25: Koskenniemi, Kimmo (1983): "Two level morphology: a general computational model for word form recognition and production", en Publication 11, Department of General Linguistics, University of Helsinki, Helsinki, Findland. 4
5 5. Merialdo, Bernard (1994): "Tagging english text with a probabilistic model", en Computers and Humanities 20(2), Moreno, Antonio y Goñi, José M. (1995, septiembre): "A morphological processor for Spanish implemented in prolog", en Proceedings of the Joint Conference on Declarative Programming, GULP PRODE 95, Marina di Vietri, Italy: Nakamura, M. y Shikanom K. (1989): "A study of english word category prediction based on neural networks", en IEEE Proceedings of the ICASSP, Glasgow: Triviño, José L. (1993): Analizador morfológico del español, Proyecto fin de carrera. Dept. Lenguajes y Ciencias de la Computación, Universidad de Málaga, España. 9. Triviño, José L. y Calle, Javier (1997): "SEAM (Sistema Experto para Análisis Morfológico)", en Interlingüística 7. 5
Maestría en Bioinformática Probabilidad y Estadística: Clase 13
Maestría en Bioinformática Probabilidad y Estadística: Clase 13 Gustavo Guerberoff gguerber@fing.edu.uy Facultad de Ingeniería Universidad de la República Mayo de 2010 Contenidos 1 Hidden Markov Models
Más detallesCurso de Inteligencia Artificial
Curso de Inteligencia Artificial Modelos Ocultos de Markov Gibran Fuentes Pineda IIMAS, UNAM Redes Bayesianas Representación gráfica de relaciones probabilísticas Relaciones causales entre variables aleatorias
Más detallesBases Formales de la Computación: Sesión 3. Modelos Ocultos de Markov
Bases Formales de la Computación: Sesión 3. Prof. Gloria Inés Alvarez V. Departamento de Ciencias e Ingeniería de la Computación Pontificia Universidad Javeriana Cali Periodo 2008-2 Contenido 1 Introducción
Más detallesEtiquetado gramatical
Etiquetado gramatical ITALICA Universidad de Sevilla José A. Troyano Índice Introducción Etiquetado con el modelo de Markov Etiquetado con el modelo de Markov oculto Etiquetado transformacional Precisión
Más detallesProcesamiento de voz - Reconocimiento de voz II
Procesamiento de voz - Reconocimiento de voz II Marc S. Reßl Roxana Saint-Nom 2009 Ingeniería Electrónica Instituto Tecnológico de Buenos Aires Reconocimiento de voz Las técnicas que vimos hasta ahora
Más detallesTagging. POS Tagging Taggers basados en reglas Taggers estadísticos Taggers y aprendizaje automático Combinación de estrategias.
Tagging POS Tagging Taggers basados en reglas Taggers estadísticos Taggers y aprendizaje automático Combinación de estrategias PLN Tagging 1 POS Tagging Las palabras, tomadas en forma aislada, son ambiguas
Más detallesUn lematizador desambiguado con R
Un lematizador desambiguado con R Carlos J. Gil Bellosta cgb@datanalytics.com Mayo 2013 Contenidos 1 Motivación: un discurso de Rajoy 2 Lematización basada en reglas Lematización basada en diccionarios
Más detalles300CIG007 Computabilidad y Lenguajes Formales: Autómatas Finitos
300CIG007 Computabilidad y Lenguajes Formales: Autómatas Finitos Pontificia Universidad Javeriana Cali Ingeniería de Sistemas y Computación Prof. Gloria Inés Alvarez V. Qué es un computador? Todos lo sabemos!!!
Más detallesProcesadores de Lenguaje
Procesadores de Lenguaje El Procesamiento de Lenguajes Naturales Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias - Ing. Informática - Primavera de 2010 19 de mayo de 2010 Componentes
Más detallesModelos del Lenguaje. Qué es un ML? Modelos basados en N-gramas Modelos basados en Gramáticas Propuesta de T.D
Modelos del Lenguaje Qué es un ML? Modelos basados en N-gramas Modelos basados en Gramáticas Propuesta de T.D Modelos De Lenguaje Qué es un modelo de lenguaje? Mecanismo para definir la estructura del
Más detallesProposición de un modelo para la acentuación automática de palabras ambiguas del español, utilizando etiquetado de texto
Programación Matemática y Software (2010) Vol.2. Num. 1. ISSN: 2007-3283 Recibido: 31 de Agosto del 2009 Aceptado: 28 de Diciembre del 2009 Publicado en línea: 30 de Junio del 2010 Proposición de un modelo
Más detallesModelos De Computación. Guía Modelos de Computación. Tema I: Lenguajes y Gramáticas
Guía Modelos de Computación Tema I: Lenguajes y Gramáticas Introducción La sintaxis de un lenguaje natural, esto es, la de los lenguajes hablados, como el inglés, el español, el alemán o el francés, es
Más detallesTema 1: Introducción. Teoría de autómatas y lenguajes formales I
Tema 1: Introducción Teoría de autómatas y lenguajes formales I Bibliografía Hopcroft, J. E., Motwani, R., y Ullman, J. D. Introducción a la Teoría de Autómatas, Lenguajes y Computación. Addison Wesley.
Más detallesPROGRAMA INSTRUCCIONAL AUTOMATAS Y LENGUAJES FORMALES
UNIVERSIDAD FERMIN TORO VICE RECTORADO ACADEMICO UNIVERSIDAD FACULTAD DE INGENIERIA ESCUELA DE MANTENIMIENTO MECÁNICO ESCUELA DE TELECOMUNICACIONES ESCUELA DE ELÉCTRICA ESCUELA DE COMPUTACIÓN PROGRAMA
Más detallesConceptos básicos estadísticos
Conceptos básicos estadísticos Población Población, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. El concepto
Más detallesAnálisis Léxico de Unidades Léxicas Compuestas MARC ORTEGA GIL. Universidad Autónoma de Barcelona
Análisis Léxico de Unidades Léxicas Compuestas MARC ORTEGA GIL. Universidad Autónoma de Barcelona marc.ortega@uab.es RESUMEN En este artículo se quiere mostrar cómo se realiza el análisis de unidades léxicas
Más detallesPara llevar a cabo una simulación, se requiere implementar las siguientes etapas:
SIMULACIÓN: La simulación se define como una técnica numérica utilizada para representar un proceso o fenómeno mediante otro más simple que permite analizar sus características. Esta técnica emplea relaciones
Más detallesUniversidad Fermín Toro. Cabudare Lara
Universidad Fermín Toro Cabudare Lara Lenguaje Natural y Lenguaje Artificial Autor: Jesús Colmenarez C.I.13.032.160 Sec. SAIA Introducción a la Computación Lenguaje Natural El lenguaje natural es el lenguaje
Más detallesControla el flujo de tokens reconocidos por parte del analizador léxico. 4.2 Introduccion a las gramaticas libres de contexto y arboles de derivacion
UNIDAD IV Analisis Sintactico 4.1 Introduccion Sintaxis significa estructura del orden de las palabras en una frase. La tarea del analisis sintactico es revisar si los símbolos aparecen en el orden correcto
Más detalles3. ESTRUCTURA DE UN CONVERSOR TEXTO-VOZ
Capítulo 3. Estructura de un conversor texto-voz Pagina 27 3. ESTRUCTURA DE UN CONVERSOR TEXTO-VOZ 3.1 INTRODUCCIÓN La conversión automática de texto a voz requiere la sucesión de una serie de procesos
Más detallesRedes de Neuronas de Base Radial
Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta
Más detallesSon una clase particular de los algoritmos evolutivos.
Algoritmos Genéticos (AGs) Los AGs son técnicas de resolución para problemas de Búsqueda Optimización Aprendizaje en máquinas Son una clase particular de los algoritmos evolutivos. Los AGs intentan resolver
Más detallesReconocimiento Automático de Voz
Reconocimiento Automático de Voz Presentación basada en las siguientes Referencias: [1] Rabiner, L. & Juang, B-H.. Fundamentals of Speech Recognition, Prentice Hall, N.J., 1993. [2] Rabiner, L. & Juang,
Más detalles6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme
Aplicación de redes neuronales en el cálculo de sobretensiones y tasa de contorneamientos 233 6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS 6.4.1. Introducción Como ya
Más detallesALGORITMOS GENÉTICOS: ALGUNOS RESULTADOS DE CONVERGENCIA
Mosaicos Matemáticos No. 11 Diciembre, 23. Nivel Superior ALGORITMOS GENÉTICOS: ALGUNOS RESULTADOS DE CONVERGENCIA Mario Alberto Villalobos Arias Departamento de Matemáticas Centro de Investigación y de
Más detallesCapítulo 9. Introducción a los lenguajes formales. Continuar
Capítulo 9. Introducción a los lenguajes formales Continuar Introducción Un lenguaje es un conjunto de símbolos y métodos para estructurar y combinar dichos símbolos. Un lenguaje también recibe el nombre
Más detallesECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
Más detallesEs un conjunto de palabras y símbolos que permiten al usuario generar comandos e instrucciones para que la computadora los ejecute.
Los problemas que se plantean en la vida diaria suelen ser resueltos mediante el uso de la capacidad intelectual y la habilidad manual del ser humano. La utilización de la computadora en la resolución
Más detallesUNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA Escuela Técnica Superior de Ingeniería Informática Procesadores de Lenguajes. Tema 2.
UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA Escuela Técnica Superior de Ingeniería Informática Procesadores de Lenguajes Tema 2 Análisis Léxico Javier Vélez Reyes jvelez@lsi.uned.es Objetivos del Tema
Más detallesAGME: Un Sistema de Análisis y Generación de la Morfología del Español
AGME: Un Sistema de Análisis y Generación de la Morfología del Español Francisco Velásquez, Alexander Gelbukh, Grigori Sidorov Centro de Investigación en Computación (CIC), Instituto Politécnico Nacional
Más detallesTraducción automática en la SGAD. PLATA Plataforma de Traducción Automática.
PLATA Plataforma de Traducción Automática. Índice 1. Objetivo del documento. 2. Contexto. 3. Qué es PLaTa?. 4. Módulos de PLaTa. 5. Qué traduce PLaTa?. 6. Idiomas de traducción de PLaTa. 7. PLaTa integrada
Más detallesCadenas de Markov Tiempo Discreto. Modelado y Análisis de Redes de Telecomunicaciones
Cadenas de Markov Tiempo Discreto Modelado y Análisis de Redes de Telecomunicaciones Motivación Ejemplo 1 Sea un enrutador al que arriban paquetes de otros (varios) routers Cuando más de un paquete llega
Más detallesCriterio de implementación de un HMM usando LogProb. Jorge Luis Guevara Díaz Escuela de Informática
Criterio de implementación de un HMM usando LogProb Jorge Luis Guevara Díaz Escuela de Informática Introducción Introducción Modelos Ocultos de Markov - HMM Motivación Definición Algoritmo forward-backward
Más detallesUNIVERSIDAD NACIONAL DEL CALLAO
UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE INGENIERÍA INDUSTRIAL Y DE SISTEMAS INSTITUTO DE INVESTIGACION DE LA FACULTAD DE INGENIERIA INDUSTRIAL Y DE SISTEMAS INFORME FINAL DEL PROYECTO DE INVESTIGACIÓN
Más detallesOrganización. Autómatas probabilísticos (AEFP) Definición de Autómata. Modelo de Markov. Ejemplo de AEFP. Modelos basados en autómatas probabilísticos
Organización Modelos basados en autómatas probabilísticos Bioingeniería I Parte I Autómatas determinísticos Autómatas celulares. Aplicación modelos tejido excitable. Parte II Autómatas probabilísticos
Más detallesInteligencia artificial
Inteligencia artificial Proceso de Lenguaje Natural Qué es el Lenguaje? Qué es el Lenguaje Natural? Procesamiento del lenguaje Natural (PLN) Aplicaciones PLN Niveles del Lenguaje Arquitectura de un sistema
Más detallesReconocimiento de Patrones DRA. LETICIA FLORES PULIDO
Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: REDES NEURONALES MULTICAPA TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 2 : APRENDIZAJE MÁQUINA
Más detallesANEXO 1: DOCUMENTO ICONIX. Nº Requisito Funcional Prioridad 1 La aplicación será desarrollada en lenguaje JAVA. NF 1
ANEXO : DOCUMENTO ICONIX. Análisis de Requisitos. Catálogo de Requisitos REQUISITOS GENERALES La aplicación será desarrollada en lenguaje JAVA. N 4 La aplicación permitirá almacenar las anotaciones semánticas
Más detallesAprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo
2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado
Más detallesAnalizador Sintáctico Ascendente
Analizador Sintáctico Ascente Un Analizador Sintáctico (A. St.) Ascente construye el árbol desde las hojas hacia la raíz. Funciona por reducción-desplazamiento, lo cual quiere decir que, siempre que puede,
Más detallesDesambiguación léxica basada en redes neuronales para el castellano
Desambiguación léxica basada en redes neuronales para el castellano Salvador Tortajada Velert, María José Castro Bleda, Ferran Pla Santamaría Departamento de Sistemas Informáticos y Computación Universidad
Más detallesSeminario de análisis del discurso
Seminario de análisis del discurso Dr. César Antonio Aguilar Facultad de Lenguas y Letras 09/09/2010 CAguilar@iingen.unam.mx Anotación lingüística (1) Algo que marca una diferencia fundamental entre tener
Más detallesLenguajes y Compiladores Aspectos Formales (Parte 1) Compiladores
Facultad de Ingeniería de Sistemas Lenguajes y Aspectos Formales (Parte 1) 1 Aspectos Formales Los compiladores traducen lenguajes que están formalmente definidos a través de reglas que permiten escribir
Más detallesLENGUAJES Y GRAMÁTICAS
LENGUAJES Y GRAMÁTICAS Orlando Arboleda Molina Escuela de Ingeniería de Sistemas y Computación de La Universidad del Valle 20 de septiembre de 2008 Contenido Lenguajes y Gramáticas Gramáticas Gramáticas
Más detallesANÁLISIS LÉXICO Ing. Ronald Rentería Ayquipa
ANÁLISIS LÉXICO Ing. Ronald Rentería Ayquipa ANALIZADOR LÉXICO (AL) El Analizador léxico (scanner), lee la secuencia de caracteres del programa fuente, caracter a caracter, y los agrupa para formar unidades
Más detallesHerramienta software para resolver procesos de decisión de Markov utilizando recocido simulado
Herramienta software para resolver procesos de decisión de Markov utilizando recocido simulado Cristhian D SANDOVAL Ximena GALINDO Roberto E SALAS RESUMEN Este artículo expone el diseño del prototipo de
Más detallesLENGUAJES Y GRAMÁTICAS
LENGUAJES Y GRAMÁTICAS LENGUAJES Y GRAMÁTICAS La sintaxis de un lenguaje natural en lenguajes como el ingles, español, alemán o francés es extremadamente complicada, dado que es imposible especificar la
Más detallesTarea 2. José Alberto Benítez Andrades A. Descubrimiento de Información en Textos
Descubrimiento de Información en Textos Tarea 2 71454586A Descubrimiento de Información en Textos Máster en Lenguajes y Sistemas Informáticos Tecnologías del Lenguaje en la Web UNED 0. Introducción La
Más detallesEjemplo: Los miembros del Colegio de Ingenieros del Estado Cojedes.
Qué es la Estadística? En el lenguaje común, la palabra se emplea para denotar un conjunto de calificaciones o de números, por ejemplo: una persona puede preguntar has visto las últimas estadísticas acerca
Más detallesAtaque de texto claro escogido contra la clave de protocolo del cifrado de Doble Criptograma Simétrico
Ataque de texto claro escogido contra la clave de protocolo del cifrado de Doble Criptograma Simétrico Manuel J. Lucena López 27 de enero de 2013 Resumen Se presenta un ataque de texto claro escogido para
Más detallesINFORME TAREA N 4 CLUSTERING
Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería Eléctrica EL4106 Inteligencia Computacional INFORME TAREA N 4 CLUSTERING Nombre Alumno : Profesor : Profesor Auxiliar
Más detallesIntroducción al procesamiento del lenguaje natural (PLN)
Introducción al procesamiento del lenguaje natural (PLN) Leticia Martín-Fuertes Moreno Lingüista computacional en Bitext @nimbusaeta nimbusaeta@gmail.com Lingẅars @ Cylicon Valley 9 de noviembre de 2017
Más detallesANÁLISIS ESTADÍSTICO DEL COMPORTAMIENTO DEL PRIMER ETIQUETADOR CUBANO EN TRES DIFERENTES CORPUS DE LA PRENSA
ANÁLISIS ESTADÍSTICO DEL COMPORTAMIENTO DEL PRIMER ETIQUETADOR CUBANO EN TRES DIFERENTES CORPUS DE LA PRENSA Leonel Ruiz Miyares Centro de Lingüística Aplicada Ministerio de Ciencia, Tecnología y Medio
Más detallesPrimera aproximación al aprendizaje automático.
APRENDIZAJE Introducción al aprendizaje algorítmico José M. Sempere Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia Aprender: Tomar algo en la memoria [...] Adquirir
Más detallesTécnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Más detalles1. Objetivos. 2. Idea Principal. Teoría de Autómatas y Lenguajes Formales
Teoría de Autómatas y Lenguajes Formales Boletín de Autoevaluación 2: Cómo se transforma un AFλ en un AFN? Y en un AFD?. 1. Objetivos. El objetivo de este boletín es ilustrar el método de transformación
Más detallesProcesos estocásticos Sesión 9. Cadenas de Markov a tiempo continuo
Procesos estocásticos Sesión 9. Cadenas de Markov a tiempo continuo Enrique Miranda Universidad of Oviedo Máster Universitario en Análisis de Datos para la Inteligencia de Negocios Contenidos 1. Cadenas
Más detallesIntroducción a la lingüística computacional
Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 22/08/2017 Cesar.Aguilar72@gmail.com Teoría de autómatas (1) La teoría de autómatas es una línea de investigación
Más detallesLógica proposicional. Ivan Olmos Pineda
Lógica proposicional Ivan Olmos Pineda Introducción Originalmente, la lógica trataba con argumentos en el lenguaje natural es el siguiente argumento válido? Todos los hombres son mortales Sócrates es hombre
Más detallesDesambigüación del sentido de las palabras (WSD)
Desambigüación del sentido de las palabras (WSD) Miguel A. Alonso Departamento de Computación, Facultad de Informática, Universidade da Coruña 1 / 18 Índice 1 Introducción 2 Evaluación 3 Enfoques basados
Más detallesIntroducción a la Lógica y la Computación
Introducción a la Lógica y la Computación Parte III: Lenguajes y Autómatas Clase del 7 de Noviembre de 2014 Parte III: Lenguajes y Autómatas Introducción a la Lógica y la Computación 1/20 Lenguajes Formales
Más detallesEsperanza condicionada Apuntes de clase Probabilidad II (grupos 31 y 40) Curso
Esperanza condicionada Apuntes de clase Probabilidad II (grupos 31 y 40) Curso 2010-11 Antonio Cuevas Departamento de Matemáticas Universidad Autónoma de Madrid Probabilidad y esperanza condicionada: recordatorio
Más detallesIntroducción a la Lógica y la Computación
Introducción a la Lógica y la Computación Parte III: Lenguajes y Autómatas Clase del 4 de Noviembre de 2015 Parte III: Lenguajes y Autómatas Introducción a la Lógica y la Computación 1/21 Lenguajes Formales
Más detallesNUCLEO TEMATICO: GENERALIDADES SOBRE MODELOS y MODELOS FINANCIEROS SEMANA: 1 TEMA INTRODUCCIÓN A LA TEORIA DE MODELOS 1
NUCLEO TEMATICO: GENERALIDADES SOBRE MODELOS y MODELOS FINANCIEROS SEMANA: 1 TEMA INTRODUCCIÓN A LA TEORIA DE MODELOS 1 DEFINICIÓN DE MODELO: Los sistemas administrativos se caracterizan por ser dinámicos,
Más detalles1. GRAFOS REGULARES Y ALEATORIOS
1. GRAFOS REGULARES Y ALEATORIOS Como ya se comentó en la introducción de esta memoria, un objetivo inicial del proyecto era realizar un estudio de las redes de metro del mundo, en el cual se comprobase
Más detallesRobots Autónomos. Depto. de Ciencia de la Computación e Inteligencia Artificial
Robots Autónomos Depto. de Ciencia de la Computación e Inteligencia Artificial Contenido Problema del mapeado Mapeado 2D Mapeado 3D Introducción al SLAM Mapeado topológico Construcción de mapas: Descripción
Más detallesObjetivos. Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos. Epígrafes
Objetivos Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos Epígrafes Introducción a los Gráficos p, np. Interpretación Gráficos c y u. Interpretación 2-1 Gráfico
Más detallesCapítulo 3 WINDELSOL 1.0 COMO HERRAMIENTA DE TRABAJO
Capítulo 3 WINDELSOL 1.0 COMO HERRAMIENTA DE TRABAJO Debido al gran número de variables interrelacionadas que intervienen en el proceso de optimización de un SRC, el uso de herramientas informáticas resulta
Más detallesIntroducción a la Probabilidad
Introducción a la Probabilidad Dr. Francisco Javier Tapia Moreno Marzo 29 de 2016. Importancia de la probabilidad. El concepto de probabilidad es manejado por mucha gente. Frecuentemente se escuchan preguntas
Más detallesSistema de Detección de Intrusos para ataques Cross-Site Scripting
Sistema de Detección de Intrusos para ataques Cross-Site Scripting García Ramírez Israel & Fonseca Casao Sergio Israel Directores: M. en C. Ramírez Morales Mario Augusto & M. en C. Saucedo Delgado Rafael
Más detallesCONCEPTOS. Capítulo 1: DEFINICIONES Y conceptos Estadística Computacional 1º Semestre 2003
Universidad Técnica Federico Santa María Departamento de Informática ILI-280 CONCEPTOS Capítulo 1: DEFINICIONES Y conceptos Estadística Computacional 1º Semestre 2003 Profesor :Héctor Allende Página :
Más detallesModelos ocultos de Markov para el reconocimiento automático del habla. Una breve introducción
Modelos ocultos de Markov para el reconocimiento automático del habla Una breve introducción Sugerencias y correcciones a: d.milone@ieee.org de marzo de 00 Modelos para el reconocimiento del habla Los
Más detallesCiencias de la Computación I
Ciencias de la Computación I Gramáticas Regulares Expresiones Regulares Gramáticas - Intuitivamente una gramática es un conjunto de reglas para formar correctamente las frases de un lenguaje - Por ejemplo,
Más detallesSimulación computacional de cadenas de Markov
Simulación computacional de cadenas de Markov Presentación basada en el capítulo 3 de Finite Markov Chains and Algorithmic Applications (Häggström, 2002) Sebastián Castro Seminario de Probabilidad y Estadística
Más detallesTítulo de la acción de capacitación: Ingeniería de Confiabilidad
Ingeniería de Confiabilidad Hoja 1 de 6 Título de la acción de capacitación: Ingeniería de Confiabilidad I.- Introducción: Uno de los retos más importantes para los profesionales de hoy consiste en desarrollar
Más detallesTema: Análisis Semántico
Compiladores. Guía 7 1 Facultad: Ingeniería Escuela: Computación Asignatura: Compiladores Tema: Análisis Semántico Contenido En esta guía se desarrollará una tabla de símbolos y se asociará al analizador
Más detallesCONTENIDOS. 1. Procesos Estocásticos y de Markov. 2. Cadenas de Markov en Tiempo Discreto (CMTD) 3. Comportamiento de Transición de las CMTD
CONTENIDOS 1. Procesos Estocásticos y de Markov 2. Cadenas de Markov en Tiempo Discreto (CMTD) 3. Comportamiento de Transición de las CMTD 4. Comportamiento Estacionario de las CMTD 1. Procesos Estocásticos
Más detallesIntroducción. Las gramáticas definen las reglas que definen a los lenguajes Las reglas pueden tener una diversa variedad de esquemas
Gramáticas Introducción Las gramáticas definen las reglas que definen a los lenguajes Las reglas pueden tener una diversa variedad de esquemas En algunos lenguajes, una sucesión de símbolos depende del
Más detallesAlineación de textos y traducción automática
Alineación de textos y traducción automática ITALICA Universidad de Sevilla José A. Troyano Índice Introducción Alineamiento sin usar información léxica Alineamiento usando información léxica Traducción
Más detallesProcesos estocásticos Cadenas de Márkov
Procesos estocásticos Cadenas de Márkov Curso: Investigación de Operaciones Ing. Javier Villatoro PROCESOS ESTOCASTICOS Procesos estocásticos Es un proceso o sucesión de eventos que se desarrolla en el
Más detallesUNIVERSIDAD TECNOLOGICA DE PEREIRA FACULTAD DE INGENIERIAS
Asignatura Código Gramática y Lenguajes Formales IS405 Créditos 4 Intensidad semanal Requisitos 6 Horas IS323 Justificación Objetivo general Dar al estudiante toda una gran base teórica sobre Ciencias
Más detallesIntroducción a la lingüística computacional
Introducción a la lingüística computacional César Antonio Aguilar Facultad de Lenguas y Letras 17/08/2017 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior nos dedicamos a
Más detallesProyecto Intermedio Algoritmo de Earley
Fundamentos de Computación Proyecto Intermedio: Algoritmo de Earley Profesor: Dr. José Torres Jiménez Alumnos: Edna Gutiérrez Gasca Aureny Magaly Uc Miam Jorge Rodríguez Núñez Proyecto Intermedio Algoritmo
Más detallesEspecialidades en GII-TI
Especialidades en GII-TI José Luis Ruiz Reina (coordinador) Escuela Técnica Superior de Ingeniería Informática Mayo 2014 Qué especialidades tiene la Ingeniería Informática? Según las asociaciones científicas
Más detalles4.1 CONGRUENCIA ENTRE LOS OBJETIVOS DEL PLAN DE ESTUDIOS Y EL PERFIL DE EGRESO CON LAS LGAC:
4.1 CONGRUENCIA ENTRE LOS OBJETIVOS DEL PLAN DE ESTUDIOS Y EL PERFIL DE EGRESO CON LAS LGAC: A continuación se muestran los objetivos así como los mapas funcionales según la línea de acentuación y la línea
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesCapítulo 1. Teoría de la probabilidad Teoría de conjuntos
Capítulo 1 Teoría de la probabilidad 1.1. Teoría de conjuntos Definición 1.1.1 El conjunto S de todos los posibles resultados de un experimento aleatorio es llamado el espacio muestral. Un espacio muestral
Más detallesWhite paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por:
White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por: Introducción Si pregunta a dos directores de recursos
Más detallesClasificador Jerárquico de Imágenes utilizando Naive Bayes
Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}
Más detallesRedes de Petri Estocásticas (II)
Redes de Petri Estocásticas (II) Carlos Aguirre Universidad Autonoma de Madrid, Dpto Ingenieria Informatica Redes Estocásticas Formalmente una red de Petri estocástica es por tanto una 7 upla SPN=(P,T,I(),O(),H(),W(),Mo)
Más detalles07 Estimación puntual e introducción a la estadística inferencial
07 Estimación puntual e introducción a la estadística inferencial Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Manizales 1 Contenido Qué es la estadística inferencial?
Más detallesIntensificación en "Lenguajes e Inteligencia Artificial"
Ingeniería Informática - ETS Informática Métodos y Técnicas Informáticas específicas. Comportamientos humanos que se quieren simular/emular: IA: Vertiente "cognitiva" : Razonamiento, Intelecto,. RF: Vertiente
Más detallesPattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Más detallesCurso de traducción automática de lenguas naturales
Curso de traducción automática de lenguas naturales César Antonio Aguilar Facultad de Lenguas y Letras 13/11/2015 Cesar.Aguilar72@gmail.com Síntesis de la clase pasada (1) En la clase anterior, tratamos
Más detallesDesambiguación Léxica de Sustantivos usando la Web
Desambiguación Léxica de Sustantivos usando la Web Aarón Pancardo-Rodríguez, Manuel Montes-y-Gómez,2, Paolo Rosso 2, Davide Bucaldi 3, Luis Villaseñor-Pineda Laboratorio de Tecnologías del Lenguaje Instituto
Más detallesDiseño de Experimentos
Diseño de Experimentos p. Diseño de Experimentos Isabel Casas Despacho: 10.0.04 mcasas@est-econ.uc3m.es Hector Cañada jcanada@est-econ.uc3m.es Introducción Los modelos que vamos a estudiar son usados para
Más detallesINSTITUTO NACIONAL SUPERIOR DEL PROFESORADO TÉCNICO - TÉCNICO SUPERIOR EN INFORMÁTICA APLICADA - PROGRAMACIÓN I
RESOLUCIÓN DE PROBLEMAS Y ALGORITMOS La principal razón para que las personas aprendan lenguajes de programación es utilizar una computadora como una herramienta para la resolución de problemas. Cinco
Más detallesTeoría de grafos y optimización en redes
Teoría de grafos y optimización en redes José María Ferrer Caja Universidad Pontificia Comillas Definiciones básicas Grafo: Conjunto de nodos (o vértices) unidos por aristas G = (V,E) Ejemplo V = {,,,,
Más detalles1 CÁLCULO DE PROBABILIDADES
1 CÁLCULO DE PROBABILIDADES 1.1 EXPERIENCIAS ALEATORIAS. SUCESOS 1.1.1 Definiciones Experiencia aleatoria: experiencia o experimento cuyo resultado depende del azar. Suceso aleatorio: acontecimiento que
Más detalles3.2. Análisis sintáctico
3.2. Análisis sintáctico 3.2. Análisis sintáctico. Introducción 1. Introducción 2. Gramáticas. Generalidades 3. Tipos de analizadores 4. Gramáticas con categorías complejas 5. Dos analizadores sintácticos
Más detalles