EXTRACCIÓN DE INFORMACIÓN EN DOMINIOS COMPLEJOS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "EXTRACCIÓN DE INFORMACIÓN EN DOMINIOS COMPLEJOS"

Transcripción

1 EXTRACCIÓN DE INFORMACIÓN EN DOMINIOS COMPLEJOS Ángel Alonso Álvarez Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, José Ramón Villar Flecha Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Carmen Benavides Cuellar Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Isaías García Rodríguez Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Francisco Jesús Rodríguez Sedano Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Resumen En cualquier dominio sobre el que se trabaje es habitual encontrar colecciones de datos que son utilizados para extraer de ellos información. En este trabajo se presenta una técnica utilizada para extraer información conceptualizada de un determinado dominio y su aplicación a un problema particular: el desarrollo de un clasificador de documentos de textos. Palabras Clave: Extracción de Información, Clasificación de Textos, Clasificación, Toma de Decisión, Algoritmo de los k Vecinos más Cercanos. 1 INTRODUCCIÓN La extracción de información de un texto es una técnica muy relacionada con el procesamiento de lenguaje natural ([1], [18], [19], [22]). A diferencia de ésta, la extracción de información trata de descubrir conceptos en la información y así rellenar adecuadamente los tipos de datos que los representan. Un ejemplo sería rellenar objetos encuentro con el tipo de acto (jornadas, congreso, charla, coloquio, etc.), título, participantes, tema principal, ideas planteadas, etc. Cada concepto se representa entonces en una unidad de información, dicha unidad de información dispondrá de una serie de palabras que la disparan o hacen relevante. En ([28], [29]) se presenta un método para construir un diccionario para la extracción de información de manera automática basándose en unos marcos definitorios de conceptos y un algoritmo de inducción que se detalla en él. Una diferencia de la extracción de información con el procesamiento de lenguaje natural es que la primera solo analiza textos del dominio, descartando para el procesamiento posterior toda parte de un documento que no pertenezca a dicho dominio. Esto permite simplificar el procesamiento posterior al deshacer por sí mismo la posible ambigüedad de las palabras que aparezcan en las porciones de texto del documento a analizar. A continuación se describe un problema que se ha resuelto con el uso de la técnica de extracción de información. Seguidamente se describen tanto el problema, las técnicas a usar, el desarrollo implementado como solución al problema y, finalmente, conclusiones y trabajos futuros. 2 PROBLEMA En el año 2000, la Junta de Castilla y León concedió el Proyecto de Investigación Aplicada titulado Desarrollo de un Sistema Basado en el Conocimiento: Aplicación a la Hullera Vasco- Leonesa, en adelante denominado el proyecto, con clave orgánica LE038/UA y un plazo de realización desde Enero de 2000 a Diciembre de Este proyecto está siendo realizado por el departamento de Ingeniería Eléctrica y Electrónica de la Universidad de León, como Investigación Aplicada a la Fundación Sociedad Hullera Vasco- Leonesa, S.A. (en adelante, la empresa ). El proyecto de investigación aplicada tenía como objetivo facilitar las labores realizadas por la empresa en el ámbito de la gestión de la documentación. Entre las labores a realizar por dicho departamento cabe destacar la clasificación de toda referencia bibliográfica considerada importante.

2 En el modelado del dominio se utilizó Ingeniería del Conocimiento, más concretamente, la metodología Ideal ([4], [12]) para extraer el conocimiento de la empresa a incorporar a la aplicación, además de las tendencias actuales de la Inteligencia Artificial y la Ingeniería del Conocimiento ([3], [15], [24], [30]) con el fin de implementar una aplicación de última generación. En la figura 1 se describe gráficamente el modelo de la aplicación desarrollada. automáticamente y selección de las apropiadas de forma manual, que la selección de los descriptores se realizase de la manera más similar posible a la utilizada por los expertos, que no necesitase un entrenamiento exhaustivo. La solución que se planteó al problema se basó en el uso de las siguientes herramientas: Referencias Bibliográficas Scanner Distribución selectiva de información DBMS Sistema Documental Generación automática de documentos uso de un tesauro con términos específicos y de significado no ambiguo, en concreto, se utilizó el Tesauro de Medio Ambiente del MOPT [27], como conjunto de categorías, generación automática del contenido semántico para cada descriptor, extracción de información de las referencias bibliográficas a clasificar para deducir sus contenidos. Figura 1 : Esquema de la aplicación Como ya se ha comentado, la clasificación de las referencias bibliográficas es una de las tareas desarrolladas por la empresa. Un requisito impuesto por la empresa para dicha tarea era el funcionamiento semiautomático. En otras palabras, el sistema propone al usuario clasificador una serie de categorías, con una credibilidad calculada. El usuario seleccionará las que considere oportunas. Además, se constató que los expertos de la empresa solicitaban una clasificación en términos libres, mientras que los usuarios del sistema documental deseaban una estandarización de los términos y una unificación de los mismos. Otro requerimiento básico del sistema clasificador era la ausencia de entrenamiento complejo, lo cuál complicaba aún mas la elección del clasificador a utilizar. Finalmente, se determinó la forma que tenían los expertos para clasificar. Básicamente, los expertos clasificadores analizaban el texto, recogían mentalmente una serie de términos significativos, y basándose en estos términos y en experiencias pasadas determinaban con qué etiquetas catalogaban cada referencia bibliográfica. Esta forma de trabajar es muy semejante a la marcada en los tesauros como normas para realizar la catalogación. Resumiendo, el conjunto de prerrequisitos exigidos al clasificador fueron: clasificación semiautomática, con propuestas de categorías generadas Para los dos últimos puntos se utilizaron técnicas de Inteligencia Artificial (I.A.) cuya eficiencia ha sido probada para el idioma inglés. Sin embargo, su uso aplicado al castellano no está documentado hasta ahora. En el siguiente apartado se describirán brevemente las técnicas utilizadas. 3 TÉCNICAS DE I.A. UTILIZADAS Las técnicas utilizadas para resolver el problema planteado se pueden definir como de extracción de información, y son utilizadas en dominios de procesamiento de lenguaje natural y de clasificación de textos. En concreto, las propuestas realizadas en los trabajos de Riloff ([16], [17], [18], [23]) son las utilizadas. En dichos trabajos se genera un léxico semántico partiendo de una colección de categorías de clasificación. El léxico semántico (o corpus semántico) es una lista de palabras con una certidumbre asociada que describen el significado semántico de cada categoría. Una vez definido un léxico para cada categoría, es posible proponer diferentes categorías como clasificación de un documento de texto analizando las palabras que aparecen en él. La extracción de información de un texto es una técnica muy relacionada con el procesamiento de lenguaje natural ([1], [18], [19], [22]). Una diferencia de la extracción de información con el procesamiento de lenguaje natural es que la primera solo se analizan textos del dominio, descartando para el procesamiento posterior todo documento que no pertenezca a dicho dominio. Esto permite simplificar el procesamiento posterior al deshacer por sí mismo

3 la posible ambigüedad de las palabras que aparezcan en las porciones de texto del documento a analizar. Cuando se utiliza la extracción de información en la clasificación de documentos de texto, el proceso debe extraer primero todas las unidades de información importantes sobre el dominio que un documento contiene. Estas unidades de información se almacenarán de la manera adecuada con referencia al documento del que fueron extraídas. Posteriormente, una consulta se convertirá a una unidad de información y se comparará ésta con las almacenadas en el sistema que se consideren relevantes debido a que el documento contiene palabras consideradas disparadoras para las unidades de información almacenadas. En [21] se muestran como la extracción de información de forma automática permite la construcción de los corpus. Para ello utiliza una técnica denominada disparadora multicapas que analiza el efecto de cada una de las aportaciones antes de introducirla en el corpus de palabras. Esta observación evita el rápido deterioro que sufren los algoritmos de generación de corpus. En [9] se presentan algunas ideas para el desarrollo de sistemas para la extracción de información basados en reglas. La extracción de información ha sido utilizado para clasificación en [22] usando las firmas de relevancia, donde una firma es el par (palabra disparadora- unidad de información). Una firma relevante es aquella para la cuál su referencia discrimina fuertemente entre relevante o no en un determinado dominio. En [20] se presenta un estudio de la aplicación de los algoritmos de extracción de información en la interpretación automática de textos. En [8] se estudia el uso de clasificadores de textos para facilitar la extracción de información contenida en conjuntos de datos. 4 DESCRIPCIÓN DEL TRABAJO REALIZADO En el diseño y posterior desarrollo del sistema de clasificación se debían definir cada uno de los siguientes puntos: cómo representar las referencias bibliográficas a clasificar, cómo dotar de semántica a los descriptores, definición del criterio de selección de los descriptores a proponer. Como se dijo anteriormente, la colección de categorías está representada como un tesauro. El tesauro está formado por términos con significado único, bien descriptores o no descriptores. Sólo los primeros se utilizan para clasificar. La representación de las referencias, para mantener las hipótesis marcadas en ([23], [18], [17]), se realiza mediante sus ficheros invertidos. Para dotar de semántica a los descriptores se utilizaron las técnicas de extracción de información para la generación de un corpus semántico indicada en ([17], [18], [21], y [23]). De esta forma, cada descriptor se caracterizará por un conjunto inicial de pares <palabra-certidumbre> que describen su semántica. A partir de un texto del dominio, y utilizando extracción de información, se entrenará el sistema para que aumente el conjunto de pares con los sustantivos encontrados en el texto de entrenamiento. Finalmente, indicar que el modelo de clasificador utilizado emplea un razonamiento basado en medidas de certeza o certidumbre [2], para lo que utiliza unas fórmulas de disyunción producto y conjunción máximo, siendo el motor de inferencia el algoritmo de los k vecinos más cercanos [6] para seleccionar los descriptores a proponer. Este sistema se caracteriza por emular la forma de razonar y la de los expertos de clasificación. Un punto importante es la reducción en las tareas de entrenamiento, siendo éste necesario únicamente para caracterizar el corpus de los descriptores del tesauro. Los textos a seleccionar para la generación automática de corpus deben pertenecer al dominio semántico del descriptor, siendo esta selección una tarea laboriosa pero sencilla de realizar por un ser humano. 4.1 SEMÁNTICA DE LOS DESCRIPTORES Se ha comentado previamente que se utilizará un glosario de términos jerarquizados con significado único (descriptores). A este conjunto de descriptores se le denomina tesauro. Cada descriptor está caracterizado por un corpus o corpus semántico (conjunto de palabras que le dotan de significado). Cada palabra perteneciente al corpus de un descriptor tiene una certidumbre asociada, calculada según un determinado algoritmo. Para la generación automática del corpus se generaron las siguientes herramientas: analizador morfológico, generador de corpus.

4 Para el analizador morfológico se siguió el principio teórico de Porter definido en [13]. Sin embargo, el algoritmo que en dicho trabajo se muestra está muy enfocado al idioma inglés. En el caso del idioma castellano, este algoritmo es de poco éxito. Por lo tanto se realizó un estudio de la Lengua Española o Castellano, y para ello se analizaron los textos ([7], [14], [10], [11]). Con todo este material se elaboró un agente utilizando el motor de inferencia de la shell de sistemas expertos Jess [5], el cuál implementa como motor de búsqueda el algoritmo RETE. Los resultados de este analizador morfológico están fuera del ámbito de este trabajo por lo que no se muestran. A efectos del presente trabajo indicar que este analizador morfológico genera para cada palabra la raíz que considera de mayor credibilidad. Para el generador de corpus se siguieron las pautas marcadas por Riloff en su trabajo ([18], [17] y [23]). En estos trabajos se realiza la generación automática de corpus para descriptores conceptuales partiendo de las siguientes premisas: cada concepto está representado por un término lingüístico, pudiendo cada término estar compuesto por más de una palabra, cada término dispone de un conjunto de palabras que le dotan de un corpus inicial, cada palabra del corpus de cada descriptor tiene asociada una certidumbre sobre el grado con que dicha palabra afecta o referencia al descriptor. valor p se calcula a partir de la frecuencia de aparición de la raíz en cada una de las frases en las que aparecen raíces asociadas a palabras del corpus de un determinado descriptor multiplicada por la certidumbre de dichas raíces y dividida por la frecuencia con que dicha raíz aparece en el texto. Cabe destacar que, aunque se utilizan raíces para descubrir nuevos candidatos para formar parte del corpus, cada raíz tiene asociada un conjunto de palabras para la cuál cumple dicha condición (ser raíz). Dichas palabras asociadas son las que finalmente se añaden al corpus del descriptor, quedando éste compuesto por el conjunto de palabras cuyas raíces fueron descubiertas en un texto generador mediante el algoritmo de Riloff ya comentado, conjuntamente con las modificaciones que se le han realizado. Una vez implementadas las herramientas con los algoritmos descritos, para generar el corpus de cada uno de los descriptores se debe disponer de un archivo de texto con un formato preestablecido donde se disponga el tesauro jerárquico, las relaciones de más específico que y relacionado con (propias de un tesauro), así como las palabras iniciales del corpus conjuntamente con sus credibilidades, generándose un flujo representado en la figura 2. Lista Descriptores con su corpus inicial Documento con el contenido del dominio Las modificaciones que se realizaron sobre dicho trabajo para su adaptación al castellano y al problema a resolver fueron: en lugar de trabajar con palabras se trabaja con los lexemas de las palabras a través del analizador morfológico construido y ya comentado, en sus trabajos Riloff descarta las palabras que aparezcan menos de un 5% en el texto. Para el español esto es demasiado restrictivo, así es como se decidió, tras pruebas y error, trabajar con un 1% o menos. Este es un valor que se continuará ensayando, la formula para asignar las puntuaciones varía, ya que tiene en cuenta la credibilidad de la raíz que añade la raíz candidata. La nueva formula es (1): frec.deaparición enventanasi certidumbrei p = (1) frec. aparición texto donde p es la certidumbre a asignar a una nueva raíz que forma parte del corpus de un descriptor. Este Figura 2 : Flujo de datos en el generador automático de corpus 4.2 SELECCIÓN DE LOS DESCRIPTORES A PROPONER Una vez disponible el corpus para el tesauro, el clasificador clásico trabaja como sigue: extracción de las palabras con su frecuencia relativa de la referencia bibliográfica, análisis morfológico de las palabras para extraer su raíz,

5 para cada palabra de la lista de palabras de la referencia bibliográfica se busca si forma parte del corpus de descriptores del tesauro, proponiendo descriptores con una certidumbre igual a la de la palabra multiplicada por su frecuencia de aparición en el texto a clasificar. La certidumbre que se elige para un descriptor que aparece referenciado por diversas palabras es la máxima de las calculadas, aplica el algoritmo de los k vecinos más cercanos para la selección y propuesta de los descriptores. El valor k es configurable, inicialmente se han propuesto 5 descriptores. Nunca se proponen descriptores con certidumbre menor a un valor UMBRAL_DESCRIPTOR, cuyo valor es modificable y por defecto es 0.0. Los valores seleccionados por defecto pueden ser ajustados en las pruebas para armonizarlos con la cantidad de datos manejables por un experto. La propuesta realizada por el clasificador clásico contiene el descriptor y su certidumbre, pudiendo utilizarse directamente como clasificador automático o semiautomático. 5 ENSAYOS Y RESULTADOS Para comprobar el comportamiento del sistema se utilizó el microtesauro Biología, contenido en el tesauro del MOPT [27]. Para evaluar el sistema se plantearon diversas medidas típicas, las cuáles se pueden estudiar en ([25], [26]). En concreto, se optó por visualizar las medidas de precisión, notificación, y las medidas E y F de de Van Rijsbergen. Para el caso de éstas últimas, se utilizó un coeficiente β de valor 1 (igualdad de peso entre precisión y notificación). Para realizar estas medidas se tuvo en cuenta, como es lógico, que los clasificadores debían tener carácter de clasificadores automáticos. Los resultados se muestran en la tabla 1. Totales Agregados Totales Medios FP 266 FN 113 VP 89 VN 3166 Precisión 0,251 0,158 Notificación 0,441 0,567 E 0,68 0,752 F 0,32 0,248 Tabla 1: Resultados. 6 CONCLUSIONES La extracción de información representa un buen camino para instancias conceptos extraídos de los datos analizados. En su uso en la clasificación de documentos de texto se observa que el corpus inicial para el entrenamiento de descriptores es fundamental, y una mala selección de certidumbres iniciales conlleva un fallo en el entrenamiento. De hecho, el clasificador implementado podría optimizarse sin modificar el algoritmo si los datos de entrenamiento inicial se mejoraran. Como trabajos futuros cabe destacar el estudio de mejoras en el analizador morfológico, y el uso de estas técnicas en la caracterización conceptual en el dominio de la automática. Referencias [1] Cardie, C., (1997) Empirical methods in information extraction, American Association for Artificial Intelligence, pp [2] Cuena, J., (1995) Notas sobre modelos de razonamiento, Facultad de Informática, Universidad Politécnica de Madrid. [3] Dershowitz, N., (2000) Artificial Intelligence: retrospective/prospective, Annals of Mathematics and Artificial Intelligence, 1 a 4, 3-5. [4] Gómez, A., Juristo, N., Montes, C., Pazos, J., (1997) Ingeniería del Conocimiento, Editorial Centro de Estudios Ramón Areces, S.A., Colección de Informática, ISBN [5] Jess Site, Shell para Sitemas Expertos Jess, [en línea] <http://herzberg.ca.sandia.gov/jess/> [Consulta 1 julio 2002]. [6] Keller, J. M., Gray, M. R., Givens, J. A. jr., (1985) A Fuzzy K-Nearest Neighbor Algorithm, IEEE Transactions on Systems, Man and Cybernetics, SMC-15, 4, pp [7] Lang, M. F., (1992) Formación de palabras en español (Spanish Word Formation), Ediciones Cátedra S.A., Madrid. [8] Lewis, D. D., (1991) Data extraction as text categorization: An experiment with the MUC-3 corpus, Proceedings of the Third Message Understanding Evaluation and Conference. [9] McSherry, D., (2000) Automating case selection in the construction of a case library, Knowledge-Based Systems, 13, pp

6 [10] Miranda Podadera, L., (1988) Gramática española, Editorial Hernando, Madrid. [11] Mínguez Fontan, N., (1987) Gramática del español II, Editorial Santillana, Madrid. [12] Palma, J. T., Paniagua, E., Martín, F., Martín, R., (2000) Ingeniería del Conocimiento. De la Extracción al Modelado del Conocimiento, Revista Iberoamericana de Inteligencia Artificial, 11, pp [13] Porter, M. F., (1980) An algorithm for suffix stripping, Program, 14, 3, pp [14] Puebla Ortega, J., (1995) Cómo conjugar todos los verbos del español, Editorial Playor, Madrid. [15] Rasmus, D. W., (2000) Knowledge management trends: the role of knowledge un e- business, PC AI, 14, 4, pp [16] Riloff, E., (1991) Little Words Can Make a Big Difference for Text Classification, Proceedings of the 18th Annual International ACM SIgIR Conference on Research and Development in Information Retrieval, pp [17] Riloff, E., (1983) Automatically Constructing a Dictionary for Information Extraction Task, Proceedings of the Eleventh National Conference on Artificial Intelligence, AAI Press MIT Press, pp [18] Riloff, E., (1996) Using learned extraction patterns for text classification, Connectionist, Statistical, and Symbolic Approaches to Learning for Natural Language Processing In Wermter, S., Riloff, E., & Scheler, G. (eds.)., Springer-Verlag, pp [19] Riloff, E., (1996) An Empirical Study of Automated Dictionary Construction for Information Extraction in Three Domains, AI Journal, 85, 1, 2, pp [20] Riloff, E., (1999) Information Extraction as a Stepping Stone toward Story Understanding, MIT press, Montreal, Canada. [22] Riloff, E., Lehnert, W., (1994) Information Extraction as a Basis for a High-Precision Text Classification, ACM transactions on Information Systems, 12, 3, pp [23] Riloff, E., Shepherd, J., (1997) A Corpus- Based Approach for Building Semantic Lexicons, Proceedings of the Second Conference on Empirical Methods in Natural Language Processing. [24] Rivero, S., (2000) Gestión del conocimiento: una vía hacia la ventaja competitiva, DYNA. Ingeniería e Industria, LXXV, 3, pp [25] Sebastiani, F., (1999) Machine Learning in Automated Text Categorization, Technical Report IEI-B , Istituto di Elaborazione dell'informazione, Consiglio Nazionale delle Ricerche, Pisa, IT. [26] Sebastiani, F., (1999) A Tutorial on Automated Text Categorization, Proceedings of ASAI-99, 1st Argentinian Symposium on Artificial Intelligence, pp [27] Secretaría General de Medio Ambiente, (1990) Tesauro de Medioambiente del MOPU, Ministerio de Obras Públicas y Urbanismo, ISBN [28] Soderland, S., Fisher, D., Aseltine, J., Lehnert, W., (1996) Issues in inductive learning of domain-specific text extraction rules, Connectionist, Statistical, and Symbolic Approaches to Learning for Natural Language Processing, Lecture Notes in Artificial Intelligence, Springer, pp [29] Soderland, S., Fisher, D., Aseltine, J., Lehnert, W. G., (1995) Crystal: Inducing a conceptual dictionary, Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, pp [30] Suso, R., (2000) Conocimiento e innovación, DYNA. Ingeniería e Industria, LXXV, 3, pp [21] Riloff, E., Jones, R, (1999) Learning dictionaries for information extraction using multi-level boot-strapping, Proceedings of the Sixteenth National Conference on Artificial Intelligence, pp

CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS

CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS XXV Jornadas de Automática Ciudad Real, del 8 al 10 de septiembre de 2004 CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS Francisco Javier Panizo, José R. Villar, Ángel Alonso Área de Ingeniería de

Más detalles

Clasificación Automática de Textos de Desastres Naturales en México

Clasificación Automática de Textos de Desastres Naturales en México Clasificación Automática de Textos de Desastres Naturales en México Alberto Téllez-Valero, Manuel Montes-y-Gómez, Olac Fuentes-Chávez, Luis Villaseñor-Pineda Instituto Nacional de Astrofísica, Óptica y

Más detalles

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA Enrique Puertas epuertas@uem.es Francisco Carrero fcarrero@uem.es José María Gómez Hidalgo jmgomez@uem.es Manuel de Buenaga buenga@uem.es

Más detalles

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 26 de Marzo, 9 y 23 de Abril y 7 de mayo de 2010 grupo de PLN en FaMAF http://www.cs.famaf.unc.edu.ar/~pln/

Más detalles

Un Clasificador de Texto Por Aprendizaje

Un Clasificador de Texto Por Aprendizaje Un Clasificador de Texto Por Aprendizaje Peláez J.I. (a) La Red D. (b) Sánchez P. (a) (a) Dpto. Lenguajes y Ciencias de la Computación E.T.S.I. Informática. Campus de Teatinos. Universidad de Málaga Málaga

Más detalles

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012 Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar

Más detalles

Método Supervisado orientado a la clasificación automática de documentos. Caso Historias Clínicas

Método Supervisado orientado a la clasificación automática de documentos. Caso Historias Clínicas Método Supervisado orientado a la clasificación automática de documentos. Caso Historias Clínicas Roque E. López Condori 1 Dennis Barreda Morales 2 Javier Tejada Cárcamo 2 Luis Alfaro Casas 1 1 Universidad

Más detalles

David Jordi Vallet Weadon.

David Jordi Vallet Weadon. <david.vallet@uam.es> David Jordi Vallet Weadon 1 Introducción Durante las últimas décadas, la personalización ha sido aplicada en diferentes campos de la informática, tanto en la rama científica como

Más detalles

Hacia un sistema de marketing dirigido más eficaz y personalizado en redes sociales

Hacia un sistema de marketing dirigido más eficaz y personalizado en redes sociales Hacia un sistema de marketing dirigido más eficaz y personalizado en redes sociales Patxi Galán-García, Dr. Carlos Laorden Gómez, and Dr. Pablo García Bringas DeustoTech Computing - S 3 Lab, University

Más detalles

Tema 1 Introducción a los Sistemas Basados en el Conocimiento

Tema 1 Introducción a los Sistemas Basados en el Conocimiento Tema 1 Introducción a los Sistemas Basados en el Conocimiento Sistemas Basados en el Conocimiento Grado en Ingeniería Informática 1 Referencias Ingeniería del Conocimiento. A. Gómez, N. Juristo, C. Montes,

Más detalles

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos Anteproyecto de Tesis de Magíster en Ingeniería del Software Tesista: Lic. Matilde

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Recuperación Avanzada de la Información

Recuperación Avanzada de la Información Máster en Sistemas Inteligentes Recuperación Avanzada de la Información Máster en Sistemas Inteligentes 1 Carlos G. Figuerola 1 Ángel Zazo Rodríguez 1 1 Departamento de Informática y Automática Grupo de

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

Sistema de Recuperación de Información Motor de Búsqueda: Innuendo

Sistema de Recuperación de Información Motor de Búsqueda: Innuendo Sistema de Recuperación de Información Motor de Búsqueda: Innuendo Epifanio Tula, Luis Gerónimo Medeot, Matías Daniel Universidad Tecnológica Nacional, Facultad Regional Córdoba Abstract El presente trabajo

Más detalles

Sistema categorizador de ofertas de empleo informáticas

Sistema categorizador de ofertas de empleo informáticas Diego Expósito Gil diegoexpositogil@hotmail.com Manuel Fidalgo Sicilia Manuel_fidalgo@hotmail.com Diego Peces de Lucas pecesdelucas@hotmail.com Sistema categorizador de ofertas de empleo informáticas 1.

Más detalles

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS Autores: Introducción Diego R. López RedIRIS diego.lopez@rediris.es El trabajo necesario para mantener un servidor de información

Más detalles

Búsqueda sobre catálogos basada en ontologías

Búsqueda sobre catálogos basada en ontologías Búsqueda sobre catálogos basada en ontologías Alianis Pérez Sosa, Yuniel Eliades Proenza Arias Universidad de las Ciencias Informáticas. Carretera a San Antonio Km 2 ½, Reparto Torrens, La Lisa, Ciudad

Más detalles

Generación semiautomática de recursos de Opinion Mining para el gallego a partir del portugués y el español

Generación semiautomática de recursos de Opinion Mining para el gallego a partir del portugués y el español Generación semiautomática de recursos de Opinion Mining para el gallego a partir del portugués y el español Paulo Malvar Fernández 1 y José Ramom Pichel Campos 1 1 Departamento de Ingeniería Lingüística,

Más detalles

Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información

Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información

Más detalles

TweetAlert: Sistema de Análisis Semántico de la Voz de los Ciudadanos en Redes Sociales en la Ciudad del Futuro

TweetAlert: Sistema de Análisis Semántico de la Voz de los Ciudadanos en Redes Sociales en la Ciudad del Futuro TweetAlert: Sistema de Análisis Semántico de la Voz de los Ciudadanos en Redes Sociales en la Ciudad del Futuro Julio Villena-Román 1,2, Adrián Luna-Cobos 1,3, José Carlos González-Cristóbal 3,1 1 DAEDALUS

Más detalles

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013 Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS Máster en Lenguajes y Sistemas Informáticos:

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

Notas. Modelo conceptual para el diseño e implementación del sitio web de un museo regional * Resumen. 1. Introducción y formulación del problema

Notas. Modelo conceptual para el diseño e implementación del sitio web de un museo regional * Resumen. 1. Introducción y formulación del problema Notas Modelo conceptual para el diseño e implementación del sitio web de un museo regional * Resumen El presente artículo propone el modelo conceptual para la creación de un sitio Web de un museo regional

Más detalles

LÓGICA COMPUTACIONAL

LÓGICA COMPUTACIONAL LÓGICA COMPUTACIONAL LA MATERIA DE LÓGICA EN LAS INGENIERÍAS INFORMÁTICAS curso 2006-2007 1 Por qué aparece la materia de lógica en informática? 2 Descriptores de lógica en los planes de estudios de informática.

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

ESCUELA POLITÉCNICA SUPERIOR

ESCUELA POLITÉCNICA SUPERIOR UNIVERSIDAD DE CÓRDOBA ESCUELA POLITÉCNICA SUPERIOR INGENIERÍA TÉCNICA EN INFORMÁTICA DE GESTIÓN PETICIÓN DE TEMA PARA PROYECTO FIN DE CARRERA: TÍTULO Herramienta para la preparación de conjuntos de aprendizaje

Más detalles

Diseño e implementación de un sistema de gestión de la actividad docente

Diseño e implementación de un sistema de gestión de la actividad docente Diseño e implementación de un sistema de gestión de la actividad docente Ángela Diez Diez 1, Jorge J. Blanes Peiro 1, Francisco J. Rodríguez Sedano 1 1 Dpto. Ingeniería Eléctrica y de Sistemas y Automática.

Más detalles

Clasificación Bayesiana de textos y páginas web

Clasificación Bayesiana de textos y páginas web Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en

Más detalles

El Tesauro de Patrimonio Histórico de Andalucía

El Tesauro de Patrimonio Histórico de Andalucía El Tesauro de Patrimonio Histórico de Andalucía M.J. Escalona (1), A. León (1), A. Martín (2), M. Mejías (1), J. Torres (1) (1) Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla

Más detalles

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental El proceso documental El proceso o cadena documental es la razón fundamental de un centro

Más detalles

SET: SISTEMA DE EXTRACCIÓN DE TÉRMINOS EN EL DOMINIO DE LA INFORMÁTICA. yusneym@unah.edu.cu, lilibeth@unah.edu.cu

SET: SISTEMA DE EXTRACCIÓN DE TÉRMINOS EN EL DOMINIO DE LA INFORMÁTICA. yusneym@unah.edu.cu, lilibeth@unah.edu.cu SET: SISTEMA DE EXTRACCIÓN DE TÉRMINOS EN EL DOMINIO DE LA INFORMÁTICA. Yusney Marrero García 1, Lilibeth M. González Ruiz 1 1 Universidad Agraria de la Habana (CUBA) yusneym@unah.edu.cu, lilibeth@unah.edu.cu

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

TEMA II PROCESO DE DISEÑO

TEMA II PROCESO DE DISEÑO TEMA II PROCESO DE DISEÑO El diseño como proceso. Problemas. Definición. Sub-problemas. Solución del problema. Objetivos. Dificultades del diseño. Gestión de proyecto y Proceso de concepción del diseño.

Más detalles

FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS

FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS FOG: ARQUITECTURA FLEXIBLE PARA LA GENERACIÓN AUTOMÁTICA DE ONTOLOGÍAS Emilio F. Viñas 1, Jesús Serrano-Guerrero 2, José A. Olivas 2, Javier de la Mata 2, Andrés Soto 3, Departamento de Tecnologías y Sistemas

Más detalles

CONGRESOS 2012 INTERNACIONALES

CONGRESOS 2012 INTERNACIONALES CONGRESOS 2012 INTERNACIONALES Autores: V. A. Bollati, P. Atzeni, E. Marcos, J.M. Vara Título: Model Management Systems vs. Model Driven Engineering: A Case Study Congreso: Symposium on Applied Computing

Más detalles

DISEÑO DE UN CURSO INTERACTIVO Y ADAPTATIVO DE PROCESADORES DE LENGUAJES

DISEÑO DE UN CURSO INTERACTIVO Y ADAPTATIVO DE PROCESADORES DE LENGUAJES Alfonseca, M., Carro, R.M., Pulido, E. and Rodríguez, P. (2000): Diseño de un curso interactivo y adaptativo de procesadores de lenguajes. Proceedings of JENUI 2000: VI Jornadas sobre la Enseñanza Universitaria

Más detalles

Sistema de Consultas en Lenguaje Natural para Bases de Datos

Sistema de Consultas en Lenguaje Natural para Bases de Datos Sistema de Consultas en Lenguaje Natural para Bases de Datos José Manuel Soto Corzo, David Díaz Portillo, José Antonio Cruz Zamora Instituto Tecnológico de Apizaco Av. Instituto Tecnológico de Apizaco

Más detalles

Google: Una oportunidad para la evolución de las Bibliotecas

Google: Una oportunidad para la evolución de las Bibliotecas Google: Una oportunidad para la evolución de las Bibliotecas Elizabeth Cañón Acosta elizadavaes@gmail.com Universidad de la Salle Resumen El uso generalizado de Google como herramienta de búsqueda de información

Más detalles

XerKa, vigilancia a medida y flexible

XerKa, vigilancia a medida y flexible XerKa es una solución software que apoya los procesos de Vigilancia Tecnológica e Inteligencia Competitiva de la empresa. Busca, filtra, analiza y clasifica información procedente de la red Interna e Internet

Más detalles

Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS

Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS VIII Congreso de Ingeniería de Organización Leganés, 9 y 10 de septiembre de 2004 Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS Javier Puente 1, David de

Más detalles

Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal

Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal Reporte final Ricardo Omar Chávez García Instituto Nacional de Astrofísica Óptica y Electrónica, 72840

Más detalles

ENTORNO PARA LA PLANIFICACION DE LA PRODUCCION DE SISTEMAS DE FABRICACION FLEXIBLES

ENTORNO PARA LA PLANIFICACION DE LA PRODUCCION DE SISTEMAS DE FABRICACION FLEXIBLES ENTORNO PARA LA PLANIFICACION DE LA PRODUCCION DE SISTEMAS DE FABRICACION FLEXIBLES Mercedes E. Narciso Farias, Miquel Angel Piera i Eroles Unidad de Ingeniería de Sistemas y Automática. Universidad Autónoma

Más detalles

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas 1. DEFINICIONES, UBICACIÓN CONCEPTUAL E HISTORIA DE LA I.A. 2. COMPLEJIDAD COMPUTACIONAL, EXPLOSIÓN COMBINATORIA, DOMINIOS NO

Más detalles

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Mª. José Ramírez Quintana José Hernández Orallo Programa: Programación Declarativa e Ingeniería de la Programación Objetivos

Más detalles

SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT

SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT SISTEMA INFORMÁTICO PARA LA GESTIÓN DEL CONOCIMIENTO Y SU REPRESENTACIÓN. EL LENGUAJE +GBIT Javier Alfonso Cendón javier.alfonso@unileon.es Francisco Rodríguez Sedano francisco.sedano@unileon.es Carmen

Más detalles

Modelo de BASE DE DATOS EBSCO

Modelo de BASE DE DATOS EBSCO EL VOCABULARIO CONTROLADO EN LA RECUPERACIÓN DE NFORMACIÓN Modelo de BASE DE DATOS EBSCO Lic. Ana Luisa Pinillo León Servicios Bibliotecarios El vocabulario controlado es la clave fundamental para obtener

Más detalles

Proyecto de trabajo de iniciación a la investigación

Proyecto de trabajo de iniciación a la investigación Proyecto de trabajo de iniciación a la investigación Título: Aplicación de tecnologías de la Web Semántica en el dominio sanitario. Sistemas de Información Sanitarios Semánticos (SISS). Autor: Tutor: Propuesta

Más detalles

Contenido. Un acercamiento. 4. Qué es un mapa conceptual?... 4. Algunas recomendaciones para elaborar mapas conceptuales. 5

Contenido. Un acercamiento. 4. Qué es un mapa conceptual?... 4. Algunas recomendaciones para elaborar mapas conceptuales. 5 Carlos Araya Rivera Unidad de Apoyo a la Docencia Mediada con Tecnologías de la Información y la Comunicación Vicerrectoría de Docencia Universidad de Costa Rica Primera Edición. 2013. Diseño de portada:

Más detalles

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 52(6):460-475, 2001 Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

Más detalles

1996-2001 Licenciatura en Ciencias de la Computación, Benémerita Universidad Autónoma de Puebla, Puebla, Pue., 8.57.

1996-2001 Licenciatura en Ciencias de la Computación, Benémerita Universidad Autónoma de Puebla, Puebla, Pue., 8.57. DATOS PERSONALES Nombre completo: Venustiano Soancatl Aguilar Correo electrónico: venus@bianni.unistmo.edu.mx FORMACIÓN ACADÉMICA 2001 2003 Maestria en Ciencias Computacionales, Instituto Nacional de Astrofísica

Más detalles

Curso de procesamiento del lenguaje natural

Curso de procesamiento del lenguaje natural MPGI UC MAGISTER EN PROCESAMIENTO Y GESTIÓN DE LA INFORMACIÓN Curso de procesamiento del lenguaje natural César Antonio Aguilar Facultad de Lenguas y Letras 05/08/2015 Cesar.Aguilar72@gmail.com PLN: qué

Más detalles

Integrando Información de Fuentes Relevantes para un Sistema Recomendador

Integrando Información de Fuentes Relevantes para un Sistema Recomendador Integrando Información de Fuentes Relevantes para un Sistema Recomendador Silvana Aciar, Josefina López Herrera and Javier Guzmán Obando Agents Research Laboratory University of Girona {saciar, jguzmano}@eia.udg.es,

Más detalles

PROYECTO DOCENTE ASIGNATURA: "Lógica Informática"

PROYECTO DOCENTE ASIGNATURA: Lógica Informática PROYECTO DOCENTE ASIGNATURA: "Lógica Informática" Grupo: Clases Teóricas de Lógica Informática (DOCENCIA EN INGLÉS)(948465) Titulacion: Grado en Ingeniería Informática-Ingeniería del Software Curso: 2015-2016

Más detalles

Recuperación de información visual utilizando descriptores conceptuales

Recuperación de información visual utilizando descriptores conceptuales Recuperación de información visual utilizando descriptores conceptuales J. Benavent, X. Benavent y E. de Ves Departament d Informàtica (Universitat de València) {esther.deves,xaro.benavent}@uv.es Abstract.

Más detalles

Tecnologías de la web semántica

Tecnologías de la web semántica Tecnologías de la web semántica MSC-0301 Nombre de la asignatura: Tecnologías de la Web Semántica Línea de trabajo: Tecnologías Web Tiempo de dedicación del estudiante a las actividades de: DOC TIS TPS

Más detalles

SECUENCIACIÓN DE SISTEMAS DE TIPO JOB SHOP MEDIANTE APRENDIZAJE AUTOMÁTICO

SECUENCIACIÓN DE SISTEMAS DE TIPO JOB SHOP MEDIANTE APRENDIZAJE AUTOMÁTICO SECUENCIACIÓN DE SISTEMAS DE TIPO JOB SHOP MEDIANTE APRENDIZAJE AUTOMÁTICO Paolo Priore Moreno Raúl Pino Diez Alberto Gómez Gómez UNIVERSIDAD DE OVIEDO Una forma habitual de secuenciar de modo dinámico

Más detalles

Antonio Juárez González

Antonio Juárez González e-mail: antjug@inaoep.mx Antonio Juárez González Información personal Estado civil: Soltero Fecha de nacimiento: 8 de marzo de 1982 Lugar de nacimiento: Tlaxcala, Tlaxcala Nacionalidad: Mexicano CURP:

Más detalles

Una Propuesta para Gestionar el Conocimiento Organizacional: Caso CENACE CFE

Una Propuesta para Gestionar el Conocimiento Organizacional: Caso CENACE CFE Una Propuesta para Gestionar el Conocimiento Organizacional: Caso CENACE CFE Mario Barcelo-Valenzuela 1, Juana Inés Munguía-Ramírez 1, Alonso Pérez-Soltero 1, José Palma-Méndez 2 1 Universidad de Sonora,

Más detalles

Diseño y uso de comunidades virtuales de acogida para estudiantes nuevos: El Plan de Acogida Virtual (PAV) de la UNED

Diseño y uso de comunidades virtuales de acogida para estudiantes nuevos: El Plan de Acogida Virtual (PAV) de la UNED Diseño y uso de comunidades virtuales de acogida para estudiantes nuevos: El Plan de Acogida Virtual (PAV) de la UNED Autores: Ángeles Sánchez-Elvira Paniagua. Directora del IUED. UNED Marcela Paz González

Más detalles

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web A Comparison of Approaches to Semi-supervised Multiclass SVM for Web Page Classification Arkaitz Zubiaga,

Más detalles

Bachillerato a Distancia Inglés IV Programa de estudio

Bachillerato a Distancia Inglés IV Programa de estudio Bachillerato a Distancia Inglés IV Programa de estudio Material elaborado por la UNAM para la Secretaría de Educación del Gobierno del Distrito Federal Bachillerato a Distancia Asignatura: Inglés IV Plan:

Más detalles

RESUMEN. con referencia 1FD 1997-1387, titulado LA GESTIÓN DE LA CADENA DE SUMINISTRO EN CONTEXTO DE INTEGRACIÓN EMPRESARIAL

RESUMEN. con referencia 1FD 1997-1387, titulado LA GESTIÓN DE LA CADENA DE SUMINISTRO EN CONTEXTO DE INTEGRACIÓN EMPRESARIAL II Conferencia de Ingeniería de Organización Vigo, 5-6 Septiembre 2002 Propuesta para la Generación Automática de un Modelo de Workflow, para la Implantación de un Proceso de Negocio Definido según la

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

JOSÉ OCTAVIO GUTIÉRREZ GARCÍA

JOSÉ OCTAVIO GUTIÉRREZ GARCÍA JOSÉ OCTAVIO GUTIÉRREZ GARCÍA Profesor de Tiempo Completo del Departamento Académico de Computación DOMICILIO Río Hondo No. 1 Progreso Tizapán México 01080, D.F. Tel: +52 (55) 5628-4000 Ext. 3645 Fax:

Más detalles

SAMUEL RÍSQUEZ AGUADO GOLDSMITHS, UNIVERSITY OF LONDON LAS PREPOSICIONES: CÓMO Y POR QUÉ ENSEÑARLAS DESDE UN NIVEL A1

SAMUEL RÍSQUEZ AGUADO GOLDSMITHS, UNIVERSITY OF LONDON LAS PREPOSICIONES: CÓMO Y POR QUÉ ENSEÑARLAS DESDE UN NIVEL A1 SAMUEL RÍSQUEZ AGUADO GOLDSMITHS, UNIVERSITY OF LONDON LAS PREPOSICIONES: CÓMO Y POR QUÉ ENSEÑARLAS DESDE UN NIVEL A1 INTRODUCCIÓN L as colocaciones en general no siempre han recibido la atención que se

Más detalles

Detección de Noticias del Ámbito Educativo Sobre Múltiples Canales Dinámicos de Información

Detección de Noticias del Ámbito Educativo Sobre Múltiples Canales Dinámicos de Información Detección de Noticias del Ámbito Educativo Sobre Múltiples Canales Dinámicos de Información Fernando R. A. Bordignon y Gabriel H. Tolosa Universidad Nacional de Luján Departamento de Ciencias Básicas Laboratorio

Más detalles

Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR

Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR El futuro de los buscadores: Nuevas tendencias en Recuperación de Información Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR FESABID 2007 José Ramón Pérez Agüera

Más detalles

1.- DATOS DE LA ASIGNATURA. Nombre de la asignatura: Inteligencia Artificial. Carrera: Ingeniería en Sistemas Computacionales. Clave de la asignatura:

1.- DATOS DE LA ASIGNATURA. Nombre de la asignatura: Inteligencia Artificial. Carrera: Ingeniería en Sistemas Computacionales. Clave de la asignatura: 1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Inteligencia Artificial Ingeniería en Sistemas Computacionales Clave de la asignatura: (Créditos) SATCA 1 SCC-1012 2-2-4 2.- PRESENTACIÓN Caracterización

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID

Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID Informe elaborado por el equipo de trabajo del SID (Servicio de Información sobre

Más detalles

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Sandra Casas y Cecilia Fuentes Zamorano UARG, Universidad Nacional de la Patagonia Austral Campus Universitario, Piloto Riversa s/n

Más detalles

Aplicaci n de los Mapas Autoorganizativos al campo de la Documentaci n

Aplicaci n de los Mapas Autoorganizativos al campo de la Documentaci n Aplicaci n de los Mapas Autoorganizativos al campo de la Documentaci n SRP Carlos Carrascosa Casamayor Vicente J. Julián Inglada Introducci n Objetivo: Cubrir necesidades de: Organizar, explorar y buscar

Más detalles

Recuperación de Información en Internet

Recuperación de Información en Internet Recuperación de Información en Internet Máster Universitario Língua e usos profesionais Miguel A. Alonso Carlos Gómez Jesús Vilares Departamento de Computación Facultad de Informática Universidade da Coruña

Más detalles

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/ laura SADIO 12, 13 y 14 de Marzo de 2008 grupo de PLN en FaMAF http://www.cs.famaf.unc.edu.ar/ pln/

Más detalles

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Rafael Rodríguez-Puente 1, Eliana B. Ril-Valentin 2 1 Departamento de Técnicas de

Más detalles

Revisión Sistemática Comparativa de Evolución de Métodos de Extracción de Conocimiento para la Web

Revisión Sistemática Comparativa de Evolución de Métodos de Extracción de Conocimiento para la Web Revisión Sistemática Comparativa de Evolución de Métodos de Extracción de Conocimiento para la Web Juan Manuel Rodríguez 1,2, Hernán D. Merlino 1,2, Ramón García-Martínez 2 1 Cátedra de Sistemas de Soporte

Más detalles

La anotación automática de rasgos temáticos en

La anotación automática de rasgos temáticos en La anotación automática de rasgos temáticos en inglés y español Julia Lavid & Lara Moratón Universidad Complutense de Madrid España 1 Introducción A pesar de que la tarea de automatizar la anotación de

Más detalles

Determinando Automáticamente los Dominios de Competencia de un Sistema de Clasificación Basado en Reglas Difusas: Un Caso de Estudio con FH-GBML

Determinando Automáticamente los Dominios de Competencia de un Sistema de Clasificación Basado en Reglas Difusas: Un Caso de Estudio con FH-GBML Determinando Automáticamente los Dominios de Competencia de un Sistema de Clasificación Basado en Reglas Difusas: Un Caso de Estudio con FH-GBML Julián Luengo 1 Francisco Herrera 1 1 Departamento Ciencias

Más detalles

ALGUNOS RESULTADOS EXPERIMENTALES DE LA INTEGRACIÓN DE AGRUPAMIENTO E INDUCCIÓN COMO MÉTODO DE DESCUBRIMIENTO DE CONOCIMIENTO

ALGUNOS RESULTADOS EXPERIMENTALES DE LA INTEGRACIÓN DE AGRUPAMIENTO E INDUCCIÓN COMO MÉTODO DE DESCUBRIMIENTO DE CONOCIMIENTO ALGUNOS RESULTADOS EXPERIMENTALES DE LA INTEGRACIÓN DE AGRUPAMIENTO E INDUCCIÓN COMO MÉTODO DE DESCUBRIMIENTO DE CONOCIMIENTO Kogan, A. 1, Rancan, C. 2,3, Britos, P. 3,1, Pesado, P. 2,4, García-Martínez,

Más detalles

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA Pablo F. Provasi 1 Lucio J. Kleisinger 1 Francisco R. Villatoro 2 1 Dpto. de Informática, Universidad

Más detalles

Generación semiautomática de una ontología para una red de ONG

Generación semiautomática de una ontología para una red de ONG Generación semiautomática de una ontología para una red de ONG Natalia Chiaro nchiaro@internet.com.uy Pablo Damonte pdamonte@montevideo.com.uy Diego Garat dgarat@fing.edu.uy Facultad de Ingeniería Universidad

Más detalles

TRATAMIENTO DE LA INCERTIDUMBRE EN SISTEMAS DE DIAGNÓSTICO PARA EMPRESAS

TRATAMIENTO DE LA INCERTIDUMBRE EN SISTEMAS DE DIAGNÓSTICO PARA EMPRESAS Albano, Sergio Marchese, Alicia G. Moratello, María C. Picco, Alicia M. Plüss, Jorge J. Scarabino, Juan Carlos Instituto de Investigaciones y Asistencia Tecnológica en Administración, Escuela de Administración.

Más detalles

Inteligencia Artificial II Propuesta de trabajo Detección de correo basura (anti-spam) mediante técnicas de Inteligencia Artificial

Inteligencia Artificial II Propuesta de trabajo Detección de correo basura (anti-spam) mediante técnicas de Inteligencia Artificial Inteligencia Artificial II Propuesta de trabajo Detección de correo basura (anti-spam) mediante técnicas de Inteligencia Artificial José F. Quesada 1 Introducción La idea de detección o filtrado de correo

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

Estableciendo una medida de Trust para seleccionar fuentes de información relevantes para recomendar

Estableciendo una medida de Trust para seleccionar fuentes de información relevantes para recomendar Estableciendo una medida de Trust para seleccionar fuentes de información relevantes para recomendar Silvana Vanesa Aciar Javier Guzmán Obando Josep Lluis de la Rosa Josefina López Herrera Dept. d Electrònica,

Más detalles

Proyecto Piloto sobre Viabilidad de Internet como Fuente de Datos. Resultados del Proyecto

Proyecto Piloto sobre Viabilidad de Internet como Fuente de Datos. Resultados del Proyecto Proyecto Piloto sobre Viabilidad de Internet como Fuente de Datos Resultados del Proyecto ÍNDICE 1. Detección automática de B2C 2. Análisis de demanda de profesionales TICC y programas formativos 3. Análisis

Más detalles

NOTAS METODOLÓGICAS PARA CUBRIR LA ETAPA DE DOCUMENTAR UNA INVESTIGACIÓN

NOTAS METODOLÓGICAS PARA CUBRIR LA ETAPA DE DOCUMENTAR UNA INVESTIGACIÓN NOTAS METODOLÓGICAS PARA CUBRIR LA ETAPA DE DOCUMENTAR UNA INVESTIGACIÓN Jose Daniel Texier R. Universidad Nacional Experimental del Táchira (UNET) Servicio de Difusión de la Creación Intelectual (SeDiCI)

Más detalles

Propuesta de un Modelo para Evaluar la Viabilidad de Proyectos de Implementación ERP en la Administración Pública Argentina

Propuesta de un Modelo para Evaluar la Viabilidad de Proyectos de Implementación ERP en la Administración Pública Argentina Propuesta de un Modelo para Evaluar la Viabilidad de Proyectos de Implementación ERP en la Administración Pública Argentina Eduardo Iberti 1, Pablo Pytel 1,2, Ma Florencia Pollo-Cattaneo 1,2 1 Programa

Más detalles

Análisis de opinión como un sistema multiagente distribuido

Análisis de opinión como un sistema multiagente distribuido Análisis de opinión como un sistema multiagente distribuido Pablo Kogan Sandra Roger email: {pkogan,sroger}@uncoma.edu.ar Grupo de Investigación en Lenguajes e Inteligencia Artificial Departmento de Teoría

Más detalles

Acceso a un Sistema de Inventarios usando Procesamiento de Lenguaje Natural y RIAs

Acceso a un Sistema de Inventarios usando Procesamiento de Lenguaje Natural y RIAs Acceso a un Sistema de Inventarios usando Procesamiento de Lenguaje Natural y RIAs J. Ferrer D., C. C. Ríos, M. G. Sandoval, R. Baltazar, J. M. Carpio, M. Ornelas Instituto Tecnológico de León (México)

Más detalles

PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA

PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA PON-C-22 PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA A. García Sánchez (1), M. Ortega Mier (2), E. Ponce Cueto (3) Dpto. de Ingeniería de Organización, Administración

Más detalles

Álvaro López Ortega Escuela Superior de Informática C/Tajo s/n 28670 Villaviciosa de Odón, España, alvaro@godsmaze.org

Álvaro López Ortega Escuela Superior de Informática C/Tajo s/n 28670 Villaviciosa de Odón, España, alvaro@godsmaze.org 6LVWHPDGHD\XGDDODWUDGXFFLyQGHOLGLRPDLQJOpVHQHOGRPLQLR GHODVDSOLFDFLRQHVGH*120( Mario Domínguez Pino Escuela Superior de Informática C/Tajo s/n 28670 Villaviciosa de Odón, España, marete@terra.es Álvaro

Más detalles

Según se afirma en [Santacruz,03], las tendencias de desarrollo de la Web semántica se centran en tres áreas aplicadas a la educación: la

Según se afirma en [Santacruz,03], las tendencias de desarrollo de la Web semántica se centran en tres áreas aplicadas a la educación: la Según se afirma en [Santacruz,03], las tendencias de desarrollo de la Web semántica se centran en tres áreas aplicadas a la educación: la informática, el diseño instructivo y los sistemas de bibliotecas.

Más detalles

Modelado de la variabilidad en arquitecturas multicapa

Modelado de la variabilidad en arquitecturas multicapa Modelado de la variabilidad en arquitecturas multicapa José García-Alonso, Joaquín Guillén, Javier Berrocal, and Juan Manuel Murillo Escuela Politécnica, Universidad de Extremadura, Avd. de la Universidad

Más detalles

ITEM: Un Motor de Búsqueda Multilingüe Basado en Indexación Semántica

ITEM: Un Motor de Búsqueda Multilingüe Basado en Indexación Semántica ITEM: Un Motor de Búsqueda Multilingüe Basado en Indexación Semántica Felisa Verdejo, Julio Gonzalo, David Fernández Anselmo Peñas, Fernando López Depto. de Lenguajes y Sistemas Informáticos UNED, Spain

Más detalles

Índice de la ayuda de PSICODOC

Índice de la ayuda de PSICODOC Índice de la ayuda de PSICODOC Configuración de Psicodoc Búsqueda simple Búsqueda avanzada Campos buscables Utilidades para la búsqueda avanzada Trucos de búsqueda Resultados Listado de resultados Refinar

Más detalles

Conjuntos y Sistemas Difusos (Lógica Difusa y Aplicaciones)

Conjuntos y Sistemas Difusos (Lógica Difusa y Aplicaciones) Departamento de enguajes y Ciencias de la Computación Universidad de Málaga Conjuntos y Sistemas Difusos (ógica Difusa y Aplicaciones) 5. Variables ingüísticas E.T.S.I. Informática J. Galindo Gómez VARIABES

Más detalles

Recuperación de Información Multilingüe para reutilización de componentes Software

Recuperación de Información Multilingüe para reutilización de componentes Software Recuperación de Información Multilingüe para reutilización de componentes Software Roberto Correa Salgado Universidad Europea de Madrid - CEES Villaviciosa de Odón (Madrid) Roberto_correa@eresmas.com Rodrigo

Más detalles

GUÍA DOCENTE DE INTRODUCCIÓN A LA PROGRAMACIÓN DE VIDEOJUEGOS Y GRÁFICOS

GUÍA DOCENTE DE INTRODUCCIÓN A LA PROGRAMACIÓN DE VIDEOJUEGOS Y GRÁFICOS GUÍA DOCENTE DE INTRODUCCIÓN A LA PROGRAMACIÓN DE VIDEOJUEGOS Y GRÁFICOS La presente guía docente corresponde a la asignatura de Introducción a la Programación de Videojuegos y Gráficos (Videojuegos) del

Más detalles