EXTRACCIÓN DE INFORMACIÓN EN DOMINIOS COMPLEJOS

Tamaño: px
Comenzar la demostración a partir de la página:

Download "EXTRACCIÓN DE INFORMACIÓN EN DOMINIOS COMPLEJOS"

Transcripción

1 EXTRACCIÓN DE INFORMACIÓN EN DOMINIOS COMPLEJOS Ángel Alonso Álvarez Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, José Ramón Villar Flecha Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Carmen Benavides Cuellar Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Isaías García Rodríguez Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Francisco Jesús Rodríguez Sedano Escuela de Ingenierías (Universidad de León), Campus de Vegazana s/n, León, Resumen En cualquier dominio sobre el que se trabaje es habitual encontrar colecciones de datos que son utilizados para extraer de ellos información. En este trabajo se presenta una técnica utilizada para extraer información conceptualizada de un determinado dominio y su aplicación a un problema particular: el desarrollo de un clasificador de documentos de textos. Palabras Clave: Extracción de Información, Clasificación de Textos, Clasificación, Toma de Decisión, Algoritmo de los k Vecinos más Cercanos. 1 INTRODUCCIÓN La extracción de información de un texto es una técnica muy relacionada con el procesamiento de lenguaje natural ([1], [18], [19], [22]). A diferencia de ésta, la extracción de información trata de descubrir conceptos en la información y así rellenar adecuadamente los tipos de datos que los representan. Un ejemplo sería rellenar objetos encuentro con el tipo de acto (jornadas, congreso, charla, coloquio, etc.), título, participantes, tema principal, ideas planteadas, etc. Cada concepto se representa entonces en una unidad de información, dicha unidad de información dispondrá de una serie de palabras que la disparan o hacen relevante. En ([28], [29]) se presenta un método para construir un diccionario para la extracción de información de manera automática basándose en unos marcos definitorios de conceptos y un algoritmo de inducción que se detalla en él. Una diferencia de la extracción de información con el procesamiento de lenguaje natural es que la primera solo analiza textos del dominio, descartando para el procesamiento posterior toda parte de un documento que no pertenezca a dicho dominio. Esto permite simplificar el procesamiento posterior al deshacer por sí mismo la posible ambigüedad de las palabras que aparezcan en las porciones de texto del documento a analizar. A continuación se describe un problema que se ha resuelto con el uso de la técnica de extracción de información. Seguidamente se describen tanto el problema, las técnicas a usar, el desarrollo implementado como solución al problema y, finalmente, conclusiones y trabajos futuros. 2 PROBLEMA En el año 2000, la Junta de Castilla y León concedió el Proyecto de Investigación Aplicada titulado Desarrollo de un Sistema Basado en el Conocimiento: Aplicación a la Hullera Vasco- Leonesa, en adelante denominado el proyecto, con clave orgánica LE038/UA y un plazo de realización desde Enero de 2000 a Diciembre de Este proyecto está siendo realizado por el departamento de Ingeniería Eléctrica y Electrónica de la Universidad de León, como Investigación Aplicada a la Fundación Sociedad Hullera Vasco- Leonesa, S.A. (en adelante, la empresa ). El proyecto de investigación aplicada tenía como objetivo facilitar las labores realizadas por la empresa en el ámbito de la gestión de la documentación. Entre las labores a realizar por dicho departamento cabe destacar la clasificación de toda referencia bibliográfica considerada importante.

2 En el modelado del dominio se utilizó Ingeniería del Conocimiento, más concretamente, la metodología Ideal ([4], [12]) para extraer el conocimiento de la empresa a incorporar a la aplicación, además de las tendencias actuales de la Inteligencia Artificial y la Ingeniería del Conocimiento ([3], [15], [24], [30]) con el fin de implementar una aplicación de última generación. En la figura 1 se describe gráficamente el modelo de la aplicación desarrollada. automáticamente y selección de las apropiadas de forma manual, que la selección de los descriptores se realizase de la manera más similar posible a la utilizada por los expertos, que no necesitase un entrenamiento exhaustivo. La solución que se planteó al problema se basó en el uso de las siguientes herramientas: Referencias Bibliográficas Scanner Distribución selectiva de información DBMS Sistema Documental Generación automática de documentos uso de un tesauro con términos específicos y de significado no ambiguo, en concreto, se utilizó el Tesauro de Medio Ambiente del MOPT [27], como conjunto de categorías, generación automática del contenido semántico para cada descriptor, extracción de información de las referencias bibliográficas a clasificar para deducir sus contenidos. Figura 1 : Esquema de la aplicación Como ya se ha comentado, la clasificación de las referencias bibliográficas es una de las tareas desarrolladas por la empresa. Un requisito impuesto por la empresa para dicha tarea era el funcionamiento semiautomático. En otras palabras, el sistema propone al usuario clasificador una serie de categorías, con una credibilidad calculada. El usuario seleccionará las que considere oportunas. Además, se constató que los expertos de la empresa solicitaban una clasificación en términos libres, mientras que los usuarios del sistema documental deseaban una estandarización de los términos y una unificación de los mismos. Otro requerimiento básico del sistema clasificador era la ausencia de entrenamiento complejo, lo cuál complicaba aún mas la elección del clasificador a utilizar. Finalmente, se determinó la forma que tenían los expertos para clasificar. Básicamente, los expertos clasificadores analizaban el texto, recogían mentalmente una serie de términos significativos, y basándose en estos términos y en experiencias pasadas determinaban con qué etiquetas catalogaban cada referencia bibliográfica. Esta forma de trabajar es muy semejante a la marcada en los tesauros como normas para realizar la catalogación. Resumiendo, el conjunto de prerrequisitos exigidos al clasificador fueron: clasificación semiautomática, con propuestas de categorías generadas Para los dos últimos puntos se utilizaron técnicas de Inteligencia Artificial (I.A.) cuya eficiencia ha sido probada para el idioma inglés. Sin embargo, su uso aplicado al castellano no está documentado hasta ahora. En el siguiente apartado se describirán brevemente las técnicas utilizadas. 3 TÉCNICAS DE I.A. UTILIZADAS Las técnicas utilizadas para resolver el problema planteado se pueden definir como de extracción de información, y son utilizadas en dominios de procesamiento de lenguaje natural y de clasificación de textos. En concreto, las propuestas realizadas en los trabajos de Riloff ([16], [17], [18], [23]) son las utilizadas. En dichos trabajos se genera un léxico semántico partiendo de una colección de categorías de clasificación. El léxico semántico (o corpus semántico) es una lista de palabras con una certidumbre asociada que describen el significado semántico de cada categoría. Una vez definido un léxico para cada categoría, es posible proponer diferentes categorías como clasificación de un documento de texto analizando las palabras que aparecen en él. La extracción de información de un texto es una técnica muy relacionada con el procesamiento de lenguaje natural ([1], [18], [19], [22]). Una diferencia de la extracción de información con el procesamiento de lenguaje natural es que la primera solo se analizan textos del dominio, descartando para el procesamiento posterior todo documento que no pertenezca a dicho dominio. Esto permite simplificar el procesamiento posterior al deshacer por sí mismo

3 la posible ambigüedad de las palabras que aparezcan en las porciones de texto del documento a analizar. Cuando se utiliza la extracción de información en la clasificación de documentos de texto, el proceso debe extraer primero todas las unidades de información importantes sobre el dominio que un documento contiene. Estas unidades de información se almacenarán de la manera adecuada con referencia al documento del que fueron extraídas. Posteriormente, una consulta se convertirá a una unidad de información y se comparará ésta con las almacenadas en el sistema que se consideren relevantes debido a que el documento contiene palabras consideradas disparadoras para las unidades de información almacenadas. En [21] se muestran como la extracción de información de forma automática permite la construcción de los corpus. Para ello utiliza una técnica denominada disparadora multicapas que analiza el efecto de cada una de las aportaciones antes de introducirla en el corpus de palabras. Esta observación evita el rápido deterioro que sufren los algoritmos de generación de corpus. En [9] se presentan algunas ideas para el desarrollo de sistemas para la extracción de información basados en reglas. La extracción de información ha sido utilizado para clasificación en [22] usando las firmas de relevancia, donde una firma es el par (palabra disparadora- unidad de información). Una firma relevante es aquella para la cuál su referencia discrimina fuertemente entre relevante o no en un determinado dominio. En [20] se presenta un estudio de la aplicación de los algoritmos de extracción de información en la interpretación automática de textos. En [8] se estudia el uso de clasificadores de textos para facilitar la extracción de información contenida en conjuntos de datos. 4 DESCRIPCIÓN DEL TRABAJO REALIZADO En el diseño y posterior desarrollo del sistema de clasificación se debían definir cada uno de los siguientes puntos: cómo representar las referencias bibliográficas a clasificar, cómo dotar de semántica a los descriptores, definición del criterio de selección de los descriptores a proponer. Como se dijo anteriormente, la colección de categorías está representada como un tesauro. El tesauro está formado por términos con significado único, bien descriptores o no descriptores. Sólo los primeros se utilizan para clasificar. La representación de las referencias, para mantener las hipótesis marcadas en ([23], [18], [17]), se realiza mediante sus ficheros invertidos. Para dotar de semántica a los descriptores se utilizaron las técnicas de extracción de información para la generación de un corpus semántico indicada en ([17], [18], [21], y [23]). De esta forma, cada descriptor se caracterizará por un conjunto inicial de pares <palabra-certidumbre> que describen su semántica. A partir de un texto del dominio, y utilizando extracción de información, se entrenará el sistema para que aumente el conjunto de pares con los sustantivos encontrados en el texto de entrenamiento. Finalmente, indicar que el modelo de clasificador utilizado emplea un razonamiento basado en medidas de certeza o certidumbre [2], para lo que utiliza unas fórmulas de disyunción producto y conjunción máximo, siendo el motor de inferencia el algoritmo de los k vecinos más cercanos [6] para seleccionar los descriptores a proponer. Este sistema se caracteriza por emular la forma de razonar y la de los expertos de clasificación. Un punto importante es la reducción en las tareas de entrenamiento, siendo éste necesario únicamente para caracterizar el corpus de los descriptores del tesauro. Los textos a seleccionar para la generación automática de corpus deben pertenecer al dominio semántico del descriptor, siendo esta selección una tarea laboriosa pero sencilla de realizar por un ser humano. 4.1 SEMÁNTICA DE LOS DESCRIPTORES Se ha comentado previamente que se utilizará un glosario de términos jerarquizados con significado único (descriptores). A este conjunto de descriptores se le denomina tesauro. Cada descriptor está caracterizado por un corpus o corpus semántico (conjunto de palabras que le dotan de significado). Cada palabra perteneciente al corpus de un descriptor tiene una certidumbre asociada, calculada según un determinado algoritmo. Para la generación automática del corpus se generaron las siguientes herramientas: analizador morfológico, generador de corpus.

4 Para el analizador morfológico se siguió el principio teórico de Porter definido en [13]. Sin embargo, el algoritmo que en dicho trabajo se muestra está muy enfocado al idioma inglés. En el caso del idioma castellano, este algoritmo es de poco éxito. Por lo tanto se realizó un estudio de la Lengua Española o Castellano, y para ello se analizaron los textos ([7], [14], [10], [11]). Con todo este material se elaboró un agente utilizando el motor de inferencia de la shell de sistemas expertos Jess [5], el cuál implementa como motor de búsqueda el algoritmo RETE. Los resultados de este analizador morfológico están fuera del ámbito de este trabajo por lo que no se muestran. A efectos del presente trabajo indicar que este analizador morfológico genera para cada palabra la raíz que considera de mayor credibilidad. Para el generador de corpus se siguieron las pautas marcadas por Riloff en su trabajo ([18], [17] y [23]). En estos trabajos se realiza la generación automática de corpus para descriptores conceptuales partiendo de las siguientes premisas: cada concepto está representado por un término lingüístico, pudiendo cada término estar compuesto por más de una palabra, cada término dispone de un conjunto de palabras que le dotan de un corpus inicial, cada palabra del corpus de cada descriptor tiene asociada una certidumbre sobre el grado con que dicha palabra afecta o referencia al descriptor. valor p se calcula a partir de la frecuencia de aparición de la raíz en cada una de las frases en las que aparecen raíces asociadas a palabras del corpus de un determinado descriptor multiplicada por la certidumbre de dichas raíces y dividida por la frecuencia con que dicha raíz aparece en el texto. Cabe destacar que, aunque se utilizan raíces para descubrir nuevos candidatos para formar parte del corpus, cada raíz tiene asociada un conjunto de palabras para la cuál cumple dicha condición (ser raíz). Dichas palabras asociadas son las que finalmente se añaden al corpus del descriptor, quedando éste compuesto por el conjunto de palabras cuyas raíces fueron descubiertas en un texto generador mediante el algoritmo de Riloff ya comentado, conjuntamente con las modificaciones que se le han realizado. Una vez implementadas las herramientas con los algoritmos descritos, para generar el corpus de cada uno de los descriptores se debe disponer de un archivo de texto con un formato preestablecido donde se disponga el tesauro jerárquico, las relaciones de más específico que y relacionado con (propias de un tesauro), así como las palabras iniciales del corpus conjuntamente con sus credibilidades, generándose un flujo representado en la figura 2. Lista Descriptores con su corpus inicial Documento con el contenido del dominio Las modificaciones que se realizaron sobre dicho trabajo para su adaptación al castellano y al problema a resolver fueron: en lugar de trabajar con palabras se trabaja con los lexemas de las palabras a través del analizador morfológico construido y ya comentado, en sus trabajos Riloff descarta las palabras que aparezcan menos de un 5% en el texto. Para el español esto es demasiado restrictivo, así es como se decidió, tras pruebas y error, trabajar con un 1% o menos. Este es un valor que se continuará ensayando, la formula para asignar las puntuaciones varía, ya que tiene en cuenta la credibilidad de la raíz que añade la raíz candidata. La nueva formula es (1): frec.deaparición enventanasi certidumbrei p = (1) frec. aparición texto donde p es la certidumbre a asignar a una nueva raíz que forma parte del corpus de un descriptor. Este Figura 2 : Flujo de datos en el generador automático de corpus 4.2 SELECCIÓN DE LOS DESCRIPTORES A PROPONER Una vez disponible el corpus para el tesauro, el clasificador clásico trabaja como sigue: extracción de las palabras con su frecuencia relativa de la referencia bibliográfica, análisis morfológico de las palabras para extraer su raíz,

5 para cada palabra de la lista de palabras de la referencia bibliográfica se busca si forma parte del corpus de descriptores del tesauro, proponiendo descriptores con una certidumbre igual a la de la palabra multiplicada por su frecuencia de aparición en el texto a clasificar. La certidumbre que se elige para un descriptor que aparece referenciado por diversas palabras es la máxima de las calculadas, aplica el algoritmo de los k vecinos más cercanos para la selección y propuesta de los descriptores. El valor k es configurable, inicialmente se han propuesto 5 descriptores. Nunca se proponen descriptores con certidumbre menor a un valor UMBRAL_DESCRIPTOR, cuyo valor es modificable y por defecto es 0.0. Los valores seleccionados por defecto pueden ser ajustados en las pruebas para armonizarlos con la cantidad de datos manejables por un experto. La propuesta realizada por el clasificador clásico contiene el descriptor y su certidumbre, pudiendo utilizarse directamente como clasificador automático o semiautomático. 5 ENSAYOS Y RESULTADOS Para comprobar el comportamiento del sistema se utilizó el microtesauro Biología, contenido en el tesauro del MOPT [27]. Para evaluar el sistema se plantearon diversas medidas típicas, las cuáles se pueden estudiar en ([25], [26]). En concreto, se optó por visualizar las medidas de precisión, notificación, y las medidas E y F de de Van Rijsbergen. Para el caso de éstas últimas, se utilizó un coeficiente β de valor 1 (igualdad de peso entre precisión y notificación). Para realizar estas medidas se tuvo en cuenta, como es lógico, que los clasificadores debían tener carácter de clasificadores automáticos. Los resultados se muestran en la tabla 1. Totales Agregados Totales Medios FP 266 FN 113 VP 89 VN 3166 Precisión 0,251 0,158 Notificación 0,441 0,567 E 0,68 0,752 F 0,32 0,248 Tabla 1: Resultados. 6 CONCLUSIONES La extracción de información representa un buen camino para instancias conceptos extraídos de los datos analizados. En su uso en la clasificación de documentos de texto se observa que el corpus inicial para el entrenamiento de descriptores es fundamental, y una mala selección de certidumbres iniciales conlleva un fallo en el entrenamiento. De hecho, el clasificador implementado podría optimizarse sin modificar el algoritmo si los datos de entrenamiento inicial se mejoraran. Como trabajos futuros cabe destacar el estudio de mejoras en el analizador morfológico, y el uso de estas técnicas en la caracterización conceptual en el dominio de la automática. Referencias [1] Cardie, C., (1997) Empirical methods in information extraction, American Association for Artificial Intelligence, pp [2] Cuena, J., (1995) Notas sobre modelos de razonamiento, Facultad de Informática, Universidad Politécnica de Madrid. [3] Dershowitz, N., (2000) Artificial Intelligence: retrospective/prospective, Annals of Mathematics and Artificial Intelligence, 1 a 4, 3-5. [4] Gómez, A., Juristo, N., Montes, C., Pazos, J., (1997) Ingeniería del Conocimiento, Editorial Centro de Estudios Ramón Areces, S.A., Colección de Informática, ISBN [5] Jess Site, Shell para Sitemas Expertos Jess, [en línea] <http://herzberg.ca.sandia.gov/jess/> [Consulta 1 julio 2002]. [6] Keller, J. M., Gray, M. R., Givens, J. A. jr., (1985) A Fuzzy K-Nearest Neighbor Algorithm, IEEE Transactions on Systems, Man and Cybernetics, SMC-15, 4, pp [7] Lang, M. F., (1992) Formación de palabras en español (Spanish Word Formation), Ediciones Cátedra S.A., Madrid. [8] Lewis, D. D., (1991) Data extraction as text categorization: An experiment with the MUC-3 corpus, Proceedings of the Third Message Understanding Evaluation and Conference. [9] McSherry, D., (2000) Automating case selection in the construction of a case library, Knowledge-Based Systems, 13, pp

6 [10] Miranda Podadera, L., (1988) Gramática española, Editorial Hernando, Madrid. [11] Mínguez Fontan, N., (1987) Gramática del español II, Editorial Santillana, Madrid. [12] Palma, J. T., Paniagua, E., Martín, F., Martín, R., (2000) Ingeniería del Conocimiento. De la Extracción al Modelado del Conocimiento, Revista Iberoamericana de Inteligencia Artificial, 11, pp [13] Porter, M. F., (1980) An algorithm for suffix stripping, Program, 14, 3, pp [14] Puebla Ortega, J., (1995) Cómo conjugar todos los verbos del español, Editorial Playor, Madrid. [15] Rasmus, D. W., (2000) Knowledge management trends: the role of knowledge un e- business, PC AI, 14, 4, pp [16] Riloff, E., (1991) Little Words Can Make a Big Difference for Text Classification, Proceedings of the 18th Annual International ACM SIgIR Conference on Research and Development in Information Retrieval, pp [17] Riloff, E., (1983) Automatically Constructing a Dictionary for Information Extraction Task, Proceedings of the Eleventh National Conference on Artificial Intelligence, AAI Press MIT Press, pp [18] Riloff, E., (1996) Using learned extraction patterns for text classification, Connectionist, Statistical, and Symbolic Approaches to Learning for Natural Language Processing In Wermter, S., Riloff, E., & Scheler, G. (eds.)., Springer-Verlag, pp [19] Riloff, E., (1996) An Empirical Study of Automated Dictionary Construction for Information Extraction in Three Domains, AI Journal, 85, 1, 2, pp [20] Riloff, E., (1999) Information Extraction as a Stepping Stone toward Story Understanding, MIT press, Montreal, Canada. [22] Riloff, E., Lehnert, W., (1994) Information Extraction as a Basis for a High-Precision Text Classification, ACM transactions on Information Systems, 12, 3, pp [23] Riloff, E., Shepherd, J., (1997) A Corpus- Based Approach for Building Semantic Lexicons, Proceedings of the Second Conference on Empirical Methods in Natural Language Processing. [24] Rivero, S., (2000) Gestión del conocimiento: una vía hacia la ventaja competitiva, DYNA. Ingeniería e Industria, LXXV, 3, pp [25] Sebastiani, F., (1999) Machine Learning in Automated Text Categorization, Technical Report IEI-B , Istituto di Elaborazione dell'informazione, Consiglio Nazionale delle Ricerche, Pisa, IT. [26] Sebastiani, F., (1999) A Tutorial on Automated Text Categorization, Proceedings of ASAI-99, 1st Argentinian Symposium on Artificial Intelligence, pp [27] Secretaría General de Medio Ambiente, (1990) Tesauro de Medioambiente del MOPU, Ministerio de Obras Públicas y Urbanismo, ISBN [28] Soderland, S., Fisher, D., Aseltine, J., Lehnert, W., (1996) Issues in inductive learning of domain-specific text extraction rules, Connectionist, Statistical, and Symbolic Approaches to Learning for Natural Language Processing, Lecture Notes in Artificial Intelligence, Springer, pp [29] Soderland, S., Fisher, D., Aseltine, J., Lehnert, W. G., (1995) Crystal: Inducing a conceptual dictionary, Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, pp [30] Suso, R., (2000) Conocimiento e innovación, DYNA. Ingeniería e Industria, LXXV, 3, pp [21] Riloff, E., Jones, R, (1999) Learning dictionaries for information extraction using multi-level boot-strapping, Proceedings of the Sixteenth National Conference on Artificial Intelligence, pp

CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS

CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS XXV Jornadas de Automática Ciudad Real, del 8 al 10 de septiembre de 2004 CLASIFICACIÓN TEXTUAL BASADA EN TÉRMINOS JERÁRQUICOS Francisco Javier Panizo, José R. Villar, Ángel Alonso Área de Ingeniería de

Más detalles

Clasificación Automática de Textos de Desastres Naturales en México

Clasificación Automática de Textos de Desastres Naturales en México Clasificación Automática de Textos de Desastres Naturales en México Alberto Téllez-Valero, Manuel Montes-y-Gómez, Olac Fuentes-Chávez, Luis Villaseñor-Pineda Instituto Nacional de Astrofísica, Óptica y

Más detalles

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013 Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS Máster en Lenguajes y Sistemas Informáticos:

Más detalles

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012 Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar

Más detalles

DISEÑO DE UN CURSO INTERACTIVO Y ADAPTATIVO DE PROCESADORES DE LENGUAJES

DISEÑO DE UN CURSO INTERACTIVO Y ADAPTATIVO DE PROCESADORES DE LENGUAJES Alfonseca, M., Carro, R.M., Pulido, E. and Rodríguez, P. (2000): Diseño de un curso interactivo y adaptativo de procesadores de lenguajes. Proceedings of JENUI 2000: VI Jornadas sobre la Enseñanza Universitaria

Más detalles

Sistema categorizador de ofertas de empleo informáticas

Sistema categorizador de ofertas de empleo informáticas Diego Expósito Gil diegoexpositogil@hotmail.com Manuel Fidalgo Sicilia Manuel_fidalgo@hotmail.com Diego Peces de Lucas pecesdelucas@hotmail.com Sistema categorizador de ofertas de empleo informáticas 1.

Más detalles

Tema 1 Introducción a los Sistemas Basados en el Conocimiento

Tema 1 Introducción a los Sistemas Basados en el Conocimiento Tema 1 Introducción a los Sistemas Basados en el Conocimiento Sistemas Basados en el Conocimiento Grado en Ingeniería Informática 1 Referencias Ingeniería del Conocimiento. A. Gómez, N. Juristo, C. Montes,

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información

Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información

Más detalles

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 26 de Marzo, 9 y 23 de Abril y 7 de mayo de 2010 grupo de PLN en FaMAF http://www.cs.famaf.unc.edu.ar/~pln/

Más detalles

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA Enrique Puertas epuertas@uem.es Francisco Carrero fcarrero@uem.es José María Gómez Hidalgo jmgomez@uem.es Manuel de Buenaga buenga@uem.es

Más detalles

Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID

Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID Informe elaborado por el equipo de trabajo del SID (Servicio de Información sobre

Más detalles

Método Supervisado orientado a la clasificación automática de documentos. Caso Historias Clínicas

Método Supervisado orientado a la clasificación automática de documentos. Caso Historias Clínicas Método Supervisado orientado a la clasificación automática de documentos. Caso Historias Clínicas Roque E. López Condori 1 Dennis Barreda Morales 2 Javier Tejada Cárcamo 2 Luis Alfaro Casas 1 1 Universidad

Más detalles

David Jordi Vallet Weadon.

David Jordi Vallet Weadon. <david.vallet@uam.es> David Jordi Vallet Weadon 1 Introducción Durante las últimas décadas, la personalización ha sido aplicada en diferentes campos de la informática, tanto en la rama científica como

Más detalles

Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos

Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos Britos, P. 1,2 ; Fernández, E. 2,1 ; García Martínez, R 1,2 1 Centro de Ingeniería del Software e Ingeniería del Conocimiento.

Más detalles

Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases

Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Emmanuel Anguiano-Hernández Abril 29, 2009 Abstract Tratando de mejorar el desempeño de un clasificador Naive

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

Búsqueda sobre catálogos basada en ontologías

Búsqueda sobre catálogos basada en ontologías Búsqueda sobre catálogos basada en ontologías Alianis Pérez Sosa, Yuniel Eliades Proenza Arias Universidad de las Ciencias Informáticas. Carretera a San Antonio Km 2 ½, Reparto Torrens, La Lisa, Ciudad

Más detalles

Un Clasificador de Texto Por Aprendizaje

Un Clasificador de Texto Por Aprendizaje Un Clasificador de Texto Por Aprendizaje Peláez J.I. (a) La Red D. (b) Sánchez P. (a) (a) Dpto. Lenguajes y Ciencias de la Computación E.T.S.I. Informática. Campus de Teatinos. Universidad de Málaga Málaga

Más detalles

Notas. Modelo conceptual para el diseño e implementación del sitio web de un museo regional * Resumen. 1. Introducción y formulación del problema

Notas. Modelo conceptual para el diseño e implementación del sitio web de un museo regional * Resumen. 1. Introducción y formulación del problema Notas Modelo conceptual para el diseño e implementación del sitio web de un museo regional * Resumen El presente artículo propone el modelo conceptual para la creación de un sitio Web de un museo regional

Más detalles

Desarrollo de Sistemas Multi-Agente con INGENIAS

Desarrollo de Sistemas Multi-Agente con INGENIAS Desarrollo de Sistemas Multi-Agente con INGENIAS Juan Pablo Soto Alarcos Research Group Escuela Superior de Informática Universidad de Castilla - La Mancha INDICE Introducción INGENIAS Objetivo Principios

Más detalles

Integrando Información de Fuentes Relevantes para un Sistema Recomendador

Integrando Información de Fuentes Relevantes para un Sistema Recomendador Integrando Información de Fuentes Relevantes para un Sistema Recomendador Silvana Aciar, Josefina López Herrera and Javier Guzmán Obando Agents Research Laboratory University of Girona {saciar, jguzmano}@eia.udg.es,

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

Google: Una oportunidad para la evolución de las Bibliotecas

Google: Una oportunidad para la evolución de las Bibliotecas Google: Una oportunidad para la evolución de las Bibliotecas Elizabeth Cañón Acosta elizadavaes@gmail.com Universidad de la Salle Resumen El uso generalizado de Google como herramienta de búsqueda de información

Más detalles

Hacia un sistema de marketing dirigido más eficaz y personalizado en redes sociales

Hacia un sistema de marketing dirigido más eficaz y personalizado en redes sociales Hacia un sistema de marketing dirigido más eficaz y personalizado en redes sociales Patxi Galán-García, Dr. Carlos Laorden Gómez, and Dr. Pablo García Bringas DeustoTech Computing - S 3 Lab, University

Más detalles

Sistema de Recuperación de Información Motor de Búsqueda: Innuendo

Sistema de Recuperación de Información Motor de Búsqueda: Innuendo Sistema de Recuperación de Información Motor de Búsqueda: Innuendo Epifanio Tula, Luis Gerónimo Medeot, Matías Daniel Universidad Tecnológica Nacional, Facultad Regional Córdoba Abstract El presente trabajo

Más detalles

Una validación de la interpretación no causal del análisis factorial

Una validación de la interpretación no causal del análisis factorial Una validación de la interpretación no causal del análisis factorial José Antonio Pérez-Gil y Rafael Moreno Rodríguez Es muy frecuente asumir que los factores comunes obtenidos en el Análisis Factorial

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Diseño e implementación de un sistema de gestión de la actividad docente

Diseño e implementación de un sistema de gestión de la actividad docente Diseño e implementación de un sistema de gestión de la actividad docente Ángela Diez Diez 1, Jorge J. Blanes Peiro 1, Francisco J. Rodríguez Sedano 1 1 Dpto. Ingeniería Eléctrica y de Sistemas y Automática.

Más detalles

CLASIFICADOR LINGÜÍSTICO DE TEXTOS EN JAVA

CLASIFICADOR LINGÜÍSTICO DE TEXTOS EN JAVA CLASIFICADOR LINGÜÍSTICO DE TEXTOS EN JAVA Óscar Alberto García Pérez Universidad Carlos III de Madrid 100039016@alumnos.uc3m.es Ignacio Martínez Fernández Universidad Carlos III de Madrid 100039048@alumnos.uc3m.es

Más detalles

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA Estudio de las herramientas TOAD y DBArtisan para la administración e integración de bases de datos relacionales. PREVIA OPCION AL TÍTULO DE: INGENIERO

Más detalles

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta

Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Conexión de Reglas de Negocios con Aspectos: estrategias y herramienta Sandra Casas y Cecilia Fuentes Zamorano UARG, Universidad Nacional de la Patagonia Austral Campus Universitario, Piloto Riversa s/n

Más detalles

forma de entrenar a la nuerona en su aprendizaje.

forma de entrenar a la nuerona en su aprendizaje. Sistemas expertos e Inteligencia Artificial,Guía5 1 Facultad : Ingeniería Escuela : Computación Asignatura: Sistemas expertos e Inteligencia Artificial Tema: SISTEMAS BASADOS EN CONOCIMIENTO. Objetivo

Más detalles

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:

Más detalles

Otto Cordero Sánchez 1, Enrique Peláez Jarrín 2

Otto Cordero Sánchez 1, Enrique Peláez Jarrín 2 UN MARCO DE TRABAJO PARA EL DESARROLLO DE APLICACIONES WEB CON COMPORTAMIENTO AUTONOMO INTELIGENTE Otto Cordero Sánchez 1, Enrique Peláez Jarrín 2 Resumen Este trabajo presenta un mecanismo para construir

Más detalles

ESCUELA POLITÉCNICA SUPERIOR

ESCUELA POLITÉCNICA SUPERIOR UNIVERSIDAD DE CÓRDOBA ESCUELA POLITÉCNICA SUPERIOR INGENIERÍA TÉCNICA EN INFORMÁTICA DE GESTIÓN PETICIÓN DE TEMA PARA PROYECTO FIN DE CARRERA: TÍTULO Herramienta para la preparación de conjuntos de aprendizaje

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal

Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal Reporte final Ricardo Omar Chávez García Instituto Nacional de Astrofísica Óptica y Electrónica, 72840

Más detalles

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica C1. Capacidad para la resolución de los problemas matemáticos que puedan plantearse en la ingeniería. Aptitud para aplicar

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA Pablo F. Provasi 1 Lucio J. Kleisinger 1 Francisco R. Villatoro 2 1 Dpto. de Informática, Universidad

Más detalles

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web J.Corral-García, D.Cortés-Polo, C.Gómez-Martín, J.L.González-Sánchez

Más detalles

Previsión de precios y demanda en la gestión hotelera.

Previsión de precios y demanda en la gestión hotelera. II International Conference on Industrial Engineering and Industrial Management XII Congreso de Ingeniería de Organización September 3-5, 2008, Burgos, Spain Previsión de precios y demanda en la gestión

Más detalles

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 52(6):460-475, 2001 Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.

Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula. Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.ve Resumen: se describe la implementación experimental de

Más detalles

Gestión y Desarrollo de Requisitos en Proyectos Software

Gestión y Desarrollo de Requisitos en Proyectos Software Gestión y Desarrollo de Requisitos en Proyectos Software Ponente: María Jesús Anciano Martín Objetivo Objetivo Definir un conjunto articulado y bien balanceado de métodos para el flujo de trabajo de Ingeniería

Más detalles

HERRAMIENTA WEB PARA MODELO FINANCIERO DE CONSTRUCTORES EN BOGOTÁ

HERRAMIENTA WEB PARA MODELO FINANCIERO DE CONSTRUCTORES EN BOGOTÁ HERRAMIENTA WEB PARA MODELO FINANCIERO DE CONSTRUCTORES EN BOGOTÁ ARBELÁEZ, B. 1 HERRAMIENTA WEB PARA MODELO FINANCIERO DE CONSTRUCTORES EN BOGOTÁ Beatriz Alexandra Arbeláez Hurtado Profesor Investigador

Más detalles

Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO

Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO Universidad Católica San Pablo Facultad de Ingeniería y Computación Programa Profesional de Ciencia de la Computación SILABO CS271T. Bases de Datos II (Obligatorio) 2012-2 1. DATOS GENERALES 1.1 CARRERA

Más detalles

Recuperación de información visual utilizando descriptores conceptuales

Recuperación de información visual utilizando descriptores conceptuales Recuperación de información visual utilizando descriptores conceptuales J. Benavent, X. Benavent y E. de Ves Departament d Informàtica (Universitat de València) {esther.deves,xaro.benavent}@uv.es Abstract.

Más detalles

ANALES DEL XVIII CONGRESO ARGENTINO DE CIENCIAS DE LA COMPUTACIÓN CACIC. 8 al 12 de octubre de 2012. Bahía Blanca, Buenos Aires, Argentina

ANALES DEL XVIII CONGRESO ARGENTINO DE CIENCIAS DE LA COMPUTACIÓN CACIC. 8 al 12 de octubre de 2012. Bahía Blanca, Buenos Aires, Argentina ANALES DEL XVIII CONGRESO ARGENTINO DE CIENCIAS DE LA COMPUTACIÓN XVIII CACIC 2012 8 al 12 de octubre de 2012 Bahía Blanca, Buenos Aires, Argentina XIII Workshop Agentes y Sistemas Inteligentes (WASI)

Más detalles

Grado en Ingeniería Informática

Grado en Ingeniería Informática Grado en Ingeniería Informática Competencias Generales y trasversales De acuerdo con la resolución del Consejo de Universidades de fecha 3 de marzo de 2009, para obtener este título de grado en ingeniería

Más detalles

Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR

Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR El futuro de los buscadores: Nuevas tendencias en Recuperación de Información Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR FESABID 2007 José Ramón Pérez Agüera

Más detalles

SERVICIO NACIONAL DE APRENDIZAJE SENA

SERVICIO NACIONAL DE APRENDIZAJE SENA SERVICIO NACIONAL DE APRENDIZAJE SENA GUÍA DE APRENDIZAJE SISTEMA INTEGRADO DE GESTIÓN Proceso Gestión de la Formación Profesional Integral Procedimiento Ejecución de la Formación Profesional Integral

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos Anteproyecto de Tesis de Magíster en Ingeniería del Software Tesista: Lic. Matilde

Más detalles

La Web Semántica como herramienta para e-learning

La Web Semántica como herramienta para e-learning La Web Semántica como herramienta para e-learning Lidia Marina López llopez@uncoma.edu.ar Departamento de Ciencias de la Computación Universidad Nacional del Comahue Buenos Aires 1400 8300 Neuquén Tel.

Más detalles

INTERPRETACIÓN DINÁMICA DE MÚLTIPLES LENGUAJES DE DOMINIO ESPECÍFICO

INTERPRETACIÓN DINÁMICA DE MÚLTIPLES LENGUAJES DE DOMINIO ESPECÍFICO INTERPRETACIÓN DINÁMICA DE MÚLTIPLES LENGUAJES DE DOMINIO ESPECÍFICO Héctor A. FLOREZ FERNANDEZ Facultad Tecnológica, Universidad Distrital Francisco Jose de Caldas haflorezf@udistrital.edu.co Bogotá,

Más detalles

XerKa, vigilancia a medida y flexible

XerKa, vigilancia a medida y flexible XerKa es una solución software que apoya los procesos de Vigilancia Tecnológica e Inteligencia Competitiva de la empresa. Busca, filtra, analiza y clasifica información procedente de la red Interna e Internet

Más detalles

Mejora de la eficiencia de procesos y herramientas en el departamento Lean Engineering

Mejora de la eficiencia de procesos y herramientas en el departamento Lean Engineering Philips Healthcare Mejora de la eficiencia de procesos y herramientas en el departamento Lean Engineering Proyecto Fin de Carrera Titulación: Ingeniería Industrial Superior Empresa: Philips Healthcare

Más detalles

Resumen. 1. Introducción. 2. Objetivos

Resumen. 1. Introducción. 2. Objetivos Propuesta para la Asignatura Sistemas Industriales en las Titulaciones de Informática F.A. Pujol, F.J. Ferrández, J.L. Sánchez, J. M. García Chamizo Dept. de Tecnología Informática y Computación Universidad

Más detalles

PROYECTO DOCENTE ASIGNATURA: "Lógica Informática"

PROYECTO DOCENTE ASIGNATURA: Lógica Informática PROYECTO DOCENTE ASIGNATURA: "Lógica Informática" Grupo: Clases Teóricas de Lógica Informática (DOCENCIA EN INGLÉS)(948465) Titulacion: Grado en Ingeniería Informática-Ingeniería del Software Curso: 2015-2016

Más detalles

Tutorial de Moodle. Actividad Cuestionario

Tutorial de Moodle. Actividad Cuestionario Tutorial de Moodle Actividad Cuestionario Cuestionario Para qué sirve? El Cuestionario es una actividad autoevaluable, en la cual la nota se calcula automáticamente. Sirve al alumno como autoevaluación

Más detalles

Centro de Investigación en Matemáticas, A.C.

Centro de Investigación en Matemáticas, A.C. Centro de Investigación en Matemáticas, A.C. Temas Selectos de Programación Avanzada II (Temas Selectos de Ingeniería de Software) Reporte Final Métricas de Procesos de Software Maestría en Ciencias de

Más detalles

DETECCIÓN DE PÉRDIDAS EN LA INDUSTRIA PETROLERA

DETECCIÓN DE PÉRDIDAS EN LA INDUSTRIA PETROLERA DETECCIÓN DE PÉRDIDAS EN LA INDUSTRIA PETROLERA Luis Alejandro Benavides Vázquez Yasmín Agueda Ríos Solís Resumen Las redes de proceso de las refinerías son complejas ya que involucran una serie procesos

Más detalles

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental El proceso documental El proceso o cadena documental es la razón fundamental de un centro

Más detalles

Sistema de Consultas en Lenguaje Natural para Bases de Datos

Sistema de Consultas en Lenguaje Natural para Bases de Datos Sistema de Consultas en Lenguaje Natural para Bases de Datos José Manuel Soto Corzo, David Díaz Portillo, José Antonio Cruz Zamora Instituto Tecnológico de Apizaco Av. Instituto Tecnológico de Apizaco

Más detalles

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS

WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS WEBBER: USO DE COMPONENTES PARA LA ARMONIZACIÓN DE CONTENIDOS Y METADATOS Autores: Introducción Diego R. López RedIRIS diego.lopez@rediris.es El trabajo necesario para mantener un servidor de información

Más detalles

Inteligencia Artificial II Propuesta de trabajo Detección de correo basura (anti-spam) mediante técnicas de Inteligencia Artificial

Inteligencia Artificial II Propuesta de trabajo Detección de correo basura (anti-spam) mediante técnicas de Inteligencia Artificial Inteligencia Artificial II Propuesta de trabajo Detección de correo basura (anti-spam) mediante técnicas de Inteligencia Artificial José F. Quesada 1 Introducción La idea de detección o filtrado de correo

Más detalles

Documento de Competencias. Facultad de Informática, UPV/EHU. 1 Estructura general del Grado TE1 TE2 TE3 TE4 TE5 TE6 TE7 TE8

Documento de Competencias. Facultad de Informática, UPV/EHU. 1 Estructura general del Grado TE1 TE2 TE3 TE4 TE5 TE6 TE7 TE8 Documento de Competencias Grado en INGENIERÍA INFORMÁTICA Facultad de Informática, UPV/EHU 1 Estructura general del Grado 1.1 Fundamentos de Tecnología de los Principios de Diseño de Sistemas Digitales

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

Clasificación Bayesiana de textos y páginas web

Clasificación Bayesiana de textos y páginas web Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en

Más detalles

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas 1. DEFINICIONES, UBICACIÓN CONCEPTUAL E HISTORIA DE LA I.A. 2. COMPLEJIDAD COMPUTACIONAL, EXPLOSIÓN COMBINATORIA, DOMINIOS NO

Más detalles

Inteligencia de Negocio

Inteligencia de Negocio UNIVERSIDAD DE GRANADA E.T.S. de Ingenierías Informática y de Telecomunicación Departamento de Ciencias de la Computación e Inteligencia Artificial Inteligencia de Negocio Guión de Prácticas Práctica 1:

Más detalles

Los servicios más comunes son como por ejemplo; el correo electrónico, la conexión remota, la transferencia de ficheros, noticias, etc.

Los servicios más comunes son como por ejemplo; el correo electrónico, la conexión remota, la transferencia de ficheros, noticias, etc. Página 1 BUSCADORES EN INTERNET Internet es una red de redes informáticas distribuidas por todo el mundo que intercambian información entre sí mediante protocolos 1 TCP/IP. Puede imaginarse Internet como

Más detalles

Data Warehouse Marco de Calidad

Data Warehouse Marco de Calidad Data Warehouse Marco de Calidad Autor: Pablo Martín Gutiérrez Tutor: Antonio García Carmona Defensa del Proyecto de Final de Carrera Índice Introducción. Objetivos del PFC. Fundamentos Business Intelligence

Más detalles

Rubén Ruiz, Miguel Angel Edo.

Rubén Ruiz, Miguel Angel Edo. 27 Congreso Nacional de Estadística e Investigación Operativa Lleida, 8 11 de abril de 2003 ANÁLISIS Y PREVISIÓN DE VENTAS EN EL SECTOR AZULEJERO Rubén Ruiz, Miguel Angel Edo. Departamento de Estadística

Más detalles

Herramienta de simulación para la realización de pruebas en la gestión de red basada en SNMP

Herramienta de simulación para la realización de pruebas en la gestión de red basada en SNMP XV JENUI. Barcelona, 8-10 de julio de 2009 ISBN: 978-84-692-2758-9 http://jenui2009.fib.upc.edu/ Herramienta de simulación para la realización de pruebas en la gestión de red basada en SNMP José Manuel

Más detalles

Arquitectura de Aplicaciones

Arquitectura de Aplicaciones 1 Capítulo 13: Arquitectura de aplicaciones. - Sommerville Contenidos del capítulo 13.1 Sistemas de procesamiento de datos 13.2 Sistemas de procesamiento de transacciones 13.3 Sistemas de procesamiento

Más detalles

Desarrollo de SBC. cbea (LSI - FIB) Sistemas Basados en el Conocimiento IA - Curso 2008/2009 1 / 41

Desarrollo de SBC. cbea (LSI - FIB) Sistemas Basados en el Conocimiento IA - Curso 2008/2009 1 / 41 Desarrollo de SBC Ingeniería de los SBC Desarrollo de SBC El punto más importante del desarrollo de SBC es la extracción del conocimiento Requiere la interacción entre el Ingeniero del Conocimiento y el

Más detalles

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Mª. José Ramírez Quintana José Hernández Orallo Programa: Programación Declarativa e Ingeniería de la Programación Objetivos

Más detalles

Práctica de SIEA. Introducción. Características del Curso. Tabla de contenidos. David Arroyo Menéndez

Práctica de SIEA. Introducción. Características del Curso. Tabla de contenidos. David Arroyo Menéndez David Arroyo Menéndez Copyright (c) 2004 David Arroyo Menéndez Se otorga permiso para copiar, distribuir, y/ó modificar este documento bajo los términos de la GNU Free Documentation License, Version 1.1

Más detalles

Proyecto de Normalización Automática de Base de Datos

Proyecto de Normalización Automática de Base de Datos Proyecto de Normalización Automática de Base de Datos Lic. Beatriz Steimberg * Resumen En el primer cuatrimestre del año 2003 se encaró el proyecto de Normalización Automática de Base de Datos. El objetivo

Más detalles

UNIVERSIDAD VERACRUZANA DIRECCIÓN ACADÉMICA DE CIENCIAS DE LA SALUD FACULTAD DE PSICOLOGÍA MATERIA : TALLER DE COMPUTACIÓN BÁSICA

UNIVERSIDAD VERACRUZANA DIRECCIÓN ACADÉMICA DE CIENCIAS DE LA SALUD FACULTAD DE PSICOLOGÍA MATERIA : TALLER DE COMPUTACIÓN BÁSICA UNIVERSIDAD VERACRUZANA DIRECCIÓN ACADÉMICA DE CIENCIAS DE LA SALUD FACULTAD DE PSICOLOGÍA MATERIA : TALLER DE COMPUTACIÓN BÁSICA PROYECTO DE INVESTIGACIÓN : INFORMÁTICA EN PSICOLOGÍA ALUMNA CARLA MÓNICA

Más detalles

Recuperación de Información en Internet

Recuperación de Información en Internet Recuperación de Información en Internet Máster Universitario Língua e usos profesionais Miguel A. Alonso Carlos Gómez Jesús Vilares Departamento de Computación Facultad de Informática Universidade da Coruña

Más detalles

Mejora de la Recuperación de Información en entorno Oracle: Aplicación práctica a Recursos Cartográficos

Mejora de la Recuperación de Información en entorno Oracle: Aplicación práctica a Recursos Cartográficos Mejora de la Recuperación de Información en entorno Oracle: Aplicación práctica a Recursos Cartográficos Víctor Dart 1, Juan Carlos Martínez 1, José V. Ballester 2, Francisco Rangel 1 1 Corex Soluciones

Más detalles

SEMINARIO GRUPO DE SISTEMAS INTELIGENTES

SEMINARIO GRUPO DE SISTEMAS INTELIGENTES SEMINARIO GRUPO DE SISTEMAS INTELIGENTES Métodos cuantitativos y cualitativos de evaluación de sistemas multilingüe y multimedia de acceso inteligente a la información biomédica en contextos de educación

Más detalles

Análisis de la visibilidad global de los publicadores de los recursos geográficos estandarizados

Análisis de la visibilidad global de los publicadores de los recursos geográficos estandarizados Análisis de la visibilidad global de los publicadores de los recursos geográficos estandarizados AnetaJ. Florczyk, F.Javier López-Pellicer, Javier Nogueras-Iso, F.Javier Zarazaga-Soria Universidad de Zaragoza,

Más detalles

Propuesta de un Modelo para Evaluar la Viabilidad de Proyectos de Implementación ERP en la Administración Pública Argentina

Propuesta de un Modelo para Evaluar la Viabilidad de Proyectos de Implementación ERP en la Administración Pública Argentina Propuesta de un Modelo para Evaluar la Viabilidad de Proyectos de Implementación ERP en la Administración Pública Argentina Eduardo Iberti 1, Pablo Pytel 1,2, Ma Florencia Pollo-Cattaneo 1,2 1 Programa

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Modelo de BASE DE DATOS EBSCO

Modelo de BASE DE DATOS EBSCO EL VOCABULARIO CONTROLADO EN LA RECUPERACIÓN DE NFORMACIÓN Modelo de BASE DE DATOS EBSCO Lic. Ana Luisa Pinillo León Servicios Bibliotecarios El vocabulario controlado es la clave fundamental para obtener

Más detalles

Recuperación Avanzada de la Información

Recuperación Avanzada de la Información Máster en Sistemas Inteligentes Recuperación Avanzada de la Información Máster en Sistemas Inteligentes 1 Carlos G. Figuerola 1 Ángel Zazo Rodríguez 1 1 Departamento de Informática y Automática Grupo de

Más detalles

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín. Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.

Más detalles

Formalización de Dominios de Negocio para Proyectos de Explotación de Información basada en Técnicas de Ingeniería del Conocimiento

Formalización de Dominios de Negocio para Proyectos de Explotación de Información basada en Técnicas de Ingeniería del Conocimiento Formalización de Dominios de Negocio para Proyectos de Explotación de Información basada en Técnicas de Ingeniería del Conocimiento Vegega, C., Pytel, P., Ramón, H., Rodríguez, D., Pollo-Cattaneo, F.,

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Tecnologías de la web semántica

Tecnologías de la web semántica Tecnologías de la web semántica MSC-0301 Nombre de la asignatura: Tecnologías de la Web Semántica Línea de trabajo: Tecnologías Web Tiempo de dedicación del estudiante a las actividades de: DOC TIS TPS

Más detalles

Inteligencia Artificial. Grado en INFORMÁTICA 4º curso. Modalidad: Presencial

Inteligencia Artificial. Grado en INFORMÁTICA 4º curso. Modalidad: Presencial Grado en INFORMÁTICA 4º curso Modalidad: Presencial Sumario Datos básicos 3 Breve descripción de la asignatura 4 Requisitos previos 4 Objetivos 4 Competencias 5 Contenidos 6 Metodología 6 Criterios de

Más detalles