Context Expansion for Domain-Specific Word Sense Disambiguation

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Context Expansion for Domain-Specific Word Sense Disambiguation"

Transcripción

1 Context Expansion for Domain-Specific Word Sense Disambiguation F. Rojas, I. Lopez, D. Pinto and V. J. Sosa Abstract 1 Two novel techniques based on term expansion for domain-specific Word Sense Disambiguation are presented in this paper. A list of terms correlated with the ambiguous word is obtained by means of correlation methods such as Pointwise Mutual Information and Chi-square. The list of correlated terms is used for expanding the context in which an ambiguous word occurs, thus leading to a better number of terms which may be further used for determining the correct sense of the target ambiguous word. The proposed method has been tested in domain-specific corpora (Finance and Sports) and in one balanced corpus, the British National Corpus (BNC). The obtained results for domain-specific corpora are competitive (Finance) and ever better (Sports and BNC) than those reported in previous works. Keywords Word sense disambiguation, specific domain, synset, WordNet, context expansion D I. INTRODUCCIÓN ESAMBIGUACIÓN del sentido de la palabra (DSP) es una tarea abordada desde hace varias décadas en el área de Lingüística Computacional (LC). DSP consiste en asignar el sentido correcto a una palabra ambigua considerando el contexto en el cual ocurre. De acuerdo con el Semeval [1], DSP se divide en dos tipos: muestra léxica (lexical sample) y todas las palabras (all-words), la primera consiste en seleccionar el sentido correcto para una palabra ambigua en una frase; la segunda trata de desambiguar todas las palabras de un texto. Se han propuesto diferentes enfoques para resolver la tarea genérica de DSP (supervisado, no supervisado, semi-supervisado, entre otros) [2, 3]. Por otro lado, DSP aplicado a dominios diferentes (cuando el dominio fuente y el objetivo son distintos), representa grandes desafíos, por ejemplo 1) resultados experimentales han mostrado una caída en el desempeño cuando el conjunto de texto de entrenamiento y de prueba pertenecen a dominios diferentes [4]; 2) la necesidad de reentrenar el sistema de DSP en cada nuevo dominio. En consecuencia se han propuesto métodos diferentes con el objetivo de resolver tales desafíos, como F. Rojas, Universidad Politécnica Metropolitana de Puebla, Puebla, México, frojas@tamps.cinvestav.mx I. Lopez, Cinvestav - Tamaulipas, Victoria, México, ilopez@tamps.cinvestav.mx D. Pinto, Benemérita Universidad Autónoma de Puebla, Puebla, México, dpinto@cs.buap.mx V. J. Sosa, Cinvestav - Tamaulipas, Victoria, México, vjsosa@tamps.cinvestax.mx adquisición del sentido predominante [5, 6, 7]; enfoques semisupervisados [8, 9] y basados en conocimiento [10, 11]. En este artículo presentamos un enfoque de DSP de muestra léxica basado en conocimiento para desambiguar instancias en conjuntos de textos en inglés de diferente dominio. El método recupera un conjunto de términos en una ventana de tamaño específico. Estos términos son usados para expandir el contexto donde se encuentra la palabra ambigua. Se proponen dos técnicas de expansión de términos para formar clases de instancias: 1) Expansión de Términos Supervisada (ETS) y 2) Expansión de Términos No Supervisada (ETNS). Una vez formadas las clases se aplican las técnicas Pointwise Mutual Information (PMI) [12] y Chi-cuadrada ( ) [13] para medir el grado de correlación entre pares de términos. Los términos recuperados son usados para expandir el contexto en cual ocurre una instancia ambigua. El objetivo de las técnicas propuestas es tener mayor evidencia contextual. De esta manera, no sólo consideramos las palabras en el contexto de una instancia ambigua, sino que también, palabras en todo el conjunto de texto de prueba donde se encuentra la palabra a desambiguar. La técnica de expansión de términos ha sido aplicada en el Procesamiento del Lenguaje Natural (PLN) para diversas tareas, por ejemplo, en Recuperación de Información (RI) para expandir la consulta dada por el usuario, en inducción del sentido de la palabra, en DSP, entre otras. Usualmente este proceso es llevado a cabo mediante el uso de un tesauro, una base de datos léxica u ontologías, etc. Por ejemplo, Tuominen et al. [14] usaron un método basado en ontologías para llevar a cabo el proceso de expansión de consultas y mejorar los resultados de un sistema de RI. En la literatura se han reportado varias propuestas de expansión de términos en DSP [15, 16, 17, 18]. El enfoque que se propone en este artículo está relacionado con el trabajo presentado por Pinto et al. [18], quienes propusieron un enfoque no supervisado de expansión de términos para la tarea Word Sense Induction and Discrimination System, presentado en el SemEval 2007 (International Workshop on Semantic Evaluation). En este sentido consideramos que el uso de términos recuperados desde el conjunto de texto de prueba puede ser de alto beneficio para la tarea de DSP en dominios específicos. De esta manera contribuimos con dos técnicas para expandir el contexto de instancias ambiguas. Los experimentos realizados sobre conjuntos de textos de diferente dominio muestran que

2 ETS obtiene mejores resultados en el dominio de Deportes y en el British National Corpus (BNC). En el dominio de Finanzas se obtuvieron resultados competitivos de acuerdo con lo reportado en la literatura. El resto del artículo está estructurado de la siguiente manera: en la Sección II se describe el trabajo relacionado con DSP en dominios específicos. La Sección III muestra los detalles de las técnicas de expansión de términos. La Sección IV describe los conjuntos de textos de prueba usados en los experimentos así como los resultados obtenidos. En la Sección V se discuten los experimentos llevados a cabo. Finalmente las conclusiones y trabajo futuro se describen en la Sección VI. II. TRABAJO RELACIONADO En la literatura se ha reportado un gran número de enfoques de DSP [2, 3], estos enfoques principalmente abordan el problema genérico de desambiguación. Sin embargo, el interés en dominios específicos se ha incrementado, dado que un sistema de desambiguación no garantiza su desempeño cuando se mueve de un dominio a otro. Es decir, cuando el conjunto de texto de evaluación es diferente al conjunto de texto de entrenamiento [4, 19]. En este contexto Chan y Ng [19] abordan el problema usando un algoritmo de aprendizaje supervisado Näive Bayes. Los autores agregaron ejemplos de entrenamiento desde el nuevo dominio como datos adicionales al sistema de DSP. De esta manera mostraron que el uso del sentido predominante del dominio objetivo mejoró el proceso de adaptación al nuevo dominio. Agirre y de Lacalle [20] propusieron un enfoque semi-supervisado de DSP, usaron descomposición de valores singulares y datos no etiquetados para obtener una mejor adaptación desde un conjunto de texto de propósito general (BNC) a un conjunto de texto de dominio específico (Deportes o Finanzas). De manera similar Guo et al. [8] presentaron un enfoque diferente en relación a trabajos previos de adaptación de dominio [19, 20], afirmaban que el mismo modelo era usado para desambiguar todas las palabras, a pesar de la diferencia existente entre ellas. Para mejorar el problema de adaptación de dominio construyeron un conjunto de modelos candidatos para cada palabra ambigua. El modelo a usar era seleccionado automáticamente desde el conjunto de modelos candidatos. Navigli et al. [10] propusieron un algoritmo para ponderar acepciones de la palabra a desambiguar, para ello recuperaron términos relevantes desde texto de dominio específico. Los términos relevantes fueron usados para inicializar un randow walk sobre el grafo de WordNet. De esta manera construyeron un modelo semántico para cada dominio. Los modelos semánticos fueron aplicados en categorización de textos y DSP en dominios específicos. Otro enfoque aplicado a DSP en diferentes dominios fue presentado por Koeling et al. [5]. En dicho enfoque se construye un tesauro desde un conjunto de texto de dominio específico usando el método de Lin [21]. El tesauro fue usado para recuperar los primeros top-k vecinos más cercanos para cada palabra ambigua; posteriormente fue usada una medida de similitud semántica implementada sobre WordNet para comparar cada acepción de la palabra vecina con cada acepción de la palabra a desambiguar. La acepción con el mejor puntaje era seleccionada para desambiguar cada palabra. Es importante indicar que el trabajo mencionado no lleva a cabo una desambiguación contextual. Por otro lado, varios trabajos han sido reportados en la literatura para enfrentar el problema de escasez de datos, es decir, cuando las características contextuales no son suficientes para DSP. Por ejemplo Tsao et al. [15] llevaron a cabo un proceso para expandir el contexto de instancias ambiguas. Las características expandidas fueron extraídas desde el conjunto de texto de prueba y WordNet para mejorar los resultados de un sistema de DSP, usando un algoritmo de aprendizaje supervisado Näive Bayes. Asimismo Tacoa et al. [16] evaluaron una técnica de expansión de términos en un sistema de DSP supervisado. Las características expandidas fueron recuperadas desde un tesauro de acuerdo a su relación de información mutua. Banerje y Pedersen [17] presentaron una modificación del algoritmo de Lesk [22], para ello extendieron las glosas de un sentido dado apoyándose en la jerarquía de WordNet, de esta manera tomaban en cuenta hiperónimos, hipónimos, holónimos, etc., y sus definiciones asociadas para construir un contexto más extenso para el significado de la palabra de interés. Pinto et al. [18] presentaron un enfoque para mejorar la usabilidad de un conjunto de texto de tamaño limitado a través de la expansión de términos. Esta técnica involucraba una lista de palabras de co-ocurrencia de términos basada en PMI. La lista de términos fue usada para expandir palabras en el vector de características. Posteriormente aplicaron un algoritmo de agrupación para inducir los sentidos de una palabra ambigua. La propuesta que se presenta en este artículo es una extensión del artículo presentado por Rojas-Lopez et al. [23], en el cual el enfoque de DSP, a diferencia de lo reportado en la literatura, recupera términos relacionados con la palabra a desambiguar usando el conjunto de texto de prueba. La extensión del trabajo consiste en la integración de las técnicas PMI y a la propuesta antes citada, lo cual inicialmente no se había contemplado. Con dicha integración se mejora la recuperación y ponderación de términos. III. EXPANSIÓN DE TÉRMINOS Es de gran beneficio expandir el contexto de la palabra ambigua con el objetivo de tener mayor evidencia contextual, de tal manera que se mejore la afectividad de la acepción seleccionada para una palabra ambigua. Es de gran beneficio expandir el contexto de la palabra ambigua con el objetivo de tener mayor evidencia contextual,

3 de tal manera que se mejore la afectividad de la acepción seleccionada para una palabra ambigua. En este artículo se implementan dos técnicas para expandir el contexto donde ocurre la palabra a desambiguar. Con las técnicas se agregan términos relacionados a cada instancia de una palabra ambigua mediante expansión de términos supervisada y no supervisada. Tal técnica consiste en medir el grado de correlación entre cada instancia de una palabra ambigua y cada término en el conjunto de texto de prueba. Para lograr este objetivo se implementaron dos técnicas (PMI y ), las cuales ya han sido usadas por su efectividad en diferentes tareas del PLN [18, 13]. A diferencia de PMI, la medida es usada para la prueba de hipótesis de independencia entre dos variables. Sin embargo, no es de nuestro interés discutir los aspectos estadísticos de la, una explicación más extensa puede verse en el libro de Manning y Schütze [13]. En este artículo sólo la usamos para medir el grado de correlación entre dos términos. Las técnicas de expansión de términos se explican a continuación. A. Expansión de términos supervisada Para la Expansión de Términos Supervisada (ETS) cada instancia en el conjunto de texto de prueba fue etiquetada por estudiantes lingüistas usando WordNet como repositorio de sentidos. El objetivo de esta técnica es agrupar las instancias a desambiguar de acuerdo a la acepción asignada por los etiquetadores, para así formar clases de acuerdo a su acepción. De esta manera los términos encontrados en cada clase estarán fuertemente asociados dado que pertenecen al mismo sentido. A continuación se explica el proceso de agrupar instancias. Sean,,, instancias de una palabra ambigua, cada instancia,(1 ) fue etiquetada con el sentido correcto. A continuación las instancias etiquetadas con el mismo sentido fueron agrupadas para formar el conjunto de clases denotado por =,,,. De esta manera cada clase está formada por las sentencias en las cuales ocurre, por lo tanto cada clase contiene un conjunto de términos,,,. A continuación para cada clase (1 ) fueron aplicadas PMI y para obtener el grado de asociación entre cada instancia ambigua y cada término. Como resultado se obtuvo una lista de términos, los cuales fueron ponderados de acuerdo al grado de asociación con. Esta lista de términos fue usada para expandir el contexto de cada instancia ambigua. B. Expansión de términos no supervisada Para la Expansión de Términos No Supervisada (ETNS) fueron agrupadas las instancias que pertenecen a una palabra ambigua para formar clases de palabras ambiguas independientemente de la acepción de cada instancia. Es decir, las instancias de una misma palabra ambigua pertenecen a distintos sentidos de acuerdo a WordNet. Por lo tanto, los términos asociados con cada clase son más heterogéneos respecto a la técnica ETS. En esta técnica todas las instancias forman una clase, es decir, obtenemos tantas clases como palabras ambiguas existen en el conjunto de texto de prueba. Nuevamente las técnicas PMI y fueron aplicadas para obtener una lista de términos ponderados cuyo valor indica el grado de asociación con la instancia. Al igual que en el enfoque supervisado, la lista de términos ponderados expande el contexto de cada instancia ambigua. IV. SELECCIÓN DE TÉRMINOS A continuación se describen brevemente las técnicas que se emplean para obtener el grado de correlación entre pares de términos. A. Pointwise Mutual Information Pointwise Mutual Information (PMI) [12] es un método usado para medir el grado de asociación entre dos términos. Esto se logra mediante el uso del traslape de información que ambos términos comparten (, ). Si se considera la ocurrencia de ambos términos como dos variables aleatorias entonces PMI mide dependencia mutua entre la aparición de los términos (, ). Para estimar el grado de correlación entre ambos términos se emplea la Ecuación 1, donde (, ) es la frecuencia de observar y juntos, dividido por frecuencia de observar y independientemente. (, )= (, ) ( ) ( ) B. Chi-square Otra alternativa para medir la independencia entre dos términos o grado de correlación entre un término y una categoría es la prueba de correlación denominada Chi-square ( ) [24]. En este caso es usada para examinar la independencia entre dos términos y. Se asume que los términos son independientes si (, ) = ( ) ( ) El valor entre dos términos se obtiene empleando la Ecuación 2. = ( ) donde O denota la frecuencia observada y E denota la frecuencia esperada entre los términos y. La frecuencia esperada (E) se obtienen aplicando la Ecuación 3. = (, ) (1) (2) (3)

4 donde (, ) denota las frecuencias observadas cuando los términos y co-ocurren. La probabilidad de ocurrencia de los términos y se obtiene dividiendo su valor de frecuencia por la suma de la frecuencia de todos los pares de términos denotado por, encontrados en un tamaño de ventana específico. La frecuencia observada entre y se obtiene multiplicando los factores = ( ), = ( ), ( ) ( ) donde ( ) y ( ) es la frecuencia de la palabra y en la ventana de contexto definida y ( ) y ( ) es la suma de las frecuencias en toda la clase. El valor de la frecuencia observada se obtiene multiplicando los factores,. V. EXPERIMENTOS A continuación se describe el trabajo experimental realizado con las técnicas de expansión de términos del enfoque propuesto. Los experimentos fueron llevados a cabo en conjuntos de textos que comprenden instancias ambiguas en diferentes dominios. Las siguientes secciones describen los conjuntos de textos usados en los experimentos así como los resultados obtenidos. A. Conjuntos de textos de prueba Los experimentos fueron llevados a cabo en los conjuntos de textos de prueba presentados por Koeling et al. [5], los cuales se encuentran públicamente disponibles. Los conjuntos de textos de prueba comprenden 41 ejemplos de palabras ambiguas relacionadas a los dominios de Deportes, Finanzas y uno de contenido general, el BNC (British National Corpus). El BNC está formado de 4 categorías básicas: educación, negocios, público/institucional y ocio. Los dominios de Deportes y Finanzas fueron extraídos desde el conjunto de texto Reuters. Las características de las palabras incorporadas en los conjuntos de textos de prueba representan un reto para evaluar la precisión en el proceso de desambiguación dado que el número promedio de sentidos para cada palabra ambigua es de 6.7 sentidos. Esto significa que cada palabra ambigua puede tener en promedio 6.7 posibles sentidos. B. Configuración experimental El contexto en que se encuentra una palabra ambigua contribuye a determinar la acepción de dicha palabra, dada la situación comunicativa de las palabras en el contexto. Para extraer el contexto donde ocurre la palabra ambigua se realizó una fase de pre-procesamiento sobre los conjuntos de textos de prueba. Esta fase consiste en asignar la categoría gramatical a cada término en la sentencia usando la herramienta Stanford POS tagger [25]; a continuación las palabras vacías fueron removidas, tales como artículos, preposiciones, conjunciones etc. Para seleccionar los términos contextuales se definió una ventana de contexto de tamaño 2 1, = 5, es decir, 5 términos a la derecha e izquierda de la palabra ambigua; en total la ventana tiene 11 términos considerando la palabra ambigua. A continuación se obtuvo el grado de correlación entre cada par de términos como se describe en la Sección IV. En ambas técnicas la frecuencia de co-ocurrencia entre los términos y debe ser mayor o igual a 2 con el objetivo de remover términos que son más probablemente ruidosos. C. Resultados obtenidos Para evaluar la efectividad del enfoque propuesto se aplicaron las medidas de RI, precision (P) y recall (R), como muestra la Tabla I. La tabla está dividida en dos secciones, la primera sección muestra los resultados obtenidos al usar PMI y como técnicas para ponderar la co-ocurrencia de términos en la ventana establecida, como fue indicado en la subsección anterior. La segunda sección muestra los resultados obtenidos por otros trabajos de la literatura que usan el mismo benchmark que nosotros. La tabla también muestra los resultados obtenidos por Koeling et al. [5] al combinar la información de todos los dominios. Cabe mencionar que el trabajo de Koeling et al. no lleva a cabo una desambiguación contextual, por lo tanto es más viable comparar nuestro enfoque con el trabajo presentado por Navigli et al. [10] y Rojas-Lopez et al. [23]. Los mejores resultados son obtenidos al evaluar PMI en ambas técnicas ETS y ETNS; por el contrario obtuvo resultados deficientes en ambas técnicas a excepción del dominio de Finanzas. TABLA I. RESULTADOS DE DSP EN DIFERENTES DOMINIOS DE PRUEBA. Algoritmo Deportes Finanzas BNC P R P R P R ETS PMI ETNS PMI Rojas-Lopez et al. [23] Navigli et al. [10] Koeling et al. [5] En la Tabla II se muestra el número de clases obtenidas por acepción (ETS) y por palabra ambigua (ETNS). También se muestra el número promedio de palabras obtenidas por clase; estos datos son obtenidos después de una fase de preprocesamiento aplicada a los conjuntos de textos de prueba. Creemos que el número de palabras en las clases afectó el desempeño de comparada con PMI. En consecuencia, en el enfoque propuesto PMI permite discriminar con mayor precisión términos ruidosos en comparación con. Se observa en la Tabla I que la técnica ETS obtuvo mejores resultados en términos de precision y recall. Consideramos que esto se debe a que las sentencias donde ocurre la palabra ambigua fueron agrupadas por acepción, es decir, los

5 contextos pertenecen a la acepción, lo cual garantiza que los términos con mayor frecuencia se encuentran fuertemente relacionados con la palabra a desambiguar, caso contrario a la técnica ETNS. Los espacios vacíos en la Tabla I indican que los autores no reportan los resultados en términos de precision o recall. TABLA II. NÚMERO DE CLASES Y PALABRAS OBTENIDAS POR CONJUNTO DE TEXTO DE PRUEBA. Supervisado No supervisado Clases Promedio de palabras por clase Clases Promedio de palabras por clase Deportes Finanzas BNC VI. DISCUSION El objetivo de las técnicas ETS y ETNS es expandir el contexto donde ocurre la palabra ambigua usando el conjunto de texto de prueba. ETS añade términos tomando ventaja de la acepción asignada a cada instancia ambigua. Por otro lado, ETNS agrupa contextos de instancias ambiguas que pertenecen a la misma palabra ambigua. Ambas técnicas obtienen valores de precisión y recall competitivos en relación con lo reportado en la literatura. Sin embargo, PMI mide mejor la correlación entre pares de términos que. La Tabla II muestra cómo se relaciona el número de acepciones (clases) encontradas por dominio en el enfoque ETS, con los resultados de precision y recall obtenidos en los experimentos (Tabla I). Por ejemplo, el dominio de Deportes tiene un menor número de acepciones, seguido por Finanzas y BNC. Los resultados obtenidos en términos de precision y recall siguen este mismo orden. Es decir, la probabilidad de que una palabra sea desambiguada en el dominio de Deportes es más alta comparada con Finanzas y BNC. Es importante mencionar que BNC no es un conjunto de textos de dominio específico. Sin embargo las técnicas de expansión de términos muestran que los términos recuperados desde el conjunto de texto de prueba mejoran la tarea DSP aún cuando el conjunto de texto de prueba no es de dominio específico. De la misma manera los resultados obtenidos por Rojas-lopez et al. [23] y los resultados presentados por Koeling et al. [5] muestran el mismo comportamiento a excepción de los resultados presentados por Navigli et al. [10]. VII. CONCLUSIONES En este estudio fueron explorados dos métodos para ponderar el grado de correlación entre pares de términos dentro de la tarea muestra léxica de DSP. Los métodos implementan las técnicas de Expansión de Términos Supervisada y No Supervisada. La técnica supervisada sugiere que los términos que pertenecen a sentencias cuyas palabras ambiguas pertenecen a la misma acepción contribuyen fuertemente en el proceso de desambiguación del sentido de la palabra. Por lo tanto es de nuestro interés implementar a futuro una técnica de agrupación de textos cortos como la propuesta por Pedersen [26] para agrupar de una manera no supervisada contextos relacionados con las sentencias donde ocurre la palabra ambigua. De acuerdo con los resultados obtenidos, no podemos afirmar que PMI tiene un mejor comportamiento que para medir la correlación entre términos porque el número de palabras presentes en cada clase es pequeño, por lo tanto existe una menor frecuencia. En consecuencia, como trabajo futuro implementaremos también una técnica de agrupación para recuperar contextos relacionados con las instancias ambiguas y evaluar el comportamiento de PMI y en un conjunto de contextos de mayor tamaño. REFERENCIAS [1] S. Pradhan, E. Loper, D. Dligach, and M. Palmer, "Semeval-2007 task-17: English lexical sample, SRL and all words", In Proceedings of the Fourth International Workshop on Semantic Evaluations, pp , [2] R. Navigli, "Word sense disambiguation: A survey", ACM Computing Surveys, [3] D. McCarthy, "Word Sense Disambiguation: An Overview", Language and Linguistics Compass, pp , [4] E. Gerard, M. Lluís, and R. German, "An Empirical Study of the Domain Dependence of Supervised Word Sense Disambiguation Systems", Proceedings of the 2000 Joint SIGDAT conference on Empirical methods in natural language processing and very large corpora: held in conjunction with the 38th Annual Meeting of the Association for Computational Linguistics, vol. 13, pp , [5] R. Koeling, D. McCarthy, and J. Carroll, "Domain-specific sense distributions and predominant sense acquisition", Association for Computational Linguistics, no. 8, pp , [6] J. Tejeda-Carcamo, H. Calvo, A. Gelbukh, and K. Hara, "Unsupervised WSD by finding the predominant sense using context as a dynamic thesaurus", Journal of Computer Science and Technology, vol. 25, no. 5, p. 10, Sep [7] D. McCarthy, R. Koeling, J. Weeds, and J. Carroll, "Unsupervised Acquisition of Predominant Word Senses", Computational Linguistics, vol. 33, no. 4, [8] Y. Guo, W. Che, T. Liu, and S. Li, "Semi-supervised domain adaptation for WSD: Using a word-by-word model selection approach", Proceedings 9th IEEE International Conference on Cognitive Informatics, p , [9] S. Faralli and R. Navigli, "A New Minimally-Supervised Framework for Domain Word Sense Disambiguation", Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2012, July 12-14, 2012, Jeju Island, Korea, pp , [10] R. Navigli, S. Faralli, A. Soroa, O. de Lacalle, and E. Agirre "Two birds with one stone: learning semantic models for text categorization and word sense disambiguation", Proceedings of the 20th ACM international conference on Information and knowledge management, pp , [11] E. Agirre, O. De lacalle, and A. Soroa, "Knowledge-based WSD on specific domains: performing better than generic supervised WSD", Proceedings of the 21st International Jont Conference on Artifical Intelligence, pp , [12] K. Church and Hanks, "Word association norms, mutual information, and lexicography", vol. 16, pp , [13] C. D. Manning and H. Schütze, Foundations of Statistical Natural Language Processing. MIT Press, 1999.

6 [14] J. Tuominen, K. Viljanen, E. Hyvönen, and T. Kauppinen, "Ontology- Based Query Expansion Widget for Information Retrieval", Proceedings of the 5th Workshop on Scripting and Development for the Semantic Web, 6th European Semantic Web Conference, [15] N.-L. Tesao, D. Wible, and C.-H. Kuo, "Feature expansion for word sense disambiguation", Natural Language Processing and Knowledge Engineering, Proceedings International Conference on, pp , [16] F. Tacoa, D. Bollegala, and M. Ishizuka, "A Context Expansion Method for Supervised Word Sense Disambiguation", Sixth IEEE International Conference on Semantic Computing, [17] S. Banerjee and T. Pedersen, "An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet", In CICLing 2002 conference, vol. 2276, pp , [18] D. Pinto, P. Rosso, and H. Jiménez-Salazar, "UPV-SI: word sense induction using self term expansion", Proceedings of the 4th International Workshop on Semantic Evaluations, pp , [19] Y. S. Chan and H. T. Ng, "Domain Adaptation with Active Learning for Word Sense Disambiguation", Association for Computational Linguistics, pp , Jun [20] E. Agirre and O. de La calle, "On robustness and domain adaptation using SVD for word sense disambiguation", Proceedings of the 22nd International Conference on Computational Linguistics, vol. 1, pp , [21] D. Lin, "Automatic retrieval and clustering of similar words", Proceedings of the 17th International Conference on Computational Linguistics, vol. 2, pp , [22] M. Lesk, "Automatic Sense Disambiguation Using Machine Readable Dictionaries: How to Tell a Pine Cone from an Ice Cream Cone", Proceedings of SIGDOC, pp , [23] F. Rojas-Lopez, I. Lopez-Arevalo, and V. J. Sosa-Sosa, "Improving selection of synsets for domain-specific Word Sense Disambiguation", Submitted to Language Resources and Evaluation, Springer, [24] Y. Yang and J. Pedersen, "A Comparative Study on Feature Selection in Text Categorization", Proceedings of the Fourteenth International Conference on Machine Learning, pp , [25] K. Toutanova, D. Klein, C. D. Manning, and Y. Singer, "Feature-Rich Part-of-Speech Tagging with a Cyclic Dependency Network", HLT- NAACL, [26] T. Pedersen, "Computational Approaches to Measuring the Similarity of Short Contexts : A Review of Applications and Methods", Computing Research Repository, vol. abs/ , Victor J. Sosa-Sosa is a full-time research-professor at Center for Research and Advanced Studies of the National Polytechnic Institute of Mexico (Cinvestav), campus Tamaulipas. He has a PhD in Computer Science from Technical University of Catalonia (UPC-Barcelona), was a visiting researcher in the Database and Information System group at Max Planck Institute für Informatik in Germany (Sep/12-Jul/13), his research interest and specialization areas are Databases and Distributed Systems. His work is focused on large scale information search (surface and deep Web), information extraction, integration (Web databases) and cloud storage. Franco Rojas-Lopez received his Master degree in Computer Science from Benemérita Universidad Autónoma de Puebla and his Ph.D. in Computer Science from Cinvestav- Tamaulipas. He is associate professor at Universidad Politécnica Metropolitana de Puebla. His current research interests are Semantic Web, Information Retrieval and Knowledge Representation and Management. Ivan Lopez-Arevalo is a full-time research-professor at the Information Technology Lab at Center for Research and Advanced Studies of the National Polytechnic Institute of Mexico (Cinvestav-Tamaulipas). He received a Ph.D. degree in Computing from Technical University of Catalonia (UPC, Barcelona). His research interests include different topics from data analysis on databases, Web and social networks, such as data mining, text mining, and knowledge representation and management. His work also includes soft computing in engineering. David Pinto is a full-time research-professor in the Faculty of Computer Science at the Benemérita Universidad Autónoma de Puebla (BUAP). He received his Ph.D. degree in Pattern Recognition & Artificial Intelligence from the Universidad Politécnica de Valencia (UPV, Spain). His research interests include different topics from information retrieval, clustering and analysis of short texts, machine reading evaluation, question-answering. He is the founder and the actual chief of the Language & Knowledge Engineering Lab at BUAP.

Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases

Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Emmanuel Anguiano-Hernández Abril 29, 2009 Abstract Tratando de mejorar el desempeño de un clasificador Naive

Más detalles

Integrando Información de Fuentes Relevantes para un Sistema Recomendador

Integrando Información de Fuentes Relevantes para un Sistema Recomendador Integrando Información de Fuentes Relevantes para un Sistema Recomendador Silvana Aciar, Josefina López Herrera and Javier Guzmán Obando Agents Research Laboratory University of Girona {saciar, jguzmano}@eia.udg.es,

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

Recuperación de información visual utilizando descriptores conceptuales

Recuperación de información visual utilizando descriptores conceptuales Recuperación de información visual utilizando descriptores conceptuales J. Benavent, X. Benavent y E. de Ves Departament d Informàtica (Universitat de València) {esther.deves,xaro.benavent}@uv.es Abstract.

Más detalles

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012 Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar

Más detalles

Clasificación Bayesiana de textos y páginas web

Clasificación Bayesiana de textos y páginas web Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en

Más detalles

Propuesta de proyecto de investigación: desarrollo de un rastreador web capaz de aprender a identificar la información más relevante

Propuesta de proyecto de investigación: desarrollo de un rastreador web capaz de aprender a identificar la información más relevante Propuesta de proyecto de investigación: desarrollo de un rastreador web capaz de aprender a identificar la información más relevante 30 de enero de 2016 Responsables Dr. Ricardo Marcelín Jiménez y M. en

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

UNIDAD I: LÓGICA PROPOSICIONAL

UNIDAD I: LÓGICA PROPOSICIONAL UNIDAD I: LÓGICA PROPOSICIONAL ASIGNATURA: INTRODUCCIÓN A LA COMPUTACIÓN CARRERAS: LICENCIATURA Y PROFESORADO EN CIENCIAS DE LA COMPUTACIÓN DEPARTAMENTO DE INFORMÁTICA FACULTAD DE CIENCIAS FÍSICO MATEMÁTICA

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

Base de datos en Excel

Base de datos en Excel Base de datos en Excel Una base datos es un conjunto de información que ha sido organizado bajo un mismo contexto y se encuentra almacenada y lista para ser utilizada en cualquier momento. Las bases de

Más detalles

Capítulo VI. Conclusiones. En este capítulo abordaremos la comparación de las características principales y

Capítulo VI. Conclusiones. En este capítulo abordaremos la comparación de las características principales y Capítulo VI Conclusiones En este capítulo abordaremos la comparación de las características principales y de las ventajas cada tecnología Web nos ofrece para el desarrollo de ciertas aplicaciones. También

Más detalles

Capítulo IV. Implementación del Sistema

Capítulo IV. Implementación del Sistema La implementación del sistema consiste en la integración de la aplicación en una LAN, la instalación en varias computadoras personales de clientes del almacén, de administradores de almacén y de los almacenes

Más detalles

activuspaper Text Mining and BI Abstract

activuspaper Text Mining and BI Abstract Text Mining and BI Abstract Los recientes avances en lingüística computacional, así como la tecnología de la información en general, permiten que la inserción de datos no estructurados en una infraestructura

Más detalles

Redes de Kohonen y la Determinación Genética de las Clases

Redes de Kohonen y la Determinación Genética de las Clases Redes de Kohonen y la Determinación Genética de las Clases Angel Kuri Instituto Tecnológico Autónomo de México Octubre de 2001 Redes Neuronales de Kohonen Las Redes de Kohonen, también llamadas Mapas Auto-Organizados

Más detalles

Curso Excel Básico - Intermedio

Curso Excel Básico - Intermedio Curso Excel Básico - Intermedio Clase 4 Relator: Miguel Rivera Adonis Introducción Base de Datos: Definición de Base de Datos Ordenar datos Formulario Filtros Trabajar con Sub-Totales Validación de Datos

Más detalles

Introducción. Metadatos

Introducción. Metadatos Introducción La red crece por momentos las necesidades que parecían cubiertas hace relativamente poco tiempo empiezan a quedarse obsoletas. Deben buscarse nuevas soluciones que dinamicen los sistemas de

Más detalles

Administración del conocimiento y aprendizaje organizacional.

Administración del conocimiento y aprendizaje organizacional. Capítulo 2 Administración del conocimiento y aprendizaje organizacional. 2.1 La Importancia Del Aprendizaje En Las Organizaciones El aprendizaje ha sido una de las grandes necesidades básicas del ser humano,

Más detalles

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:

Más detalles

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

Construcción de cubos OLAP utilizando Business Intelligence Development Studio Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange

Más detalles

CAPITULO I: PLANTEAMIENTO DEL PROBLEMA

CAPITULO I: PLANTEAMIENTO DEL PROBLEMA CAPITULO I: PLANTEAMIENTO DEL PROBLEMA 1.1. DESCRIPCIÓN DEL PROBLEMA En la actualidad, es importante la preparación profesional para la inserción al campo laboral ya que día a día las exigencias son mayores

Más detalles

Nota 2. Luis Sierra. Marzo del 2010

Nota 2. Luis Sierra. Marzo del 2010 Nota 2 Luis Sierra Marzo del 2010 Cada mecanismo de definición de conjuntos que hemos comentado sugiere mecanismos para definir funciones y probar propiedades. Recordemos brevemente qué son las funciones

Más detalles

1.4.- D E S I G U A L D A D E S

1.4.- D E S I G U A L D A D E S 1.4.- D E S I G U A L D A D E S OBJETIVO: Que el alumno conozca y maneje las reglas empleadas en la resolución de desigualdades y las use para determinar el conjunto solución de una desigualdad dada y

Más detalles

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 52(6):460-475, 2001 Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach

Más detalles

Observatorio Bancario

Observatorio Bancario México Observatorio Bancario 2 junio Fuentes de Financiamiento de las Empresas Encuesta Trimestral de Banco de México Fco. Javier Morales E. fj.morales@bbva.bancomer.com La Encuesta Trimestral de Fuentes

Más detalles

El almacén de indicadores de proceso de negocio en ejecución

El almacén de indicadores de proceso de negocio en ejecución X Congreso de Ingeniería de Organización Valencia, 7 y 8 de septiembre de 2006 El almacén de indicadores de proceso de negocio en ejecución Andrés Boza García 1, Angel Ortiz Bas 1, Llanos Cuenca Gonzalez

Más detalles

Probabilidades y Estadística (Computación) Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Ana M. Bianco y Elena J.

Probabilidades y Estadística (Computación) Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Ana M. Bianco y Elena J. Generación de Números Aleatorios Números elegidos al azar son útiles en diversas aplicaciones, entre las cuáles podemos mencionar: Simulación o métodos de Monte Carlo: se simula un proceso natural en forma

Más detalles

Profesora Patrocinante: Sr. John Atkinson. Alumna Srta. Carolina Zambrano M. Fecha 24 de Abril de 2006.

Profesora Patrocinante: Sr. John Atkinson. Alumna Srta. Carolina Zambrano M. Fecha 24 de Abril de 2006. Propuesta Proyecto de Memoria de Título Diseño e Implementación de un Prototipo de Call Center automatizado usando técnicas para tratamiento de lenguaje natural. Profesora Patrocinante: Sr. John Atkinson.

Más detalles

DE VIDA PARA EL DESARROLLO DE SISTEMAS

DE VIDA PARA EL DESARROLLO DE SISTEMAS MÉTODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS 1. METODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS CICLO DE VIDA CLÁSICO DEL DESARROLLO DE SISTEMAS. El desarrollo de Sistemas, un proceso

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3.

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3. GANTT, PERT y CPM Características Conseguir una buena programación es un reto, no obstante es razonable y alcanzable. Ella debe tener el compromiso del equipo al completo, para lo cual se recomienda que

Más detalles

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013

Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013 Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS Máster en Lenguajes y Sistemas Informáticos:

Más detalles

Introducción a Protégé

Introducción a Protégé FACULTAD DE INFORMÁTICA LICENCIATURA EN DOCUMENTACIÓN SISTEMAS DE REPRESENTACIÓN Y PROCESAMIENTO AUTOMÁTICO DEL CONOCIMIENTO Práctica 1 1ª Parte Introducción a Protégé Febrero 2003 1. Objetivo La presente

Más detalles

Técnicas de valor presente para calcular el valor en uso

Técnicas de valor presente para calcular el valor en uso Normas Internacionales de Información Financiera NIC - NIIF Guía NIC - NIIF NIC 36 Fundación NIC-NIIF Técnicas de valor presente para calcular el valor en uso Este documento proporciona una guía para utilizar

Más detalles

capitulo3 MARCO TEÓRICO Para el diseño de la reubicación de los procesos se hará uso de la Planeación

capitulo3 MARCO TEÓRICO Para el diseño de la reubicación de los procesos se hará uso de la Planeación capitulo3 MARCO TEÓRICO Para el diseño de la reubicación de los procesos se hará uso de la Planeación Sistemática de Layout, SLP por sus siglas en inglés. Se hará uso de la simulación para comparar el

Más detalles

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 2, Febrero 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Autor:

Más detalles

TEORÍA CLÁSICA DE MEDICIÓN TC Y TEORÍA DE RESPUESTA AL ITEM TRI

TEORÍA CLÁSICA DE MEDICIÓN TC Y TEORÍA DE RESPUESTA AL ITEM TRI TEORÍA CLÁSICA DE MEDICIÓN TC Y TEORÍA DE RESPUESTA AL ITEM TRI UNIVERSIDAD DE CHILE VICERRECTORÍA DE ASUNTOS ACADÉMICOS Departamento de Evaluación, Medición y Registro Educacional DEMRE ABRIL DE 2005

Más detalles

Medias Móviles: Señales para invertir en la Bolsa

Medias Móviles: Señales para invertir en la Bolsa www.gacetafinanciera.com Medias Móviles: Señales para invertir en la Bolsa Juan P López..www.futuros.com Las medias móviles continúan siendo una herramienta básica en lo que se refiere a determinar tendencias

Más detalles

Impactos económicos del gasto turístico. Capítulo 7

Impactos económicos del gasto turístico. Capítulo 7 Impactos económicos del gasto turístico Capítulo 7 IMPACTOS ECONÓMICOS DEL GASTO PÚBLICO 7. IMPACTOS ECONÓMICOS DEL GASTO TURÍSTICO. En este capítulo se va a estimar el peso del turismo en la actividad

Más detalles

La tutoría para la dirección de proyectos de investigación. Darder Mesquida, Antònia antonia.darder@uib.es. Universitat de les Illes Balears.

La tutoría para la dirección de proyectos de investigación. Darder Mesquida, Antònia antonia.darder@uib.es. Universitat de les Illes Balears. La tutoría para la dirección de proyectos de investigación. Resumen Darder Mesquida, Antònia antonia.darder@uib.es Universitat de les Illes Balears. Se presenta un modelo de tutoría docente para la dirección

Más detalles

RELACIONES DE RECURRENCIA

RELACIONES DE RECURRENCIA Unidad 3 RELACIONES DE RECURRENCIA 60 Capítulo 5 RECURSIÓN Objetivo general Conocer en forma introductoria los conceptos propios de la recurrencia en relación con matemática discreta. Objetivos específicos

Más detalles

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos 2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven

Más detalles

LiLa Portal Guía para profesores

LiLa Portal Guía para profesores Library of Labs Lecturer s Guide LiLa Portal Guía para profesores Se espera que los profesores se encarguen de gestionar el aprendizaje de los alumnos, por lo que su objetivo es seleccionar de la lista

Más detalles

RESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea

RESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea RESULTADOS CONSULTA CIUDADANA VIRTUAL Consulta Laboral en Línea Septiembre, 2015 1 Agradecimientos Ponemos a disposición de ustedes los resultados de la Consulta Ciudadana Virtual, efectuada en julio de

Más detalles

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido

Tema 3. Medidas de tendencia central. 3.1. Introducción. Contenido Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6

Más detalles

Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI

Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI Ricardo Köller Jemio Departamento de Ciencias Exactas e Ingeniería, Universidad

Más detalles

Operaciones Morfológicas en Imágenes Binarias

Operaciones Morfológicas en Imágenes Binarias Operaciones Morfológicas en Imágenes Binarias Introducción La morfología matemática es una herramienta muy utilizada en el procesamiento de i- mágenes. Las operaciones morfológicas pueden simplificar los

Más detalles

MODELOS DE RECUPERACION

MODELOS DE RECUPERACION RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN INGENIERÍA INFORMÁTICA RECUPERACIÓN Y ACCESO A LA INFORMACIÓN MODELOS DE RECUPERACION AUTOR: Rubén García Broncano NIA 100065530 grupo 81 1 INDICE 1- INTRODUCCIÓN

Más detalles

Diseño ergonómico o diseño centrado en el usuario?

Diseño ergonómico o diseño centrado en el usuario? Diseño ergonómico o diseño centrado en el usuario? Mercado Colin, Lucila Maestra en Diseño Industrial Posgrado en Diseño Industrial, UNAM lucila_mercadocolin@yahoo.com.mx RESUMEN En los últimos años el

Más detalles

LOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1

LOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1 LOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1 Horacio Ramírez de Alba* En este escrito se presenta un panorama de la profesión de la ingeniería y su relación con el desarrollo del país, y a partir de ello

Más detalles

Para comprender las evaluaciones educativas Fichas didacticas

Para comprender las evaluaciones educativas Fichas didacticas Para comprender las evaluaciones educativas Fichas didacticas Ficha 14 Pedro Ravela + ficha nº 14 las preguntas que el lector debe hacerse ante un informe de resultados La ficha Nº 14 intenta ser un resumen

Más detalles

Clasificación Automática de Textos de Desastres Naturales en México

Clasificación Automática de Textos de Desastres Naturales en México Clasificación Automática de Textos de Desastres Naturales en México Alberto Téllez-Valero, Manuel Montes-y-Gómez, Olac Fuentes-Chávez, Luis Villaseñor-Pineda Instituto Nacional de Astrofísica, Óptica y

Más detalles

Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.

Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula. Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.ve Resumen: se describe la implementación experimental de

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

DISEÑO DE INDICADORES DE DESIGUALDAD SOCIAL EN LAS CIUDADES.-

DISEÑO DE INDICADORES DE DESIGUALDAD SOCIAL EN LAS CIUDADES.- DISEÑO DE INDICADORES DE DESIGUALDAD SOCIAL EN LAS CIUDADES.- 1. Introducción. El presente documento es el referente metodológico para la selección inicial de los barrios deprimidos. Se recoge una propuesta

Más detalles

Fórmulas y enfoques utilizados para calcular el Tasa Efectiva de Interés (TEI) o Costo Anual Total (CAT)

Fórmulas y enfoques utilizados para calcular el Tasa Efectiva de Interés (TEI) o Costo Anual Total (CAT) Fórmulas y enfoques utilizados para calcular el Tasa Efectiva de Interés (TEI) o Costo Anual Total (CAT) El propósito del Costo Anual Total (CAT) El precio verdadero del préstamo no solamente incluye los

Más detalles

Manual Operativo Sistema de Postulación Online

Manual Operativo Sistema de Postulación Online Manual Operativo Sistema de Postulación Online Este Manual está diseñado en forma genérica para apoyar el proceso de postulación en línea, las Bases de cada Concurso definen los requerimientos oficiales

Más detalles

Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información

Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información Mestrado Universitario Língua e usos profesionais Miguel A. Alonso Jesús Vilares Departamento de Computación Facultad

Más detalles

La Web Semántica como herramienta para e-learning

La Web Semántica como herramienta para e-learning La Web Semántica como herramienta para e-learning Lidia Marina López llopez@uncoma.edu.ar Departamento de Ciencias de la Computación Universidad Nacional del Comahue Buenos Aires 1400 8300 Neuquén Tel.

Más detalles

CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN. El ámbito de los negocios en la actualidad es un área donde que cada vez más

CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN. El ámbito de los negocios en la actualidad es un área donde que cada vez más CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN El ámbito de los negocios en la actualidad es un área donde que cada vez más se requieren estudios y análisis con criterios de carácter científico a fin de poder

Más detalles

El impacto que UNETE ha generado en las comunidades escolares, no sólo refiere a los beneficios

El impacto que UNETE ha generado en las comunidades escolares, no sólo refiere a los beneficios MPACTO EDUCATIVO Evaluaciones El impacto que UNETE ha generado en las comunidades escolares, no sólo refiere a los beneficios per se que las escuelas reciben; hoy hemos podido realizar 3 importantes investigaciones

Más detalles

7. Conclusiones. 7.1 Resultados

7. Conclusiones. 7.1 Resultados 7. Conclusiones Una de las preguntas iniciales de este proyecto fue : Cuál es la importancia de resolver problemas NP-Completos?. Puede concluirse que el PAV como problema NP- Completo permite comprobar

Más detalles

CAPÍTULO 1 INTRODUCCIÓN. En México existen miles de micro, pequeñas y medianas empresas que constituyen una

CAPÍTULO 1 INTRODUCCIÓN. En México existen miles de micro, pequeñas y medianas empresas que constituyen una CAPÍTULO 1 INTRODUCCIÓN En México existen miles de micro, pequeñas y medianas empresas que constituyen una parte importante de la producción y economía del país, y que en su mayoría no tienen fácil acceso

Más detalles

ESTUDIAR MATEMATICA EN CASA

ESTUDIAR MATEMATICA EN CASA ESTUDIAR MATEMATICA EN CASA Sugerencias para docentes Sea cual fuere el enfoque de enseñanza de la matemática adoptado, todos los docentes acuerdan en la importancia del tiempo extraescolar dedicado al

Más detalles

Unidad 1. Fundamentos en Gestión de Riesgos

Unidad 1. Fundamentos en Gestión de Riesgos 1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.

Más detalles

E-PROCUREMENT PARA FACILITAR LA INTEGRACIÓN EN LA SUPPLY CHAIN

E-PROCUREMENT PARA FACILITAR LA INTEGRACIÓN EN LA SUPPLY CHAIN E-PROCUREMENT PARA FACILITAR LA INTEGRACIÓN EN LA SUPPLY CHAIN Con cada vez mayores presiones de la competencia, cada vez más las empresas utilizan las adquisiciones electrónicas (eprocurement) en un intento

Más detalles

Sistemas de Recuperación de Información

Sistemas de Recuperación de Información Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/ Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy

Más detalles

Servicio de Apoyo a la Investigación. Tutorial EndNoteWeb

Servicio de Apoyo a la Investigación. Tutorial EndNoteWeb Servicio de Apoyo a la Investigación Tutorial EndNoteWeb I AÑADIR REFERENCIAS. LA PESTAÑA COLLECT Collect es la pestaña que se utiliza para añadir referencias a nuestra biblioteca. Se pueden añadir hasta

Más detalles

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación Validation Validación Psicométrica L art de l évaluation Validation Central Test Central Test Centraltest L art de l évaluation CENTRAL test.com El arte de la evaluación www.centraltest.com Propiedades

Más detalles

Método de desambiguación léxica basada en el recurso léxico Dominios Relevantes

Método de desambiguación léxica basada en el recurso léxico Dominios Relevantes Método de desambiguación léxica basada en el recurso léxico Dominios Relevantes Sonia Vázquez y Andrés Montoyo Grupo de Procesamiento del Lenguaje y Sistemas de Información Departamento de Lenguajes y

Más detalles

2.1 INFORMACION BASICA Y PRINCIPALES DEFINICIONES.

2.1 INFORMACION BASICA Y PRINCIPALES DEFINICIONES. 2 - PROPIEDAD COMÚN. 2.1 INFORMACION BASICA Y PRINCIPALES DEFINICIONES. En esta oportunidad se adelanta información correspondiente a una nueva serie con las variables de interés en las Compraventas de

Más detalles

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta 6 Conclusiones Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta investigación aporta evidencia de la existencia de cambios en los determinantes del desempleo durante

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

MODELOS DE SIMULACIÓN

MODELOS DE SIMULACIÓN MODELOS DE SIMULACIÓN En general, se llama modelo a la imagen o representación de un sistema, generalmente simplificada e incompleta. Y se llama simulación a la experimentación con un modelo para extraer

Más detalles

PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES

PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES Raúl Palma G. y Guillermo Bustos R. Escuela de Ingeniería Industrial Universidad Católica de Valparaíso Casilla

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores Martha Alicia Alles Es contadora pública nacional, doctora por la Universidad de Buenos Aires en la especialidad

Más detalles

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1.1 Introducción Este método proporciona un soporte para el diseño creativo de productos de software, inclusive a escala industrial.

Más detalles

GUÍA BÁSICA USUARIO MOODLE 2.6

GUÍA BÁSICA USUARIO MOODLE 2.6 GUÍA BÁSICA USUARIO MOODLE 2.6 Esta guía representa los pasos a seguir por el alumno desde la aceptación en un curso Moodle hasta su posterior utilización, pero antes de explicar la forma de acceder y

Más detalles

Clase 4: Probabilidades de un evento

Clase 4: Probabilidades de un evento Clase 4: Probabilidades de un evento Definiciones A continuación vamos a considerar sólo aquellos experimentos para los que el EM contiene un número finito de elementos. La probabilidad de la ocurrencia

Más detalles

Impacto de la ironía en la minería de opiniones basada en un léxico afectivo

Impacto de la ironía en la minería de opiniones basada en un léxico afectivo Impacto de la ironía en la minería de opiniones basada en un léxico afectivo Yolanda Raquel Baca-Gómez a, Delia Irazú Hernández Farías b, Paolo Rosso b, Noé Alejandro Castro-Sánchez a, Alicia Martínez

Más detalles

Experiencias de la Televisión Digital Interactiva en Colombia - ARTICA

Experiencias de la Televisión Digital Interactiva en Colombia - ARTICA Experiencias de la Televisión Digital Interactiva en Colombia - ARTICA JUAN CARLOS MONTOYA Departamento de Ingeniería de Sistemas, Universidad EAFIT - Centro de Excelencia en ETI - ARTICA Medellín, Colombia

Más detalles

DISEÑO Y CÁLCULO DE UN ORDENAMIENTO RANKING DE ENTIDADES PROMOTORAS DE SALUD INFORME EJECUTIVO DE LA METODOLOGIA

DISEÑO Y CÁLCULO DE UN ORDENAMIENTO RANKING DE ENTIDADES PROMOTORAS DE SALUD INFORME EJECUTIVO DE LA METODOLOGIA DISEÑO Y CÁLCULO DE UN ORDENAMIENTO RANKING DE ENTIDADES PROMOTORAS DE SALUD Diseño y cálculo de un ordenamiento de Entidades Promotoras de Salud (EPS) Facultad de Ciencias Económicas Centro de Investigaciones

Más detalles

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. 2.1 Revisión sistema reconocimiento caracteres [9]: Un sistema de reconocimiento típicamente esta conformado por

Más detalles

TPVFÁCIL. Caja Real. Definiciones.

TPVFÁCIL. Caja Real. Definiciones. TPVFÁCIL. Caja Real. TPVFÁCIL incluye desde la versión 3.3.2 la posibilidad de manejar dos cajas, la Caja Real y la Caja normal. La idea es esconder los datos de caja que pueden alcanzar los usuarios no

Más detalles

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007 Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el

Más detalles

La enseñanza del español de los negocios. Propuestas metodológicas y organización de proyectos Carlos Barroso 1 Universidad de Málaga (España)

La enseñanza del español de los negocios. Propuestas metodológicas y organización de proyectos Carlos Barroso 1 Universidad de Málaga (España) La enseñanza del español de los negocios. Propuestas metodológicas y organización de proyectos Carlos Barroso 1 Universidad de Málaga (España) La enseñanza de español como segunda lengua con fines específicos

Más detalles

EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO

EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO I. INTRODUCCIÓN Beatriz Meneses A. de Sesma * En los estudios de mercado intervienen muchas variables que son importantes para el cliente, sin embargo,

Más detalles

Midiendo el costo económico 1

Midiendo el costo económico 1 Midiendo el costo económico 1 Esta sección tiene como objetivo realizar una estimación de los costos de migración de los RHUS, especialmente de los médicos y las enfermeras. Para obtener el costo de entrenamiento

Más detalles

Espacios generados, dependencia lineal y bases

Espacios generados, dependencia lineal y bases Espacios generados dependencia lineal y bases Departamento de Matemáticas CCIR/ITESM 14 de enero de 2011 Índice 14.1. Introducción............................................... 1 14.2. Espacio Generado............................................

Más detalles

Plan de Evaluación. Parcial I...20% Taller I... 5% Parcial II...20% Taller II...5% Parcial III...20% Exposición...10% Proyecto...15% Asistencia...

Plan de Evaluación. Parcial I...20% Taller I... 5% Parcial II...20% Taller II...5% Parcial III...20% Exposición...10% Proyecto...15% Asistencia... Plan de Evaluación Parcial I...20% Taller I... 5% Parcial II...20% Taller II...5% Parcial III...20% Exposición...10% Proyecto...15% Asistencia...5% 1 REDES Toda organización alguna vez tiene que enfrentar

Más detalles

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES DE BÁSICA PRIMARIA EN LA CIUDAD DE PEREIRA José R. Bedoya Universidad Tecnológica de Pereira Pereira, Colombia La formación estadística en la ciudadanía,

Más detalles

Evaluación Adaptativa de Inglés en el Sistema Educativo uruguayo, 2014. Resumen Ejecutivo

Evaluación Adaptativa de Inglés en el Sistema Educativo uruguayo, 2014. Resumen Ejecutivo Introducción Evaluación Adaptativa de Inglés en el Sistema Educativo uruguayo, 2014. Resumen Ejecutivo Departamento de Segundas Lenguas y Lenguas Extranjeras del CEIP Programa Ceibal en Ingles Plan Ceibal

Más detalles

Cómo hacer un mapa conceptual paso a paso

Cómo hacer un mapa conceptual paso a paso Esta guía corresponde a una adaptación de la guía Cómo hacer un mapa conceptual paso a paso de Talleres de adaptación e innovación tecnológica para el Espacio Europeo de Educación Superior IUED - UNED

Más detalles

Contribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual

Contribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual Contribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual Sonia Vázquez, Zornitsa Kozareva y Andrés Montoyo Departamento de Lenguajes y Sistemas

Más detalles

Las comunicaciones y los sistemas de producción

Las comunicaciones y los sistemas de producción Las comunicaciones y los sistemas de producción Uno de los aspectos más avanzados en los sistemas de producción industrial actual, son las normativas que se relacionan con la protección del medio ambiente.

Más detalles