Context Expansion for Domain-Specific Word Sense Disambiguation
|
|
- Adolfo Cabrera Alarcón
- hace 8 años
- Vistas:
Transcripción
1 Context Expansion for Domain-Specific Word Sense Disambiguation F. Rojas, I. Lopez, D. Pinto and V. J. Sosa Abstract 1 Two novel techniques based on term expansion for domain-specific Word Sense Disambiguation are presented in this paper. A list of terms correlated with the ambiguous word is obtained by means of correlation methods such as Pointwise Mutual Information and Chi-square. The list of correlated terms is used for expanding the context in which an ambiguous word occurs, thus leading to a better number of terms which may be further used for determining the correct sense of the target ambiguous word. The proposed method has been tested in domain-specific corpora (Finance and Sports) and in one balanced corpus, the British National Corpus (BNC). The obtained results for domain-specific corpora are competitive (Finance) and ever better (Sports and BNC) than those reported in previous works. Keywords Word sense disambiguation, specific domain, synset, WordNet, context expansion D I. INTRODUCCIÓN ESAMBIGUACIÓN del sentido de la palabra (DSP) es una tarea abordada desde hace varias décadas en el área de Lingüística Computacional (LC). DSP consiste en asignar el sentido correcto a una palabra ambigua considerando el contexto en el cual ocurre. De acuerdo con el Semeval [1], DSP se divide en dos tipos: muestra léxica (lexical sample) y todas las palabras (all-words), la primera consiste en seleccionar el sentido correcto para una palabra ambigua en una frase; la segunda trata de desambiguar todas las palabras de un texto. Se han propuesto diferentes enfoques para resolver la tarea genérica de DSP (supervisado, no supervisado, semi-supervisado, entre otros) [2, 3]. Por otro lado, DSP aplicado a dominios diferentes (cuando el dominio fuente y el objetivo son distintos), representa grandes desafíos, por ejemplo 1) resultados experimentales han mostrado una caída en el desempeño cuando el conjunto de texto de entrenamiento y de prueba pertenecen a dominios diferentes [4]; 2) la necesidad de reentrenar el sistema de DSP en cada nuevo dominio. En consecuencia se han propuesto métodos diferentes con el objetivo de resolver tales desafíos, como F. Rojas, Universidad Politécnica Metropolitana de Puebla, Puebla, México, frojas@tamps.cinvestav.mx I. Lopez, Cinvestav - Tamaulipas, Victoria, México, ilopez@tamps.cinvestav.mx D. Pinto, Benemérita Universidad Autónoma de Puebla, Puebla, México, dpinto@cs.buap.mx V. J. Sosa, Cinvestav - Tamaulipas, Victoria, México, vjsosa@tamps.cinvestax.mx adquisición del sentido predominante [5, 6, 7]; enfoques semisupervisados [8, 9] y basados en conocimiento [10, 11]. En este artículo presentamos un enfoque de DSP de muestra léxica basado en conocimiento para desambiguar instancias en conjuntos de textos en inglés de diferente dominio. El método recupera un conjunto de términos en una ventana de tamaño específico. Estos términos son usados para expandir el contexto donde se encuentra la palabra ambigua. Se proponen dos técnicas de expansión de términos para formar clases de instancias: 1) Expansión de Términos Supervisada (ETS) y 2) Expansión de Términos No Supervisada (ETNS). Una vez formadas las clases se aplican las técnicas Pointwise Mutual Information (PMI) [12] y Chi-cuadrada ( ) [13] para medir el grado de correlación entre pares de términos. Los términos recuperados son usados para expandir el contexto en cual ocurre una instancia ambigua. El objetivo de las técnicas propuestas es tener mayor evidencia contextual. De esta manera, no sólo consideramos las palabras en el contexto de una instancia ambigua, sino que también, palabras en todo el conjunto de texto de prueba donde se encuentra la palabra a desambiguar. La técnica de expansión de términos ha sido aplicada en el Procesamiento del Lenguaje Natural (PLN) para diversas tareas, por ejemplo, en Recuperación de Información (RI) para expandir la consulta dada por el usuario, en inducción del sentido de la palabra, en DSP, entre otras. Usualmente este proceso es llevado a cabo mediante el uso de un tesauro, una base de datos léxica u ontologías, etc. Por ejemplo, Tuominen et al. [14] usaron un método basado en ontologías para llevar a cabo el proceso de expansión de consultas y mejorar los resultados de un sistema de RI. En la literatura se han reportado varias propuestas de expansión de términos en DSP [15, 16, 17, 18]. El enfoque que se propone en este artículo está relacionado con el trabajo presentado por Pinto et al. [18], quienes propusieron un enfoque no supervisado de expansión de términos para la tarea Word Sense Induction and Discrimination System, presentado en el SemEval 2007 (International Workshop on Semantic Evaluation). En este sentido consideramos que el uso de términos recuperados desde el conjunto de texto de prueba puede ser de alto beneficio para la tarea de DSP en dominios específicos. De esta manera contribuimos con dos técnicas para expandir el contexto de instancias ambiguas. Los experimentos realizados sobre conjuntos de textos de diferente dominio muestran que
2 ETS obtiene mejores resultados en el dominio de Deportes y en el British National Corpus (BNC). En el dominio de Finanzas se obtuvieron resultados competitivos de acuerdo con lo reportado en la literatura. El resto del artículo está estructurado de la siguiente manera: en la Sección II se describe el trabajo relacionado con DSP en dominios específicos. La Sección III muestra los detalles de las técnicas de expansión de términos. La Sección IV describe los conjuntos de textos de prueba usados en los experimentos así como los resultados obtenidos. En la Sección V se discuten los experimentos llevados a cabo. Finalmente las conclusiones y trabajo futuro se describen en la Sección VI. II. TRABAJO RELACIONADO En la literatura se ha reportado un gran número de enfoques de DSP [2, 3], estos enfoques principalmente abordan el problema genérico de desambiguación. Sin embargo, el interés en dominios específicos se ha incrementado, dado que un sistema de desambiguación no garantiza su desempeño cuando se mueve de un dominio a otro. Es decir, cuando el conjunto de texto de evaluación es diferente al conjunto de texto de entrenamiento [4, 19]. En este contexto Chan y Ng [19] abordan el problema usando un algoritmo de aprendizaje supervisado Näive Bayes. Los autores agregaron ejemplos de entrenamiento desde el nuevo dominio como datos adicionales al sistema de DSP. De esta manera mostraron que el uso del sentido predominante del dominio objetivo mejoró el proceso de adaptación al nuevo dominio. Agirre y de Lacalle [20] propusieron un enfoque semi-supervisado de DSP, usaron descomposición de valores singulares y datos no etiquetados para obtener una mejor adaptación desde un conjunto de texto de propósito general (BNC) a un conjunto de texto de dominio específico (Deportes o Finanzas). De manera similar Guo et al. [8] presentaron un enfoque diferente en relación a trabajos previos de adaptación de dominio [19, 20], afirmaban que el mismo modelo era usado para desambiguar todas las palabras, a pesar de la diferencia existente entre ellas. Para mejorar el problema de adaptación de dominio construyeron un conjunto de modelos candidatos para cada palabra ambigua. El modelo a usar era seleccionado automáticamente desde el conjunto de modelos candidatos. Navigli et al. [10] propusieron un algoritmo para ponderar acepciones de la palabra a desambiguar, para ello recuperaron términos relevantes desde texto de dominio específico. Los términos relevantes fueron usados para inicializar un randow walk sobre el grafo de WordNet. De esta manera construyeron un modelo semántico para cada dominio. Los modelos semánticos fueron aplicados en categorización de textos y DSP en dominios específicos. Otro enfoque aplicado a DSP en diferentes dominios fue presentado por Koeling et al. [5]. En dicho enfoque se construye un tesauro desde un conjunto de texto de dominio específico usando el método de Lin [21]. El tesauro fue usado para recuperar los primeros top-k vecinos más cercanos para cada palabra ambigua; posteriormente fue usada una medida de similitud semántica implementada sobre WordNet para comparar cada acepción de la palabra vecina con cada acepción de la palabra a desambiguar. La acepción con el mejor puntaje era seleccionada para desambiguar cada palabra. Es importante indicar que el trabajo mencionado no lleva a cabo una desambiguación contextual. Por otro lado, varios trabajos han sido reportados en la literatura para enfrentar el problema de escasez de datos, es decir, cuando las características contextuales no son suficientes para DSP. Por ejemplo Tsao et al. [15] llevaron a cabo un proceso para expandir el contexto de instancias ambiguas. Las características expandidas fueron extraídas desde el conjunto de texto de prueba y WordNet para mejorar los resultados de un sistema de DSP, usando un algoritmo de aprendizaje supervisado Näive Bayes. Asimismo Tacoa et al. [16] evaluaron una técnica de expansión de términos en un sistema de DSP supervisado. Las características expandidas fueron recuperadas desde un tesauro de acuerdo a su relación de información mutua. Banerje y Pedersen [17] presentaron una modificación del algoritmo de Lesk [22], para ello extendieron las glosas de un sentido dado apoyándose en la jerarquía de WordNet, de esta manera tomaban en cuenta hiperónimos, hipónimos, holónimos, etc., y sus definiciones asociadas para construir un contexto más extenso para el significado de la palabra de interés. Pinto et al. [18] presentaron un enfoque para mejorar la usabilidad de un conjunto de texto de tamaño limitado a través de la expansión de términos. Esta técnica involucraba una lista de palabras de co-ocurrencia de términos basada en PMI. La lista de términos fue usada para expandir palabras en el vector de características. Posteriormente aplicaron un algoritmo de agrupación para inducir los sentidos de una palabra ambigua. La propuesta que se presenta en este artículo es una extensión del artículo presentado por Rojas-Lopez et al. [23], en el cual el enfoque de DSP, a diferencia de lo reportado en la literatura, recupera términos relacionados con la palabra a desambiguar usando el conjunto de texto de prueba. La extensión del trabajo consiste en la integración de las técnicas PMI y a la propuesta antes citada, lo cual inicialmente no se había contemplado. Con dicha integración se mejora la recuperación y ponderación de términos. III. EXPANSIÓN DE TÉRMINOS Es de gran beneficio expandir el contexto de la palabra ambigua con el objetivo de tener mayor evidencia contextual, de tal manera que se mejore la afectividad de la acepción seleccionada para una palabra ambigua. Es de gran beneficio expandir el contexto de la palabra ambigua con el objetivo de tener mayor evidencia contextual,
3 de tal manera que se mejore la afectividad de la acepción seleccionada para una palabra ambigua. En este artículo se implementan dos técnicas para expandir el contexto donde ocurre la palabra a desambiguar. Con las técnicas se agregan términos relacionados a cada instancia de una palabra ambigua mediante expansión de términos supervisada y no supervisada. Tal técnica consiste en medir el grado de correlación entre cada instancia de una palabra ambigua y cada término en el conjunto de texto de prueba. Para lograr este objetivo se implementaron dos técnicas (PMI y ), las cuales ya han sido usadas por su efectividad en diferentes tareas del PLN [18, 13]. A diferencia de PMI, la medida es usada para la prueba de hipótesis de independencia entre dos variables. Sin embargo, no es de nuestro interés discutir los aspectos estadísticos de la, una explicación más extensa puede verse en el libro de Manning y Schütze [13]. En este artículo sólo la usamos para medir el grado de correlación entre dos términos. Las técnicas de expansión de términos se explican a continuación. A. Expansión de términos supervisada Para la Expansión de Términos Supervisada (ETS) cada instancia en el conjunto de texto de prueba fue etiquetada por estudiantes lingüistas usando WordNet como repositorio de sentidos. El objetivo de esta técnica es agrupar las instancias a desambiguar de acuerdo a la acepción asignada por los etiquetadores, para así formar clases de acuerdo a su acepción. De esta manera los términos encontrados en cada clase estarán fuertemente asociados dado que pertenecen al mismo sentido. A continuación se explica el proceso de agrupar instancias. Sean,,, instancias de una palabra ambigua, cada instancia,(1 ) fue etiquetada con el sentido correcto. A continuación las instancias etiquetadas con el mismo sentido fueron agrupadas para formar el conjunto de clases denotado por =,,,. De esta manera cada clase está formada por las sentencias en las cuales ocurre, por lo tanto cada clase contiene un conjunto de términos,,,. A continuación para cada clase (1 ) fueron aplicadas PMI y para obtener el grado de asociación entre cada instancia ambigua y cada término. Como resultado se obtuvo una lista de términos, los cuales fueron ponderados de acuerdo al grado de asociación con. Esta lista de términos fue usada para expandir el contexto de cada instancia ambigua. B. Expansión de términos no supervisada Para la Expansión de Términos No Supervisada (ETNS) fueron agrupadas las instancias que pertenecen a una palabra ambigua para formar clases de palabras ambiguas independientemente de la acepción de cada instancia. Es decir, las instancias de una misma palabra ambigua pertenecen a distintos sentidos de acuerdo a WordNet. Por lo tanto, los términos asociados con cada clase son más heterogéneos respecto a la técnica ETS. En esta técnica todas las instancias forman una clase, es decir, obtenemos tantas clases como palabras ambiguas existen en el conjunto de texto de prueba. Nuevamente las técnicas PMI y fueron aplicadas para obtener una lista de términos ponderados cuyo valor indica el grado de asociación con la instancia. Al igual que en el enfoque supervisado, la lista de términos ponderados expande el contexto de cada instancia ambigua. IV. SELECCIÓN DE TÉRMINOS A continuación se describen brevemente las técnicas que se emplean para obtener el grado de correlación entre pares de términos. A. Pointwise Mutual Information Pointwise Mutual Information (PMI) [12] es un método usado para medir el grado de asociación entre dos términos. Esto se logra mediante el uso del traslape de información que ambos términos comparten (, ). Si se considera la ocurrencia de ambos términos como dos variables aleatorias entonces PMI mide dependencia mutua entre la aparición de los términos (, ). Para estimar el grado de correlación entre ambos términos se emplea la Ecuación 1, donde (, ) es la frecuencia de observar y juntos, dividido por frecuencia de observar y independientemente. (, )= (, ) ( ) ( ) B. Chi-square Otra alternativa para medir la independencia entre dos términos o grado de correlación entre un término y una categoría es la prueba de correlación denominada Chi-square ( ) [24]. En este caso es usada para examinar la independencia entre dos términos y. Se asume que los términos son independientes si (, ) = ( ) ( ) El valor entre dos términos se obtiene empleando la Ecuación 2. = ( ) donde O denota la frecuencia observada y E denota la frecuencia esperada entre los términos y. La frecuencia esperada (E) se obtienen aplicando la Ecuación 3. = (, ) (1) (2) (3)
4 donde (, ) denota las frecuencias observadas cuando los términos y co-ocurren. La probabilidad de ocurrencia de los términos y se obtiene dividiendo su valor de frecuencia por la suma de la frecuencia de todos los pares de términos denotado por, encontrados en un tamaño de ventana específico. La frecuencia observada entre y se obtiene multiplicando los factores = ( ), = ( ), ( ) ( ) donde ( ) y ( ) es la frecuencia de la palabra y en la ventana de contexto definida y ( ) y ( ) es la suma de las frecuencias en toda la clase. El valor de la frecuencia observada se obtiene multiplicando los factores,. V. EXPERIMENTOS A continuación se describe el trabajo experimental realizado con las técnicas de expansión de términos del enfoque propuesto. Los experimentos fueron llevados a cabo en conjuntos de textos que comprenden instancias ambiguas en diferentes dominios. Las siguientes secciones describen los conjuntos de textos usados en los experimentos así como los resultados obtenidos. A. Conjuntos de textos de prueba Los experimentos fueron llevados a cabo en los conjuntos de textos de prueba presentados por Koeling et al. [5], los cuales se encuentran públicamente disponibles. Los conjuntos de textos de prueba comprenden 41 ejemplos de palabras ambiguas relacionadas a los dominios de Deportes, Finanzas y uno de contenido general, el BNC (British National Corpus). El BNC está formado de 4 categorías básicas: educación, negocios, público/institucional y ocio. Los dominios de Deportes y Finanzas fueron extraídos desde el conjunto de texto Reuters. Las características de las palabras incorporadas en los conjuntos de textos de prueba representan un reto para evaluar la precisión en el proceso de desambiguación dado que el número promedio de sentidos para cada palabra ambigua es de 6.7 sentidos. Esto significa que cada palabra ambigua puede tener en promedio 6.7 posibles sentidos. B. Configuración experimental El contexto en que se encuentra una palabra ambigua contribuye a determinar la acepción de dicha palabra, dada la situación comunicativa de las palabras en el contexto. Para extraer el contexto donde ocurre la palabra ambigua se realizó una fase de pre-procesamiento sobre los conjuntos de textos de prueba. Esta fase consiste en asignar la categoría gramatical a cada término en la sentencia usando la herramienta Stanford POS tagger [25]; a continuación las palabras vacías fueron removidas, tales como artículos, preposiciones, conjunciones etc. Para seleccionar los términos contextuales se definió una ventana de contexto de tamaño 2 1, = 5, es decir, 5 términos a la derecha e izquierda de la palabra ambigua; en total la ventana tiene 11 términos considerando la palabra ambigua. A continuación se obtuvo el grado de correlación entre cada par de términos como se describe en la Sección IV. En ambas técnicas la frecuencia de co-ocurrencia entre los términos y debe ser mayor o igual a 2 con el objetivo de remover términos que son más probablemente ruidosos. C. Resultados obtenidos Para evaluar la efectividad del enfoque propuesto se aplicaron las medidas de RI, precision (P) y recall (R), como muestra la Tabla I. La tabla está dividida en dos secciones, la primera sección muestra los resultados obtenidos al usar PMI y como técnicas para ponderar la co-ocurrencia de términos en la ventana establecida, como fue indicado en la subsección anterior. La segunda sección muestra los resultados obtenidos por otros trabajos de la literatura que usan el mismo benchmark que nosotros. La tabla también muestra los resultados obtenidos por Koeling et al. [5] al combinar la información de todos los dominios. Cabe mencionar que el trabajo de Koeling et al. no lleva a cabo una desambiguación contextual, por lo tanto es más viable comparar nuestro enfoque con el trabajo presentado por Navigli et al. [10] y Rojas-Lopez et al. [23]. Los mejores resultados son obtenidos al evaluar PMI en ambas técnicas ETS y ETNS; por el contrario obtuvo resultados deficientes en ambas técnicas a excepción del dominio de Finanzas. TABLA I. RESULTADOS DE DSP EN DIFERENTES DOMINIOS DE PRUEBA. Algoritmo Deportes Finanzas BNC P R P R P R ETS PMI ETNS PMI Rojas-Lopez et al. [23] Navigli et al. [10] Koeling et al. [5] En la Tabla II se muestra el número de clases obtenidas por acepción (ETS) y por palabra ambigua (ETNS). También se muestra el número promedio de palabras obtenidas por clase; estos datos son obtenidos después de una fase de preprocesamiento aplicada a los conjuntos de textos de prueba. Creemos que el número de palabras en las clases afectó el desempeño de comparada con PMI. En consecuencia, en el enfoque propuesto PMI permite discriminar con mayor precisión términos ruidosos en comparación con. Se observa en la Tabla I que la técnica ETS obtuvo mejores resultados en términos de precision y recall. Consideramos que esto se debe a que las sentencias donde ocurre la palabra ambigua fueron agrupadas por acepción, es decir, los
5 contextos pertenecen a la acepción, lo cual garantiza que los términos con mayor frecuencia se encuentran fuertemente relacionados con la palabra a desambiguar, caso contrario a la técnica ETNS. Los espacios vacíos en la Tabla I indican que los autores no reportan los resultados en términos de precision o recall. TABLA II. NÚMERO DE CLASES Y PALABRAS OBTENIDAS POR CONJUNTO DE TEXTO DE PRUEBA. Supervisado No supervisado Clases Promedio de palabras por clase Clases Promedio de palabras por clase Deportes Finanzas BNC VI. DISCUSION El objetivo de las técnicas ETS y ETNS es expandir el contexto donde ocurre la palabra ambigua usando el conjunto de texto de prueba. ETS añade términos tomando ventaja de la acepción asignada a cada instancia ambigua. Por otro lado, ETNS agrupa contextos de instancias ambiguas que pertenecen a la misma palabra ambigua. Ambas técnicas obtienen valores de precisión y recall competitivos en relación con lo reportado en la literatura. Sin embargo, PMI mide mejor la correlación entre pares de términos que. La Tabla II muestra cómo se relaciona el número de acepciones (clases) encontradas por dominio en el enfoque ETS, con los resultados de precision y recall obtenidos en los experimentos (Tabla I). Por ejemplo, el dominio de Deportes tiene un menor número de acepciones, seguido por Finanzas y BNC. Los resultados obtenidos en términos de precision y recall siguen este mismo orden. Es decir, la probabilidad de que una palabra sea desambiguada en el dominio de Deportes es más alta comparada con Finanzas y BNC. Es importante mencionar que BNC no es un conjunto de textos de dominio específico. Sin embargo las técnicas de expansión de términos muestran que los términos recuperados desde el conjunto de texto de prueba mejoran la tarea DSP aún cuando el conjunto de texto de prueba no es de dominio específico. De la misma manera los resultados obtenidos por Rojas-lopez et al. [23] y los resultados presentados por Koeling et al. [5] muestran el mismo comportamiento a excepción de los resultados presentados por Navigli et al. [10]. VII. CONCLUSIONES En este estudio fueron explorados dos métodos para ponderar el grado de correlación entre pares de términos dentro de la tarea muestra léxica de DSP. Los métodos implementan las técnicas de Expansión de Términos Supervisada y No Supervisada. La técnica supervisada sugiere que los términos que pertenecen a sentencias cuyas palabras ambiguas pertenecen a la misma acepción contribuyen fuertemente en el proceso de desambiguación del sentido de la palabra. Por lo tanto es de nuestro interés implementar a futuro una técnica de agrupación de textos cortos como la propuesta por Pedersen [26] para agrupar de una manera no supervisada contextos relacionados con las sentencias donde ocurre la palabra ambigua. De acuerdo con los resultados obtenidos, no podemos afirmar que PMI tiene un mejor comportamiento que para medir la correlación entre términos porque el número de palabras presentes en cada clase es pequeño, por lo tanto existe una menor frecuencia. En consecuencia, como trabajo futuro implementaremos también una técnica de agrupación para recuperar contextos relacionados con las instancias ambiguas y evaluar el comportamiento de PMI y en un conjunto de contextos de mayor tamaño. REFERENCIAS [1] S. Pradhan, E. Loper, D. Dligach, and M. Palmer, "Semeval-2007 task-17: English lexical sample, SRL and all words", In Proceedings of the Fourth International Workshop on Semantic Evaluations, pp , [2] R. Navigli, "Word sense disambiguation: A survey", ACM Computing Surveys, [3] D. McCarthy, "Word Sense Disambiguation: An Overview", Language and Linguistics Compass, pp , [4] E. Gerard, M. Lluís, and R. German, "An Empirical Study of the Domain Dependence of Supervised Word Sense Disambiguation Systems", Proceedings of the 2000 Joint SIGDAT conference on Empirical methods in natural language processing and very large corpora: held in conjunction with the 38th Annual Meeting of the Association for Computational Linguistics, vol. 13, pp , [5] R. Koeling, D. McCarthy, and J. Carroll, "Domain-specific sense distributions and predominant sense acquisition", Association for Computational Linguistics, no. 8, pp , [6] J. Tejeda-Carcamo, H. Calvo, A. Gelbukh, and K. Hara, "Unsupervised WSD by finding the predominant sense using context as a dynamic thesaurus", Journal of Computer Science and Technology, vol. 25, no. 5, p. 10, Sep [7] D. McCarthy, R. Koeling, J. Weeds, and J. Carroll, "Unsupervised Acquisition of Predominant Word Senses", Computational Linguistics, vol. 33, no. 4, [8] Y. Guo, W. Che, T. Liu, and S. Li, "Semi-supervised domain adaptation for WSD: Using a word-by-word model selection approach", Proceedings 9th IEEE International Conference on Cognitive Informatics, p , [9] S. Faralli and R. Navigli, "A New Minimally-Supervised Framework for Domain Word Sense Disambiguation", Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2012, July 12-14, 2012, Jeju Island, Korea, pp , [10] R. Navigli, S. Faralli, A. Soroa, O. de Lacalle, and E. Agirre "Two birds with one stone: learning semantic models for text categorization and word sense disambiguation", Proceedings of the 20th ACM international conference on Information and knowledge management, pp , [11] E. Agirre, O. De lacalle, and A. Soroa, "Knowledge-based WSD on specific domains: performing better than generic supervised WSD", Proceedings of the 21st International Jont Conference on Artifical Intelligence, pp , [12] K. Church and Hanks, "Word association norms, mutual information, and lexicography", vol. 16, pp , [13] C. D. Manning and H. Schütze, Foundations of Statistical Natural Language Processing. MIT Press, 1999.
6 [14] J. Tuominen, K. Viljanen, E. Hyvönen, and T. Kauppinen, "Ontology- Based Query Expansion Widget for Information Retrieval", Proceedings of the 5th Workshop on Scripting and Development for the Semantic Web, 6th European Semantic Web Conference, [15] N.-L. Tesao, D. Wible, and C.-H. Kuo, "Feature expansion for word sense disambiguation", Natural Language Processing and Knowledge Engineering, Proceedings International Conference on, pp , [16] F. Tacoa, D. Bollegala, and M. Ishizuka, "A Context Expansion Method for Supervised Word Sense Disambiguation", Sixth IEEE International Conference on Semantic Computing, [17] S. Banerjee and T. Pedersen, "An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet", In CICLing 2002 conference, vol. 2276, pp , [18] D. Pinto, P. Rosso, and H. Jiménez-Salazar, "UPV-SI: word sense induction using self term expansion", Proceedings of the 4th International Workshop on Semantic Evaluations, pp , [19] Y. S. Chan and H. T. Ng, "Domain Adaptation with Active Learning for Word Sense Disambiguation", Association for Computational Linguistics, pp , Jun [20] E. Agirre and O. de La calle, "On robustness and domain adaptation using SVD for word sense disambiguation", Proceedings of the 22nd International Conference on Computational Linguistics, vol. 1, pp , [21] D. Lin, "Automatic retrieval and clustering of similar words", Proceedings of the 17th International Conference on Computational Linguistics, vol. 2, pp , [22] M. Lesk, "Automatic Sense Disambiguation Using Machine Readable Dictionaries: How to Tell a Pine Cone from an Ice Cream Cone", Proceedings of SIGDOC, pp , [23] F. Rojas-Lopez, I. Lopez-Arevalo, and V. J. Sosa-Sosa, "Improving selection of synsets for domain-specific Word Sense Disambiguation", Submitted to Language Resources and Evaluation, Springer, [24] Y. Yang and J. Pedersen, "A Comparative Study on Feature Selection in Text Categorization", Proceedings of the Fourteenth International Conference on Machine Learning, pp , [25] K. Toutanova, D. Klein, C. D. Manning, and Y. Singer, "Feature-Rich Part-of-Speech Tagging with a Cyclic Dependency Network", HLT- NAACL, [26] T. Pedersen, "Computational Approaches to Measuring the Similarity of Short Contexts : A Review of Applications and Methods", Computing Research Repository, vol. abs/ , Victor J. Sosa-Sosa is a full-time research-professor at Center for Research and Advanced Studies of the National Polytechnic Institute of Mexico (Cinvestav), campus Tamaulipas. He has a PhD in Computer Science from Technical University of Catalonia (UPC-Barcelona), was a visiting researcher in the Database and Information System group at Max Planck Institute für Informatik in Germany (Sep/12-Jul/13), his research interest and specialization areas are Databases and Distributed Systems. His work is focused on large scale information search (surface and deep Web), information extraction, integration (Web databases) and cloud storage. Franco Rojas-Lopez received his Master degree in Computer Science from Benemérita Universidad Autónoma de Puebla and his Ph.D. in Computer Science from Cinvestav- Tamaulipas. He is associate professor at Universidad Politécnica Metropolitana de Puebla. His current research interests are Semantic Web, Information Retrieval and Knowledge Representation and Management. Ivan Lopez-Arevalo is a full-time research-professor at the Information Technology Lab at Center for Research and Advanced Studies of the National Polytechnic Institute of Mexico (Cinvestav-Tamaulipas). He received a Ph.D. degree in Computing from Technical University of Catalonia (UPC, Barcelona). His research interests include different topics from data analysis on databases, Web and social networks, such as data mining, text mining, and knowledge representation and management. His work also includes soft computing in engineering. David Pinto is a full-time research-professor in the Faculty of Computer Science at the Benemérita Universidad Autónoma de Puebla (BUAP). He received his Ph.D. degree in Pattern Recognition & Artificial Intelligence from the Universidad Politécnica de Valencia (UPV, Spain). His research interests include different topics from information retrieval, clustering and analysis of short texts, machine reading evaluation, question-answering. He is the founder and the actual chief of the Language & Knowledge Engineering Lab at BUAP.
Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases
Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Emmanuel Anguiano-Hernández Abril 29, 2009 Abstract Tratando de mejorar el desempeño de un clasificador Naive
Más detallesIntegrando Información de Fuentes Relevantes para un Sistema Recomendador
Integrando Información de Fuentes Relevantes para un Sistema Recomendador Silvana Aciar, Josefina López Herrera and Javier Guzmán Obando Agents Research Laboratory University of Girona {saciar, jguzmano}@eia.udg.es,
Más detallesPREPROCESADO DE DATOS PARA MINERIA DE DATOS
Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado
Más detallesRecuperación de información visual utilizando descriptores conceptuales
Recuperación de información visual utilizando descriptores conceptuales J. Benavent, X. Benavent y E. de Ves Departament d Informàtica (Universitat de València) {esther.deves,xaro.benavent}@uv.es Abstract.
Más detallesRecuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012
Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar
Más detallesClasificación Bayesiana de textos y páginas web
Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en
Más detallesPropuesta de proyecto de investigación: desarrollo de un rastreador web capaz de aprender a identificar la información más relevante
Propuesta de proyecto de investigación: desarrollo de un rastreador web capaz de aprender a identificar la información más relevante 30 de enero de 2016 Responsables Dr. Ricardo Marcelín Jiménez y M. en
Más detallesElementos requeridos para crearlos (ejemplo: el compilador)
Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción
Más detallesUNIDAD I: LÓGICA PROPOSICIONAL
UNIDAD I: LÓGICA PROPOSICIONAL ASIGNATURA: INTRODUCCIÓN A LA COMPUTACIÓN CARRERAS: LICENCIATURA Y PROFESORADO EN CIENCIAS DE LA COMPUTACIÓN DEPARTAMENTO DE INFORMÁTICA FACULTAD DE CIENCIAS FÍSICO MATEMÁTICA
Más detallesEvaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial
Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de
Más detallesBase de datos en Excel
Base de datos en Excel Una base datos es un conjunto de información que ha sido organizado bajo un mismo contexto y se encuentra almacenada y lista para ser utilizada en cualquier momento. Las bases de
Más detallesCapítulo VI. Conclusiones. En este capítulo abordaremos la comparación de las características principales y
Capítulo VI Conclusiones En este capítulo abordaremos la comparación de las características principales y de las ventajas cada tecnología Web nos ofrece para el desarrollo de ciertas aplicaciones. También
Más detallesCapítulo IV. Implementación del Sistema
La implementación del sistema consiste en la integración de la aplicación en una LAN, la instalación en varias computadoras personales de clientes del almacén, de administradores de almacén y de los almacenes
Más detallesactivuspaper Text Mining and BI Abstract
Text Mining and BI Abstract Los recientes avances en lingüística computacional, así como la tecnología de la información en general, permiten que la inserción de datos no estructurados en una infraestructura
Más detallesRedes de Kohonen y la Determinación Genética de las Clases
Redes de Kohonen y la Determinación Genética de las Clases Angel Kuri Instituto Tecnológico Autónomo de México Octubre de 2001 Redes Neuronales de Kohonen Las Redes de Kohonen, también llamadas Mapas Auto-Organizados
Más detallesCurso Excel Básico - Intermedio
Curso Excel Básico - Intermedio Clase 4 Relator: Miguel Rivera Adonis Introducción Base de Datos: Definición de Base de Datos Ordenar datos Formulario Filtros Trabajar con Sub-Totales Validación de Datos
Más detallesIntroducción. Metadatos
Introducción La red crece por momentos las necesidades que parecían cubiertas hace relativamente poco tiempo empiezan a quedarse obsoletas. Deben buscarse nuevas soluciones que dinamicen los sistemas de
Más detallesAdministración del conocimiento y aprendizaje organizacional.
Capítulo 2 Administración del conocimiento y aprendizaje organizacional. 2.1 La Importancia Del Aprendizaje En Las Organizaciones El aprendizaje ha sido una de las grandes necesidades básicas del ser humano,
Más detallesModificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.
UNIVERSIDAD DE CARABOBO FACULTAD DE CIENCIA Y TECNOLOGÍA DIRECCION DE EXTENSION COORDINACION DE PASANTIAS Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere. Pasante:
Más detallesConstrucción de cubos OLAP utilizando Business Intelligence Development Studio
Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange
Más detallesCAPITULO I: PLANTEAMIENTO DEL PROBLEMA
CAPITULO I: PLANTEAMIENTO DEL PROBLEMA 1.1. DESCRIPCIÓN DEL PROBLEMA En la actualidad, es importante la preparación profesional para la inserción al campo laboral ya que día a día las exigencias son mayores
Más detallesNota 2. Luis Sierra. Marzo del 2010
Nota 2 Luis Sierra Marzo del 2010 Cada mecanismo de definición de conjuntos que hemos comentado sugiere mecanismos para definir funciones y probar propiedades. Recordemos brevemente qué son las funciones
Más detalles1.4.- D E S I G U A L D A D E S
1.4.- D E S I G U A L D A D E S OBJETIVO: Que el alumno conozca y maneje las reglas empleadas en la resolución de desigualdades y las use para determinar el conjunto solución de una desigualdad dada y
Más detallesModeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach
JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 52(6):460-475, 2001 Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach
Más detallesObservatorio Bancario
México Observatorio Bancario 2 junio Fuentes de Financiamiento de las Empresas Encuesta Trimestral de Banco de México Fco. Javier Morales E. fj.morales@bbva.bancomer.com La Encuesta Trimestral de Fuentes
Más detallesEl almacén de indicadores de proceso de negocio en ejecución
X Congreso de Ingeniería de Organización Valencia, 7 y 8 de septiembre de 2006 El almacén de indicadores de proceso de negocio en ejecución Andrés Boza García 1, Angel Ortiz Bas 1, Llanos Cuenca Gonzalez
Más detallesProbabilidades y Estadística (Computación) Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Ana M. Bianco y Elena J.
Generación de Números Aleatorios Números elegidos al azar son útiles en diversas aplicaciones, entre las cuáles podemos mencionar: Simulación o métodos de Monte Carlo: se simula un proceso natural en forma
Más detallesProfesora Patrocinante: Sr. John Atkinson. Alumna Srta. Carolina Zambrano M. Fecha 24 de Abril de 2006.
Propuesta Proyecto de Memoria de Título Diseño e Implementación de un Prototipo de Call Center automatizado usando técnicas para tratamiento de lenguaje natural. Profesora Patrocinante: Sr. John Atkinson.
Más detallesDE VIDA PARA EL DESARROLLO DE SISTEMAS
MÉTODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS 1. METODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS CICLO DE VIDA CLÁSICO DEL DESARROLLO DE SISTEMAS. El desarrollo de Sistemas, un proceso
Más detallesANÁLISIS DE DATOS NO NUMERICOS
ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas
Más detallesGANTT, PERT y CPM. Figura 5.3: Carta GANTT 3.
GANTT, PERT y CPM Características Conseguir una buena programación es un reto, no obstante es razonable y alcanzable. Ella debe tener el compromiso del equipo al completo, para lo cual se recomienda que
Más detallesMáster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013
Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS Máster en Lenguajes y Sistemas Informáticos:
Más detallesIntroducción a Protégé
FACULTAD DE INFORMÁTICA LICENCIATURA EN DOCUMENTACIÓN SISTEMAS DE REPRESENTACIÓN Y PROCESAMIENTO AUTOMÁTICO DEL CONOCIMIENTO Práctica 1 1ª Parte Introducción a Protégé Febrero 2003 1. Objetivo La presente
Más detallesTécnicas de valor presente para calcular el valor en uso
Normas Internacionales de Información Financiera NIC - NIIF Guía NIC - NIIF NIC 36 Fundación NIC-NIIF Técnicas de valor presente para calcular el valor en uso Este documento proporciona una guía para utilizar
Más detallescapitulo3 MARCO TEÓRICO Para el diseño de la reubicación de los procesos se hará uso de la Planeación
capitulo3 MARCO TEÓRICO Para el diseño de la reubicación de los procesos se hará uso de la Planeación Sistemática de Layout, SLP por sus siglas en inglés. Se hará uso de la simulación para comparar el
Más detallesESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos
Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 2, Febrero 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Autor:
Más detallesTEORÍA CLÁSICA DE MEDICIÓN TC Y TEORÍA DE RESPUESTA AL ITEM TRI
TEORÍA CLÁSICA DE MEDICIÓN TC Y TEORÍA DE RESPUESTA AL ITEM TRI UNIVERSIDAD DE CHILE VICERRECTORÍA DE ASUNTOS ACADÉMICOS Departamento de Evaluación, Medición y Registro Educacional DEMRE ABRIL DE 2005
Más detallesMedias Móviles: Señales para invertir en la Bolsa
www.gacetafinanciera.com Medias Móviles: Señales para invertir en la Bolsa Juan P López..www.futuros.com Las medias móviles continúan siendo una herramienta básica en lo que se refiere a determinar tendencias
Más detallesImpactos económicos del gasto turístico. Capítulo 7
Impactos económicos del gasto turístico Capítulo 7 IMPACTOS ECONÓMICOS DEL GASTO PÚBLICO 7. IMPACTOS ECONÓMICOS DEL GASTO TURÍSTICO. En este capítulo se va a estimar el peso del turismo en la actividad
Más detallesLa tutoría para la dirección de proyectos de investigación. Darder Mesquida, Antònia antonia.darder@uib.es. Universitat de les Illes Balears.
La tutoría para la dirección de proyectos de investigación. Resumen Darder Mesquida, Antònia antonia.darder@uib.es Universitat de les Illes Balears. Se presenta un modelo de tutoría docente para la dirección
Más detallesRELACIONES DE RECURRENCIA
Unidad 3 RELACIONES DE RECURRENCIA 60 Capítulo 5 RECURSIÓN Objetivo general Conocer en forma introductoria los conceptos propios de la recurrencia en relación con matemática discreta. Objetivos específicos
Más detallesUNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos
2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven
Más detallesLiLa Portal Guía para profesores
Library of Labs Lecturer s Guide LiLa Portal Guía para profesores Se espera que los profesores se encarguen de gestionar el aprendizaje de los alumnos, por lo que su objetivo es seleccionar de la lista
Más detallesRESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea
RESULTADOS CONSULTA CIUDADANA VIRTUAL Consulta Laboral en Línea Septiembre, 2015 1 Agradecimientos Ponemos a disposición de ustedes los resultados de la Consulta Ciudadana Virtual, efectuada en julio de
Más detallesTema 3. Medidas de tendencia central. 3.1. Introducción. Contenido
Tema 3 Medidas de tendencia central Contenido 31 Introducción 1 32 Media aritmética 2 33 Media ponderada 3 34 Media geométrica 4 35 Mediana 5 351 Cálculo de la mediana para datos agrupados 5 36 Moda 6
Más detallesAplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI
Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI Ricardo Köller Jemio Departamento de Ciencias Exactas e Ingeniería, Universidad
Más detallesOperaciones Morfológicas en Imágenes Binarias
Operaciones Morfológicas en Imágenes Binarias Introducción La morfología matemática es una herramienta muy utilizada en el procesamiento de i- mágenes. Las operaciones morfológicas pueden simplificar los
Más detallesMODELOS DE RECUPERACION
RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN INGENIERÍA INFORMÁTICA RECUPERACIÓN Y ACCESO A LA INFORMACIÓN MODELOS DE RECUPERACION AUTOR: Rubén García Broncano NIA 100065530 grupo 81 1 INDICE 1- INTRODUCCIÓN
Más detallesDiseño ergonómico o diseño centrado en el usuario?
Diseño ergonómico o diseño centrado en el usuario? Mercado Colin, Lucila Maestra en Diseño Industrial Posgrado en Diseño Industrial, UNAM lucila_mercadocolin@yahoo.com.mx RESUMEN En los últimos años el
Más detallesLOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1
LOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1 Horacio Ramírez de Alba* En este escrito se presenta un panorama de la profesión de la ingeniería y su relación con el desarrollo del país, y a partir de ello
Más detallesPara comprender las evaluaciones educativas Fichas didacticas
Para comprender las evaluaciones educativas Fichas didacticas Ficha 14 Pedro Ravela + ficha nº 14 las preguntas que el lector debe hacerse ante un informe de resultados La ficha Nº 14 intenta ser un resumen
Más detallesClasificación Automática de Textos de Desastres Naturales en México
Clasificación Automática de Textos de Desastres Naturales en México Alberto Téllez-Valero, Manuel Montes-y-Gómez, Olac Fuentes-Chávez, Luis Villaseñor-Pineda Instituto Nacional de Astrofísica, Óptica y
Más detallesSistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.
Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.ve Resumen: se describe la implementación experimental de
Más detallesIntroducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012
Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces
Más detallesDISEÑO DE INDICADORES DE DESIGUALDAD SOCIAL EN LAS CIUDADES.-
DISEÑO DE INDICADORES DE DESIGUALDAD SOCIAL EN LAS CIUDADES.- 1. Introducción. El presente documento es el referente metodológico para la selección inicial de los barrios deprimidos. Se recoge una propuesta
Más detallesFórmulas y enfoques utilizados para calcular el Tasa Efectiva de Interés (TEI) o Costo Anual Total (CAT)
Fórmulas y enfoques utilizados para calcular el Tasa Efectiva de Interés (TEI) o Costo Anual Total (CAT) El propósito del Costo Anual Total (CAT) El precio verdadero del préstamo no solamente incluye los
Más detallesManual Operativo Sistema de Postulación Online
Manual Operativo Sistema de Postulación Online Este Manual está diseñado en forma genérica para apoyar el proceso de postulación en línea, las Bases de cada Concurso definen los requerimientos oficiales
Más detallesRecuperación de Información en Internet Tema 3: Principios de Recuperación de Información
Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información Mestrado Universitario Língua e usos profesionais Miguel A. Alonso Jesús Vilares Departamento de Computación Facultad
Más detallesLa Web Semántica como herramienta para e-learning
La Web Semántica como herramienta para e-learning Lidia Marina López llopez@uncoma.edu.ar Departamento de Ciencias de la Computación Universidad Nacional del Comahue Buenos Aires 1400 8300 Neuquén Tel.
Más detallesCAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN. El ámbito de los negocios en la actualidad es un área donde que cada vez más
CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN El ámbito de los negocios en la actualidad es un área donde que cada vez más se requieren estudios y análisis con criterios de carácter científico a fin de poder
Más detallesEl impacto que UNETE ha generado en las comunidades escolares, no sólo refiere a los beneficios
MPACTO EDUCATIVO Evaluaciones El impacto que UNETE ha generado en las comunidades escolares, no sólo refiere a los beneficios per se que las escuelas reciben; hoy hemos podido realizar 3 importantes investigaciones
Más detalles7. Conclusiones. 7.1 Resultados
7. Conclusiones Una de las preguntas iniciales de este proyecto fue : Cuál es la importancia de resolver problemas NP-Completos?. Puede concluirse que el PAV como problema NP- Completo permite comprobar
Más detallesCAPÍTULO 1 INTRODUCCIÓN. En México existen miles de micro, pequeñas y medianas empresas que constituyen una
CAPÍTULO 1 INTRODUCCIÓN En México existen miles de micro, pequeñas y medianas empresas que constituyen una parte importante de la producción y economía del país, y que en su mayoría no tienen fácil acceso
Más detallesESTUDIAR MATEMATICA EN CASA
ESTUDIAR MATEMATICA EN CASA Sugerencias para docentes Sea cual fuere el enfoque de enseñanza de la matemática adoptado, todos los docentes acuerdan en la importancia del tiempo extraescolar dedicado al
Más detallesUnidad 1. Fundamentos en Gestión de Riesgos
1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.
Más detallesE-PROCUREMENT PARA FACILITAR LA INTEGRACIÓN EN LA SUPPLY CHAIN
E-PROCUREMENT PARA FACILITAR LA INTEGRACIÓN EN LA SUPPLY CHAIN Con cada vez mayores presiones de la competencia, cada vez más las empresas utilizan las adquisiciones electrónicas (eprocurement) en un intento
Más detallesSistemas de Recuperación de Información
Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La
Más detallesTrabajo final de Ingeniería
UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción
Más detallesMinería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/
Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy
Más detallesServicio de Apoyo a la Investigación. Tutorial EndNoteWeb
Servicio de Apoyo a la Investigación Tutorial EndNoteWeb I AÑADIR REFERENCIAS. LA PESTAÑA COLLECT Collect es la pestaña que se utiliza para añadir referencias a nuestra biblioteca. Se pueden añadir hasta
Más detallesValidation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación
Validation Validación Psicométrica L art de l évaluation Validation Central Test Central Test Centraltest L art de l évaluation CENTRAL test.com El arte de la evaluación www.centraltest.com Propiedades
Más detallesMétodo de desambiguación léxica basada en el recurso léxico Dominios Relevantes
Método de desambiguación léxica basada en el recurso léxico Dominios Relevantes Sonia Vázquez y Andrés Montoyo Grupo de Procesamiento del Lenguaje y Sistemas de Información Departamento de Lenguajes y
Más detalles2.1 INFORMACION BASICA Y PRINCIPALES DEFINICIONES.
2 - PROPIEDAD COMÚN. 2.1 INFORMACION BASICA Y PRINCIPALES DEFINICIONES. En esta oportunidad se adelanta información correspondiente a una nueva serie con las variables de interés en las Compraventas de
Más detallesMediante la aplicación de la metodología a los datos disponibles para este estudio, esta
6 Conclusiones Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta investigación aporta evidencia de la existencia de cambios en los determinantes del desempleo durante
Más detallesCLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)
CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE
Más detallesMODELOS DE SIMULACIÓN
MODELOS DE SIMULACIÓN En general, se llama modelo a la imagen o representación de un sistema, generalmente simplificada e incompleta. Y se llama simulación a la experimentación con un modelo para extraer
Más detallesPRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES
PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES Raúl Palma G. y Guillermo Bustos R. Escuela de Ingeniería Industrial Universidad Católica de Valparaíso Casilla
Más detalles1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
Más detallesANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS
ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se
Más detallesPERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores
PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores Martha Alicia Alles Es contadora pública nacional, doctora por la Universidad de Buenos Aires en la especialidad
Más detalles3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)
3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1.1 Introducción Este método proporciona un soporte para el diseño creativo de productos de software, inclusive a escala industrial.
Más detallesGUÍA BÁSICA USUARIO MOODLE 2.6
GUÍA BÁSICA USUARIO MOODLE 2.6 Esta guía representa los pasos a seguir por el alumno desde la aceptación en un curso Moodle hasta su posterior utilización, pero antes de explicar la forma de acceder y
Más detallesClase 4: Probabilidades de un evento
Clase 4: Probabilidades de un evento Definiciones A continuación vamos a considerar sólo aquellos experimentos para los que el EM contiene un número finito de elementos. La probabilidad de la ocurrencia
Más detallesImpacto de la ironía en la minería de opiniones basada en un léxico afectivo
Impacto de la ironía en la minería de opiniones basada en un léxico afectivo Yolanda Raquel Baca-Gómez a, Delia Irazú Hernández Farías b, Paolo Rosso b, Noé Alejandro Castro-Sánchez a, Alicia Martínez
Más detallesExperiencias de la Televisión Digital Interactiva en Colombia - ARTICA
Experiencias de la Televisión Digital Interactiva en Colombia - ARTICA JUAN CARLOS MONTOYA Departamento de Ingeniería de Sistemas, Universidad EAFIT - Centro de Excelencia en ETI - ARTICA Medellín, Colombia
Más detallesDISEÑO Y CÁLCULO DE UN ORDENAMIENTO RANKING DE ENTIDADES PROMOTORAS DE SALUD INFORME EJECUTIVO DE LA METODOLOGIA
DISEÑO Y CÁLCULO DE UN ORDENAMIENTO RANKING DE ENTIDADES PROMOTORAS DE SALUD Diseño y cálculo de un ordenamiento de Entidades Promotoras de Salud (EPS) Facultad de Ciencias Económicas Centro de Investigaciones
Más detallesCapítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.
Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. 2.1 Revisión sistema reconocimiento caracteres [9]: Un sistema de reconocimiento típicamente esta conformado por
Más detallesTPVFÁCIL. Caja Real. Definiciones.
TPVFÁCIL. Caja Real. TPVFÁCIL incluye desde la versión 3.3.2 la posibilidad de manejar dos cajas, la Caja Real y la Caja normal. La idea es esconder los datos de caja que pueden alcanzar los usuarios no
Más detallesIngeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007
Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el
Más detallesLa enseñanza del español de los negocios. Propuestas metodológicas y organización de proyectos Carlos Barroso 1 Universidad de Málaga (España)
La enseñanza del español de los negocios. Propuestas metodológicas y organización de proyectos Carlos Barroso 1 Universidad de Málaga (España) La enseñanza de español como segunda lengua con fines específicos
Más detallesEL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO
EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO I. INTRODUCCIÓN Beatriz Meneses A. de Sesma * En los estudios de mercado intervienen muchas variables que son importantes para el cliente, sin embargo,
Más detallesMidiendo el costo económico 1
Midiendo el costo económico 1 Esta sección tiene como objetivo realizar una estimación de los costos de migración de los RHUS, especialmente de los médicos y las enfermeras. Para obtener el costo de entrenamiento
Más detallesEspacios generados, dependencia lineal y bases
Espacios generados dependencia lineal y bases Departamento de Matemáticas CCIR/ITESM 14 de enero de 2011 Índice 14.1. Introducción............................................... 1 14.2. Espacio Generado............................................
Más detallesPlan de Evaluación. Parcial I...20% Taller I... 5% Parcial II...20% Taller II...5% Parcial III...20% Exposición...10% Proyecto...15% Asistencia...
Plan de Evaluación Parcial I...20% Taller I... 5% Parcial II...20% Taller II...5% Parcial III...20% Exposición...10% Proyecto...15% Asistencia...5% 1 REDES Toda organización alguna vez tiene que enfrentar
Más detallesERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES
ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES DE BÁSICA PRIMARIA EN LA CIUDAD DE PEREIRA José R. Bedoya Universidad Tecnológica de Pereira Pereira, Colombia La formación estadística en la ciudadanía,
Más detallesEvaluación Adaptativa de Inglés en el Sistema Educativo uruguayo, 2014. Resumen Ejecutivo
Introducción Evaluación Adaptativa de Inglés en el Sistema Educativo uruguayo, 2014. Resumen Ejecutivo Departamento de Segundas Lenguas y Lenguas Extranjeras del CEIP Programa Ceibal en Ingles Plan Ceibal
Más detallesCómo hacer un mapa conceptual paso a paso
Esta guía corresponde a una adaptación de la guía Cómo hacer un mapa conceptual paso a paso de Talleres de adaptación e innovación tecnológica para el Espacio Europeo de Educación Superior IUED - UNED
Más detallesContribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual
Contribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual Sonia Vázquez, Zornitsa Kozareva y Andrés Montoyo Departamento de Lenguajes y Sistemas
Más detallesLas comunicaciones y los sistemas de producción
Las comunicaciones y los sistemas de producción Uno de los aspectos más avanzados en los sistemas de producción industrial actual, son las normativas que se relacionan con la protección del medio ambiente.
Más detalles