1. Introducción. Tipo de artículo: Artículo Original Temática: Inteligencia Artificial Recibido: 5/3/2012 Aceptado: 4/4/2012
|
|
- Vicenta Martin Alcaraz
- hace 7 años
- Vistas:
Transcripción
1 Tipo de artículo: Artículo Original Temática: Inteligencia Artificial Recibido: 5/3/2012 Aceptado: 4/4/2012 Método para el aprendizaje de reglas de clasificación para conjuntos de datos no balanceados Method for the Learning of Classification Rules for Imbalanced Dataset Yaima Filiberto Cabrera 1 *, Yailé Caballero Mota 1, Rafael Bello Pérez 2, Mabel Frías Dominguez 1 1* Universidad de Camagüey, Circunvalación Norte, km 5 ½, Camagüey Cuba. [yaima.filiberto, yaile.caballero, mabel.frias]@reduc.edu.cu 2 Centro de Estudios de Informática, Universidad de Central Marta Abreu de las Villas, Carretera a Camajuaní, km 5 ½, Santa Clara, Villa Clara, Cuba. rbellop@uclv.edu.cu Resumen: En este artículo, se estudia el desempeño del algoritmo IRBASIR-D, obtenido a partir del algoritmo IRBASIR (Inducción de Reglas Basado en Relaciones de Similaridad) para el caso de conjuntos de datos no balanceados. El uso de relaciones de similaridad permite aplicar este método en el caso de datos mixtos (rasgos con dominios discretos o continuos). Los resultados experimentales muestran un desarrollo satisfactoria del algoritmo IRBASIR-D comparado con otros como C4.5 con los conjuntos de datos originales y editados con SMOTE, SMOTE- ENN y variantes de estos métodos sensibles al costo. Palabras clave: Aprendizaje de reglas de clasificación, conjuntos de datos no balanceados, relaciones de similaridad. Abstract: In this paper, the performance of the IRBASIR-D algorithm, developed from the algorithm IRBASIR (Induction of Rules Based on Similarity Relations) in the case of imbalanced datasets is studied. The use of similarity relations allows applying this method in the case of mixed data (features with discrete or real domains). The experimental results show a satisfactory performance of the IRBASIR-D algorithm in comparison to others such as C4.5, C4.5+SMOTE and C4.5+SMOTE-ENN and their variants sensitive at the cost. Keywords: Keywords: imbalanced datasets, learning of classification rules, similarity relations. 1. Introducción Las reglas de decisión son una de las formas de representación del conocimiento típicas para formalizar el conocimiento descubierto, debido a su expresividad simbólica es considerada más comprensible y natural para los humanos que otros formalismos; además, las reglas constituyen bloques de conocimiento y los expertos del dominio pueden fácilmente analizarlas individualmente (Michalski 1983; Stefanowski and Wilk 2009). Se expresan de la forma Si P entonces Q, donde P es la parte condicional formada usualmente por una conjunción de condiciones elementales (p1 and p2 and pk), y Q es la parte de decisión que asigna un valor de decisión (clase) a un objeto que cumpla la condición. En la mayoría de los métodos de aprendizaje automático para la inducción de reglas la parte P se construye incrementalmente, agregando sucesivamente las condiciones elementales pi hasta que se cumpla una condición dada; los términos pi son pruebas sobre los valores de los atributos (mediante los operadores de igualdad, 1
2 menor que, mayor que, etc.). El aprendizaje de reglas de clasificación es un problema clásico del aprendizaje automático. La construcción de clasificadores es una de las técnicas comúnmente usadas en minería de datos (Xindong 2008). La mayoría de los métodos tratan de generar reglas siguiendo una estrategia de cubrimiento secuencial. Entre los algoritmos clásicos para resolver este problema está el ID3, y su extensión para el caso de rasgos de condición con dominio continúo C4.5 (Quinlan 1993), los cuales inducen árboles de decisión. La presencia de rasgos con dominio continuo introduce una complejidad mayor en el proceso de descubrimiento de las reglas. Las alternativas seguidas han sido discretizar los rasgos de dominio continuo previamente al proceso de generación de las reglas o realizar simultáneamente la discretización y la inducción de las reglas (Grzymala-Busse 2004), como es el caso del algoritmo C4.5, el cual se ha convertido en un estándar entre las técnicas de aprendizaje automático para el descubrimiento de reglas de clasificación, y ha sido ampliamente usado en problemas no balanceados. En este artículo se presenta un método para inducir reglas de clasificación para sistemas de decisión con rasgos de condición heterogéneos, es decir, pueden existir tanto rasgos discretos como continuo y se estudia el desarrollo del algoritmo para el caso de bases de datos no balanceadas. Los conjuntos de datos no balanceados poseen una marcada diferencia entre la cantidad de ejemplos a clasificar negativos como positivos en un concepto dado. Esta diferencia provoca que los algoritmos de clasificación traten como un ruido a las clases en menor número (clases minoritarias y positivas), lo que resulta que al final del proceso las clases en mayor número (clases mayoritarias y negativas), quedan muy bien clasificadas mientras que las minoritarias tienden a estar mal clasificadas y esto es debido a que los clasificadores intentan reducir el error global sin tener en cuenta la distribución de los datos, esto trae como consecuencia la pérdida de conocimiento novedoso que tiende a residir en los ejemplos minoritarios. El método de aprendizaje estudiado en este artículo no requiere discretizar los dominios continuos, y la parte condicional de la regla no se expresa como una conjunción de condiciones elementales. El algoritmo se basa en el empleo de una relación de similaridad que permite construir las clases de similaridad de los objetos. La construcción de las relaciones de similaridad se basa en la Teoría de los conjuntos aproximados extendida (Skowron and Stepaniuk 1996; Pawlak and Skowron 2007; Qin 2007). Los estudios experimentales desarrollados muestran un mejor desempeño de este algoritmo al compararlo con C4.5 con los conjuntos de datos originales y editados con SMOTE (Chawla 2002) y SMOTE-ENN (Batista, Prati et al. 2004), cuando ellos se aplican a conjuntos de entrenamiento no balanceados y cuando estos métodos se aplican a conjuntos de entrenamiento resultantes de la edición de datos no balanceados usando diferentes métodos para balancearlos así como variantes de los mismos sensibles al costo. 2. Conjuntos de datos no balanceados En algunos problemas de clasificación la cantidad de casos de cada clase es diferente. Específicamente, cuando se enfrentan a un conjunto de datos con sólo dos clases, el problema de desbalance se produce cuando una clase es representada por una gran cantidad de ejemplos, mientras que el otro está representado sólo por unos pocos. El problema del desbalance en los conjuntos de datos es muy importante (Yang and Wu 2006), ya que está implícito en la mayoría de aplicaciones del mundo real, tales como la clasificación de imágenes de satélite (Suresh 2008), la gestión de riesgos (Huang 2006), los datos de la proteína (Provost 2001) y, en particular en las aplicaciones médicas (Mazurowski 2008; Peng 2008). Es importante señalar que la clase minoritaria por lo general representa el concepto de interés, por ejemplo de pacientes con enfermedades en un problema de diagnóstico médico, mientras que la otra clase representa la contrapartida de ese concepto (los pacientes saludables). Los algoritmos de clasificación estándar tienen un sesgo hacia la clase mayoritaria, ya que las reglas que predicen el mayor número de ejemplos son 2
3 ponderados positivamente durante el proceso de aprendizaje en favor de la precisión métrica. En consecuencia, las instancias que pertenecen a la clase minoritaria están mal clasificadas con mayor frecuencia que las que pertenecen a la clase mayoritaria (Fernández 2010). En efecto, la mayoría de los algoritmos de aprendizaje tienen como objetivo obtener un modelo con un alto acierto en predicción y una buena capacidad de generalización. Sin embargo, esta tendencia inductiva hacia un modelo de estas características supone un serio problema para la clasificación de datos no balanceados (Sun, Wong et al. 2009). Un gran número de métodos se han propuesto anteriormente para tratar el problema del desbalance de las clases. Estos enfoques se pueden clasificar en dos grupos: los modelos internos que crean nuevos algoritmos o modifican los ya existentes teniendo en cuenta el problema del desbalance entre las clases (Wu and Chang 2005; Xu 2007) y enfoques externos que preprocesan los datos con el fin de disminuir el efecto de su desbalance (Estabrooks 2004). Además, son sensibles a los costos de soluciones de aprendizaje que incorporan los datos y métodos algorítmicos al nivel de asumir mayores costos de clasificación errónea de las muestras de la clase minoritaria y buscar para minimizar los errores de alto costo (Sun 2007). Entre los métodos reportados en la literatura con mejores resultados en el preprocesamiento de estos tipos de datos encontramos: SMOTE (Chawla 2002) y SMOTE-ENN (Batista, Prati et al. 2004) y variantes sensibles al costo. 2.1 Evaluación de la clasificación en problemas con datos no balanceados Las medidas de la calidad de la clasificación se construyen a partir de una matriz de confusión que registra correctamente e incorrectamente los ejemplos reconocidos de cada clase. La medida empírica más usada: ACC, no distingue entre el número de etiquetas correctas de diferentes clases, lo cual en el ámbito de los problemas de desbalance puede conducir a conclusiones erróneas. Por ejemplo, un clasificador que obtiene una precisión de 90% en un conjunto de datos con un valor de IR9 (Imbalance Rate, IR) (Orriols-Puig and Bernad o-mansilla 2009), podría no ser válida si no se clasifica correctamente cualquier instancia de la clase minoritaria. Debido a esto, en lugar de utilizar ACC, se consideran sistemas de medición más correctos. Una medida apropiada que podría ser utilizada para medir el rendimiento de la clasificación de conjuntos de datos con mayor desbalance es el área bajo la curva ROC (Receiver Operating Characteristic) (Bradley 1997). En estos gráficos se reconoce el hecho de que la capacidad de cualquier clasificador no puede aumentar el número de verdaderos positivos sin aumentar los falsos positivos. El área bajo la curva ROC (AUC) (Huang and Ling 2005) proporciona un número único de resumen para el desempeño de algoritmos de aprendizaje. Para calcular AUC sólo hay que obtener el área bajo la curva como se muestra en la expresión (1): Teniendo en cuenta que una de las alternativas para enfrentar el aprendizaje a partir de conjuntos de entrenamiento no balanceado son los modelos internos que crean nuevos algoritmos o modifican los ya existentes según el problema del desbalance entre las clases, se realizó el estudio del comportamiento del algoritmo IRBASIR para esta problemática, así como se procedió a una modificación del mismo para adaptarlo a la nueva situación. Entre las modificaciones están la modificación de la medida calidad de la similaridad, la cual sirve de base para el cálculo de los pesos usados en la construcción de la parte condicional de las reglas de decisión que se descubren. 3
4 3. Un algoritmo para generar reglas de clasificación basado en la teoría de los conjuntos aproximados A partir del algoritmo IRBASIR (Inducción de reglas basado en relaciones de similaridad) (Filiberto, Bello et al. 2011b) se propone el algoritmo IRBASIR-D, para el caso de conjuntos de datos no balanceados. Dado un sistema de decisión DS=(U, A{d}), con m objetos, y el conjunto A contiene n rasgos de dominios continuos o discretos. P1. Definir las medidas de similaridad locales. Construir las funciones de comparación de rasgos i(x,y) para cada rasgo en A, tales que permiten comparar los valores de ese rasgo; por ejemplo la expresión (2). xi yi 1 if i is continuous Max( Di ) Min( Di ) x, y 1 if i is discrete and xi yi 0 if i is discrete and xi yi (2) P2. Construir una relación de similaridad R, como la definida por (3): (xry) if and only if F1(x,y) (3) Donde F1( X, Y ) n i1 w * i i X, Y i i (4) P3. Construir reglas de clasificación según el procedimiento GenRulesRST basado en R. Activar GenRulesRST. Para encontrar los valores w i para (4) se propone usar el método propuesto en (Filiberto, Bello et al. 2010a). Este método se basa en emplear una metaheurística, como Particle Swarm Optimization (PSO) [poner referencia] y como medida de calidad de las soluciones la medida calidad de la similaridad. La modificación propuesta para estudiar el desempeño del algoritmo IRBASIR para el caso de datos mezclados no balanceados consideran modificar la medida de calidad de la similaridad definida por (Filiberto, Bello et al. 2011a). Modificación de la medida calidad de la similaridad de la forma siguiente: DS Donde U x * (x) U (5) * x x x 2 si x C si x C (6) 4
5 Esta modificación hace que sea menor el aporte de los objetos de la clase minoritaria, a no ser que tenga valor 1, donde C+ es el conjunto de objetos que pertenecen a la clase mayoritaria y C- a la minoritaria. El procedimiento GenRulesRST genera reglas de clasificación y sus correspondientes valores de certidumbre. Procedimiento GenRulesRST Se usa un arreglo de m componentes, denominado Usado [], en el cual Usado[i] tiene un valor 1 si el objeto ya fue usado por el procedimiento GenRulesRST, o 0 en otro caso. En este procedimiento se buscan objetos del sistema de decisión no tenidos en cuenta previamente, se construye su clase de similaridad usando la relación de similaridad seleccionada y se construye una regla que cubra los objetos que tienen como valor de decisión la clase mayoritaria en la clase de similaridad. P1: Inicializar contador de objetos Usado[j] 0, para j=1,,m RulSet i 0 P2: Comienza procesamiento del objeto O i i índice del primer objeto no usado Si i=0 entonces Fin del proceso de generación de reglas. Sino Usado[i] 1 P3: Construir la clase de similaridad del objeto O i según R Calcular [Oi] R [x] R denota la clase de similaridad del objeto x P4: Generación de una regla de decisión Si ([Oi] R )=1 entonces {/*Construir la regla que describa esta clase de similaridad con consecuente igual al valor de decisión del objeto O i */ k d(o i ) C [O i ] R } Sino { /*Construir la regla que describa esta clase de similaridad con consecuente igual al valor de decisión mayoritario en [O i ] R */ k valor de decisión mayoritario de los objetos en [O i ] R C objetos de [Oi] R con clase k } Activar GenRulSim(k, [O i ] R, C; Rul) /* este procedimiento construye una regla de decisión*/ RulSet RulSet U { Rul } P5: Marcar como usados a todos los objetos en C cubiertos por la regla Rul y con consecuente k. P6: Ir a P2 Donde ([O i ] R ) denota la cantidad de valores de decisión distintos de los objetos en la clase de similaridad [O i ] R. Procedimiento GenRulSim(k, Cs, C; Rul) Los parámetros k, Cs y C son de entrada y Rul de salida. P1: Construir un vector P con n componentes de referencia para el conjunto de objetos en C. P(i) f(v i ), donde V i es el conjunto de valores del rasgo i en los objetos en C P2: Generar la regla a partir del vector de referencia P. Rul If w 1 *(X 1,P 1 )+ + w n *(X n,p n ) then d=k Donde los pesos w i son tomados de la función F1 (expresión 4); es el umbral usado en la relación de similaridad R; P i es el valor del rasgo i en el vector de referencia P; y i es la función de comparación para el rasgo i. P3: Calcular la certidumbre de la regla. 5
6 Las medidas accuracy (Acc) y coverage (Cov) son dos medidas que permiten dar una evaluación sobre la suficiencia y la necesidad de una regla (Tsumoto 1998; Wang, Yang et al. 2006). En paso P1 de GenRulSim la función f denota un operador de agregación; por ejemplo: Si los valores en Vi son reales usar el promedio, si son discretos la moda. El propósito es construir un prototipo o centroide para un conjunto de objetos similares; aquí se ha usado un enfoque parecido a como se hace en el algoritmo k-means (MacQueen 1967; Xindong 2008); en (Mitra 2010) se presentan diferentes alternativas al respecto. 5. Estudio experimental Se utilizó la herramienta KEEL para obtener los resultados de la clasificación del método C4.5. Se estudió el comportamiento de los algoritmos también para el caso en que se balancea el conjunto de datos usando algún método de edición, por ejemplo SMOTE que es uno de los métodos clásicos más utilizados (Batista, Prati et al. 2004; Han 2009). Para realizar los experimentos se usaron 22 conjuntos de datos de medio desbalance descritos en la tabla 1. Siguiendo este principio de selección aleatoria, se obtuvieron para cada conjunto de datos cinco conjuntos de entrenamiento y cinco conjuntos de control. Estas particiones se realizaron de forma tal que la cantidad de elementos por clases se mantuviera uniforme (Fernández, García et al. 2008). Se utilizó de igual forma la herramienta KEEL para el procesamiento de los resultados estadísticos. Se compararon los resultados obtenidos por C4.5, C4.5+Smote y C4.5+S-ENN, Cost.Sens e IRBASIR-D, con respecto a AUC (1). Estos resultados se muestran en las tablas 2 y 3. Se aplicó una prueba de Friedman e Iman-Davemport entre los algoritmos C4.5, C4.5+Smote, C4.5+S-ENN, Cost.Sens e IRBASIR-D, respecto a la AUC descrita en (1) y arrojó que existen diferencias significativas entre ellos, solo en el caso de C4.5+S-ENN se obtienen resultados comparables. En la tabla 5 podemos observar que el mejor ranking se obtiene por nuestra propuesta (IRBASIR-D). Se aplicó la prueba de Holm, respecto a la medida AUC, y se corrobora que el algoritmo IRBASIR-D es significativamente superior a C4.5, C4.5+Smote, C4.5+S-ENN y Cost.Sens. 6
7 Tabla 1 Descripción de las bases de datos usadas para la experimentación. Conjuntos de datos Número de instancias Número de atributos %Class(min., maj.) glass (35.51, 64.49) ecoli0vs (35.00, 65.00) wisconsin (35.00, 65.00) pima (34.84, 66.16) iris (33.33, 66.67) glass (32.71, 67.29) yeast (28.91, 71.09) vehicle (28.37, 71.63) vehicle (28.37, 71.63) vehicle (28.37, 71.63) haberman (27.42, 73.58) glass0123vs (23.83, 76.17) vehicle (23.64, 76.36) ecoli (22.92, 77.08) new-thyroid (16.89, 83.11) new-thyroid (16.28, 83.72) ecoli (15.48, 84.52) segment (14.26, 85.74) glass (13.55, 86.45) yeast (10.98, 89.02) ecoli (10.88, 89.12) page-blocks (10.23, 89.77) 6. Conclusiones En este artículo se estudió una modificación del algoritmo IRBASIR, denominada IRBASIR-D, para la generación de reglas de clasificación para conjuntos de datos no balanceados. El uso de relaciones de similaridad para construir las reglas permite tratar datos mixtos (los rasgos con dominio discreto y continuo) sin tener que discretizar los dominios continuos. El algoritmo induce reglas donde la parte condicional no se expresa como una conjunción de condiciones elementales, como en la mayoría de los métodos. La construcción de relaciones de similaridad se basa en la Teoría de los conjuntos aproximados extendida. Cuando se comparó con otros métodos en conjuntos de datos no balanceados los resultados muestran un desempeño superior del algoritmo IRBASIR-D. 7
8 Tabla 2 Resultados de AUC para: C4.5, C4.5+SMOTE, C4.5+SMOTE-ENN, Cost.Sens e IRBASIR1 para conjuntos de datos no balanceados. Conjuntos de datos C4.5 C4.5+Smote C4.5+S-ENN Cost.Sens IRBASIR-D glass1 0,74 0,74 0,69 0,716 0,82 ecoli0vs1 0,98 0,97 0,98 0,9832 0,98 wisconsin 0,95 0,95 0,96 0,9636 0,98 pima 0,70 0,72 0,74 0,7125 0,74 iris0 0,99 0,99 0,99 0,99 1,00 glass0 0,82 0,78 0,80 0,8212 0,86 yeast1 0,66 0,71 0,70 0,6779 0,67 vehicle1 0,67 0,73 0,75 0,7013 0,68 vehicle2 0,96 0,95 0,94 0,9434 0,98 vehicle3 0,66 0,73 0,74 0,7283 0,73 haberman 0,58 0,62 0,59 0,5752 0,66 glass0123vs456 0,92 0,92 0,92 0,8777 0,95 vehicle0 0,93 0,92 0,91 0,9289 0,97 ecoli1 0,86 0,91 0,89 0,9114 0,91 new-thyroid2 0,94 0,97 0,98 0,9802 0,99 new-thyroid1 0,91 0,96 0,99 0,97 0,99 ecoli2 0,86 0,88 0,90 0,8905 0,93 segment0 0,98 0,99 0,99 0,9919 0,99 glass6 0,81 0,88 0,92 0,8896 0,95 yeast3 0,86 0,89 0,92 0,9117 0,91 ecoli3 0,73 0,81 0,87 0,8326 0,90 page-blocks0 0,92 0,95 0,94 0,9458 0,90 Referencias Tabla 5 Resultados de la prueba estadística de Friedman. Algoritmos Ranking C C4.5+Smote 3.25 C4.5+S-ENN Cost.Sens IRBASIR-D Iman-Davemport (distribución de F con 4 y 84 grados de libertad) valor de p: Tabla 6 Prueba de Holm para α=0.5, tomando como método de control IRBASIR-D. i Algoritmos z=(r0-ri)/se p Holm/Hochberg/ Hipótesis Hommel 4 C rechaza 3 C4.5+Smote rechaza 2 Cost.Sens rechaza 1 C4.5+S-ENN acepta Batista, G. E. A. P. A., R. C. Prati, et al. (2004). "A study of the behaviour of several methods for balancing machine learning training data." SIGKDD Explorations 6(1):
9 Bradley, A. P. (1997). "The use of the area under the ROC curve in the evaluation of machine learning algorithms." Pattern Recognition 30(7): Bunkhumpornpat, C., et al. (2009). Safe-Level-SMOTE: Safe-Level-Synthetic Minority Over-Sampling TEchnique for Handling the Class Imbalanced Problem. Pacific-Asia Conference on Knowledge. Discovery and Data Mining (PAKDD09), Springer. Chawla, N. V., et al. (2002). "SMOTE: Synthetic minority over-sampling technique." Journal of Artificial Intelligent Research 16: Estabrooks, A., et al. (2004). "A multiple resampling method for learning from imbalanced data sets." Computational Intelligence. 20(1): Fernández, A., S. García, et al. (2008). "A study of the behaviour of linguistic fuzzy rule based classification systems in the framework of imbalanced data-sets." Fuzzy Sets and Systems 159(18): Fernández, A. e. a. (2010). "On the 2-tuples based genetic tuning performance for fuzzy rule based classification systems in imbalanced data-sets." Information Sciences 180: Filiberto, Y., R. Bello, et al. (2011b). "Algoritmo para el aprendizaje de reglas de clasificación basado en la teoría de los conjuntos aproximados extendida." DYNA año : Filiberto, Y., R. Bello, et al. (2010a). "Using PSO and RST to Predict the Resistant Capacity of Connections in Composite Structures." In International Workshop on Nature Inspired Cooperative Strategies for Optimization (NICSO 2010) Springer: Filiberto, Y., R. Bello, et al. (2011a). "Una medida de la Teoría de los Conjuntos Aproximados para sistemas de decisión con rasgos de dominio continuo." Revista de Ingeniería de la Universidad de Antioquia Science Citation Index Expanded (SCIE) del ISI 2(60): Grzymala-Busse, J. W. (1992). "LERS- A system for learning from examples based on rough sets." Intelligent Decision Support, Handbook of Applications and Advances of the Rough Sets Theory: Grzymala-Busse, J. W. (1993). The rule induction systems LERS Q: a version for personal computers. In Proceedings of the International Workshop on Rough Sets and Knowledge Discovery. Grzymala-Busse, J. W. (2002). MLEM2: A new algorithm for rule induction from imperfect data. Proceedings of the 9th International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems, IPMU 2002, Annecy, France. Grzymala-Busse, J. W. (2004). "Three Strategies to Rule Induction from Data with Numerical Attributes." Transactions on Rough Sets II, LNCS 3135: Han, H., et al. (2009). Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning. International Conference on Intelligent Computing (ICIC05) LNCS. 9
10 Huang, J. and C. X. Ling (2005). "Using AUC and accuracy in evaluating learning algorithms." IEEE Transactions on Knowledge and Data Engineering 17(3): Huang, Y. M., et al. (2006). "Evaluation of neural networks and data mining methods on a credit assessment task for class imbalance problem." Nonlinear Analysis: Real World Applications 7(4): MacQueen, J. B. (1967). Some methods for classification and analysis of multivariate observations. 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California. Mazurowski, M., et al. (2008). "Training neural network classifiers for medical decision making: The effects of imbalanced datasets on classification performance." Neural Networks 21(2-3): Michalski, R. S. (1983). "A theory and methodology of inductive learning. In: Michalski,." Machine Learning: An Artificial Intelligence Approach: Mienko, R. and J. Stefanowski, et al. (1996). "Discovery-oriented induction of decision rules." Cahier du Lamsade 141. Mitra, S., et al. (2010). "Shadowed c-means: Integrating fuzzy and rough clustering." Pattern Recognition 43: Orriols-Puig, A. and E. Bernad o-mansilla (2009). "Evolutionary rule based systems for imbalanced datasets." Soft Computing 13(1): 21. Pawlak, Z. and A. Skowron (2007). "Rough sets: Some extensions." Information Sciences 177: Peng, X., et al. (2008). "Robust BMPM training based on second-order cone programming and its application in medical diagnosis." Neural Networks 21(2-3): Provost, F., et al. (2001). "Robust classification for imprecise environments." Machine Learning Research 42(3): Qin, K., et al. (2007). "On Covering Rough Sets." Lectures Notes on Artificial Intelligence 4481: Quinlan, J. R. (1993). C-4.5: Programs for machine learning. San Mateo, California. Skowron, A. (1993). "Boolean reasoning for decision rules generation. In: Komorowski." Methodologies for Intelligent Systems. Lectures Notes in Artificial Intelligence Springer 689: Skowron, A. and J. Stepaniuk (1996). "Tolerance approximation spaces." Fundamenta Informaticae 27: Stefanowski, J. (1998). The rough set based rule induction technique for classification problems. In Proceedings of 6th European Conference on Intelligent Techniques and Soft Computing EUFIT 98, Aachen. Stefanowski, J. (2007). "On combined classiffers, rule induction and rough sets." Transactions on Rough Sets VI, Springer LNCS 4374:
11 Stefanowski, J. and S. Nowaczyk (2005). On using rule induction in multiple classiffiers with a combiner aggregation strategy. In Proc. of the 5th Int. Conference on Intelligent Systems Design and Applications - ISDA 2005, IEEE Press. Stefanowski, J. and D. Vanderpooten (1994). "A general two-stage approach to inducing rules from examples." Rough sets, Fuzzy sets and Knowledge Discovery Springer: Stefanowski, J. and S. Wilk (2009). "Extending Rule-Based Classifiers to Improve Recognition of Imbalanced Classes." Advances in Data Management SCI 223: Sun, Y., el al. (2007). "Cost-sensitive boosting for classification of imbalanced data." Pattern Recognition 40: Sun, Y., A. K. C. Wong, et al. (2009). "Classification of imbalanced data: A review." International Journal of Pattern Recognition and Articial Intelligence 23(4): Suresh, S. e. a. (2008). "Risk-sensitive loss functions for sparse multi-category classification problems." Information Sciences 178(12): Tsumoto, S. (1998). "Extraction of experts decision rule from clinical databases using rough set model." Intelligent Data Analysis 2: Wang, X., J. Yang, et al. (2006). "Rough set feature selection and rule induction for prediction of malignancy degree in brain glioma." Computer methods and programs in Biomedicine 83: Wu, G. and E. Chang (2005). " KBA: kernel boundary alignment considering imbalanced data distribution." IEEE Transactions on Knowledge Data Engineering 17(6): Xindong, W. (2008). "Top 10 algorithms in data mining." Knowledge Information System 14: Xu, L., et al. (2007). "Power distribution fault cause identification with imbalanced data using the data mining-based fuzzy classification EAlgorithm." IEEE Transactions on Power Systems 22(1): Yang, Q. and X. Wu (2006). "10 challenging problems in data mining research." International Journal of Information Technology and Decision Making 5(4):
Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos).
Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos). Autores: - MsC. Ing. Mario L. Basulto Núñez (ETECSA) mario.basulto@etecsa.cu - Lic.
Más detallesDyna ISSN: Universidad Nacional de Colombia Colombia
Dyna ISSN: 0012-7353 dyna@unalmed.edu.co Universidad Nacional de Colombia Colombia FILIBERTO, YAIMA; BELLO, RAFAEL; CABALLERO, YAILÉ; FRÍAS, MABEL ALGORITMO PARA EL APRENDIZAJE DE REGLAS DE CLASIFICACION
Más detallesCapítulo 3. Estimación de elasticidades
1 Capítulo 3. Estimación de elasticidades Lo que se busca comprobar en esta investigación a través la estimación econométrica es que, conforme a lo que predice la teoría y lo que ha sido observado en gran
Más detallesUna investigación australiana reveló que posiblemente la disminución
CIENTÍFICOS TRABAJAN EN DETECCIÓN DE CÁNCER DE MAMA A TRAVÉS DE REDES NEURONALES ARTIFICIALES Constituye un apoyo para el médico y los radiólogos para evitar falsos diagnósticos Fernando Álvarez Una investigación
Más detallesCAPÍTULO 4: ALGORITMOS DE APRENDIZAJE
Capítulo 4 Algoritmos de Aprendizaje 26 CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE En este capítulo se proporcionan las descripciones matemáticas de los principales algoritmos de aprendizaje para redes neuronales:
Más detallesTEMA 5. MUESTREO PARA LA ACEPTACIÓN.
TEMA 5. MUESTREO PARA LA ACEPTACIÓN. Introducción. Planes de muestreo por atributos simple, doble, múltiple y rectificativos Dodge-Romig, Norma militar 1000STD-105D. Pautas a seguir para el cambio de rigor
Más detallesAnálisis y cuantificación del Riesgo
Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el
Más detallesConclusiones. Particionado Consciente de los Datos
Capítulo 6 Conclusiones Una de las principales conclusiones que se extraen de esta tesis es que para que un algoritmo de ordenación sea el más rápido para cualquier conjunto de datos a ordenar, debe ser
Más detallesAprendizaje Computacional. Eduardo Morales y Jesús González
Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas
Más detallesEl Rol Estratégico de los Sistemas de Información. Aplicaciones de sistemas clave en la organización (1)
El Rol Estratégico de los Sistemas de Información Aplicaciones de sistemas clave en la organización (1) Puesto que en una organización hay diferentes intereses, especialidades y niveles, hay diferentes
Más detallesImpacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información
Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.
Más detallesLa Formulación de los Antecedentes del Problema de Investigación Científica. (The Formulation of the Scientific Research Problem Background)
La Formulación de los Antecedentes del Problema de Investigación Científica (The Formulation of the Scientific Research Problem Background) Abreu, José Luis* Resumen. Se establece que los antecedentes
Más detallesCorrespondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech
Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech Resumen Todo documento XBRL contiene cierta información semántica que se representa
Más detallesINFORME SOBRE LA NATURALEZA Y MAGNITUD ASOCIADAS AL SUBSIDIO DE LA GASOLINA EN VENEZUELA
INFORME SOBRE LA NATURALEZA Y MAGNITUD ASOCIADAS AL SUBSIDIO DE LA GASOLINA EN VENEZUELA Caracas, Enero de 2012 1 INTRODUCCIÓN El juego de la oferta y demanda de bienes y servicios puede llegar generar
Más detallesEjercicios de Programación Lineal
Ejercicios de Programación Lineal Investigación Operativa Ingeniería Informática, UCM Curso 8/9 Una compañía de transporte dispone de camiones con capacidad de 4 libras y de 5 camiones con capacidad de
Más detallesEJEMPLO DE REPORTE DE LIBERTAD FINANCIERA
EJEMPLO DE REPORTE DE LIBERTAD FINANCIERA 1. Introduccio n El propósito de este reporte es describir de manera detallada un diagnóstico de su habilidad para generar ingresos pasivos, es decir, ingresos
Más detallesCapítulo 7 Conclusiones y futuras líneas de trabajo 7.1. Conclusiones
Capítulo 7 Conclusiones y futuras líneas de trabajo 7.1. Conclusiones La tesis presentada propone una metodología para el análisis de la degradación por fatiga producida por la aplicación de cargas cíclicas
Más detallesIntegrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es)
UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Exactas y Naturales Departamento de Computación Trabajo Práctico de Metaheurística Segundo cuatrimestre 2010 Implementación de un Algoritmo basado en la
Más detallesUNIDAD 4 PROCESOS DE MARKOV
UNIDAD 4 PROCESOS DE MARKOV Anteriormente se han cubierto modelos estáticos, esto es, modelos cuyos parámetros permanecen sin cambio a través del tiempo. Con excepción de programación dinámica donde se
Más detallesMLM 1000 - Matemática Discreta
MLM 1000 - Matemática Discreta L. Dissett Clase 04 Resolución. Lógica de predicados c Luis Dissett V. P.U.C. Chile, 2003 Aspectos administrativos Sobre el tema vacantes: 26 personas solicitaron ingreso
Más detallesEl Muestreo para la aceptación de lotes puede ser un método complementario a otros métodos de muestreo tradicionales.
El Muestreo para la aceptación de lotes puede ser un método complementario a otros métodos de muestreo tradicionales. El tipo de medida de frecuencia que se utiliza para la medición de muchos de los indicadores
Más detallesLección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009
Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios Dra. Noemí L. Ruiz Limardo 2009 Objetivos de la Lección Al finalizar esta lección los estudiantes: Identificarán, de una lista de expresiones
Más detallesTutorial: Uso básico de RapidMiner Parte II: Predicción de variables categóricas
Tutorial: Uso básico de RapidMiner Parte II: Predicción de variables categóricas En esta segunda parte del tutorial, se presentará un ejemplo que enseñe cómo predecir una variable categórica. Es altamente
Más detallesBase de datos relacional
Base de datos relacional Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para modelar problemas reales y administrar
Más detallesDespués de que un producto agrícola sale de la explotación agrícola, puede pasar a través de uno o incluso dos mercados mayoristas y una cadena de
1 Los precios son un importante factor económico en una economía de mercado. Desde el punto de vista del análisis económico los precios son el medio de agregación para proporcionar un panorama general
Más detallesCAPÍTULO 1. EL ANÁLISIS PROBABILÍSTICO DE SEGURIDAD.
CAPÍTULO 1. EL ANÁLISIS PROBABILÍSTICO DE SEGURIDAD. Un análisis probabilístico de seguridad (APS) es un término general para una valoración de riesgo, para el cual se desarrollan modelos para representar
Más detalles1. Generalidades. Nombre de la asignatura o unidad de aprendizaje. Apertura de negocios. Clave asignatura. Ciclo LA945. Modulo tercero (integración)
Nombre de la asignatura o unidad de aprendizaje Apertura de negocios Ciclo Modulo tercero (integración) Clave asignatura LA945 Objetivo general de la asignatura: El alumno analizará las bases para la apertura
Más detallesITIL Lite. Autor: Norberto Figuerola
ITIL Lite Autor: Norberto Figuerola ITIL fue desarrollado por el gobierno del Reino Unido en la década de 1980 como un esfuerzo para buscar las mejores prácticas para la gestión de servicios de TI. Pasados
Más detallesModelos y Bases de Datos
Modelos y Bases de Datos MODELOS Y BASES DE DATOS 1 Sesión No. 10 Nombre: Álgebra Relacional Contextualización En qué consiste el álgebra relacional? Se ha planteado hasta el momento cada uno de los procesos
Más detallesInteligencia Artificial. Grado en INFORMÁTICA 4º curso. Modalidad: Presencial
Grado en INFORMÁTICA 4º curso Modalidad: Presencial Sumario Datos básicos 3 Breve descripción de la asignatura 4 Requisitos previos 4 Objetivos 4 Competencias 5 Contenidos 6 Metodología 6 Criterios de
Más detallesColegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio
Refo 07 2004 15 al 19 de noviembre 2004 Colegio Alexander von Humboldt - Lima Tema: La enseñanza de la matemática está en un proceso de cambio La enseñanza de la matemática debe tener dos objetivos principales:
Más detallesMICROECONOMÍA II PRÁCTICA TEMA III: MONOPOLIO
MICROECONOMÍA II PRÁCTICA TEMA III: MONOPOLIO EJERCICIO 1 Primero analizamos el equilibrio bajo el monopolio. El monopolista escoge la cantidad que maximiza sus beneficios; en particular, escoge la cantidad
Más detallesModeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach
JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 52(6):460-475, 2001 Modeling the Retrieval Process for an Information Retrieval System using an Ordinal Fuzzy Linguistic Approach
Más detalles5- Uso de sentencias avanzadas
Objetivos: 5- Uso de sentencias avanzadas Elaborar sentencias de manejo de datos. Recursos: Microsoft SQL Server Management Studio Guías prácticas. Introducción: Después de trabajar con las sentencias
Más detallesTemas de electricidad II
Temas de electricidad II CAMBIANDO MATERIALES Ahora volvemos al circuito patrón ya usado. Tal como se indica en la figura, conecte un hilo de cobre y luego uno de níquel-cromo. Qué ocurre con el brillo
Más detallesPropuesta de Proyecto de Trabajo de Grado. Tema: Herramienta de Soporte a la Ingeniería de Requerimientos para Aplicaciones Web
Propuesta de Proyecto de Trabajo de Grado Tema: Herramienta de Soporte a la Ingeniería de Requerimientos para Aplicaciones Web Alumnos: Daniel Eduardo Rivas López (erivas17@gmail.com) o C.I: 3.211.767
Más detallesModulo 1 El lenguaje Java
Modulo 1 El lenguaje Java 13 - Codificación en Java Una de las grandes diferencias entre Java y Pascal en cuando a la codificación es que Java se trata de un lenguaje de los llamados case sensitive Esto
Más detallesPARA COMERCIANTES Y AUTÓNOMOS. INFORMACIÓN SOBRE TARJETAS DE CRÉDITO.
PARA COMERCIANTES Y AUTÓNOMOS. INFORMACIÓN SOBRE TARJETAS DE CRÉDITO. QUÉ DEBES SABER CUANDO ACEPTAS UNA TARJETA COMO FORMA DE PAGO EN TU ESTABLECIMIENTO? Hace ya muchos años que la mayoría de las microempresas
Más detallesInstituto Tecnológico de Costa Rica
Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación Proyecto Programado: Revisión de Utilización Médica: Aplicación Web para el control de pacientes en hospitales de Puerto Rico Práctica
Más detallesLOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1
LOS RETOS DE LA ENSEÑANZA EN LA INGENIERÍA 1 Horacio Ramírez de Alba* En este escrito se presenta un panorama de la profesión de la ingeniería y su relación con el desarrollo del país, y a partir de ello
Más detallesUNIDAD Nº IV ANALISIS FINANCIERO. Administración de Empresas. Prof. Robert Leal
UNIDAD Nº IV ANALISIS FINANCIERO Administración de Empresas. Prof. Robert Leal LAS FINANZAS Las finanzas son las actividades relacionadas con los flujos de capital y dinero entre individuos, empresas,
Más detalles2.1 Planificación del Alcance
2. Gestión del Alcance del Proyecto La Gestión del Alcance del Proyecto incluye los procesos necesarios para asegurarse que el incluya todo el trabajo requerido, y sólo el trabajo requerido, para completar
Más detallesELECTRICIDAD BÁSICA EN REPARACIÓN DE AUTOMÓVILES
ELECTRICIDAD BÁSICA EN REPARACIÓN DE AUTOMÓVILES 1) CONCEPTOS BÁSICOS DE ELECTRICIDAD 1.1 TEORÍA ELECTRÓNICA Los físicos distinguen cuatro diferentes tipos de fuerzas que son comunes en todo el Universo.
Más detallesActividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.
Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas
Más detallesIntroducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012
Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces
Más detallesCAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas
CAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas Introducción En la economía, la variación de alguna cantidad con respecto a otra puede ser descrita por un concepto promedio o por un concepto
Más detallesCapítulo 1. Introducción
Capítulo 1 Introducción 1.1 Antecedentes La producción musical, en su mayoría, se ha valido de distintos tipos de software computacional para realizar la edición de composiciones musicales. De toda la
Más detallesFONDO SOLIDARIO DE JUBILADOS DE LA UNSJ
FONDO SOLIDARIO DE JUBILADOS DE LA UNSJ Capítulo I DESCRIPCIÓN DEL GRUPO DE AFILIADOS JUBILADOS ADHERENTES A los efectos de tener una idea del comportamiento del universo estadístico de los futuros jubilados
Más detallesTratamiento del Riesgo
Tratamiento del Riesgo 1 En que consiste el tratamiento de los riesgos? 2. Cuando debemos enfrentarnos a los riesgos? 3. Estrategias de tratamiento de riesgos 4. Modelo de Análisis de Riesgos 5. Qué pasos
Más detallesExtracción de características de Galton de Huellas Dactilares por procesamiento digital de la imagen.
Extracción de características de Galton de Huellas Dactilares por procesamiento digital de la imagen. BAEZ MOYANO, Luciano Martín Universidad Tecnológica Nacional, Facultad Regional Córdoba Abstract El
Más detallesRespuestas: Consulta para una Estrategia Nacional de Propiedad Industrial
Respuestas: Consulta para una Estrategia Nacional de Propiedad Industrial Con el fin de poder formular una propuesta de Estrategia Nacional de Propiedad Industrial (en adelante PI) para Chile, la cual
Más detallesHERRAMIENTAS DE EXCEL PARA EL ANALISIS Y VALORACION DE PROYECTOS DE INVERSION (I)
Revista de Dirección y Administración de Empresas. Número 10, diciembre 2002 págs. 59-76 Enpresen Zuzendaritza eta Administraziorako Aldizkaria. 10. zenbakia, 2002 abendua 59-76 orr. HERRAMIENTAS DE EXCEL
Más detallesCAPÍTULO 2 IMPORTANCIA DE LA ASIGNATURA OUTSOURCING EN TECNOLOGÍAS DE INFORMACIÓN
CAPÍTULO 2 IMPORTANCIA DE LA ASIGNATURA OUTSOURCING EN TECNOLOGÍAS DE INFORMACIÓN CAPÍTULO 2 IMPORTANCIA DE LA ASIGNATURA OUTSOURCING EN TECNOLOGÍAS DE INFORMACIÓN 2.1 INTRODUCCIÓN. En este capítulo se
Más detallesFigure 16-1: Phase H: Architecture Change Management
Fase H Administración del cambio en la Arquitectura Figure 16-1: Phase H: Architecture Change Management Objetivos Los objetivos de la Fase H son: Asegurarse de que el ciclo de vida de arquitectura se
Más detalles1.1 Qué es la regresión
Artículo Revista digital Matemática, Educación e Internet (http://www.tec-digital.itcr.ac.cr/revistamatematica/). Vol 13, No 1. Agosto Febrero 2013. Análisis de regresión para la población de Costa Rica.
Más detallesPrimeramente debe conocer que los objetivos específicos de este tema son:
Primeramente debe conocer que los objetivos específicos de este tema son: Sistematizar las operaciones aritméticas con números naturales y fraccionarios así como las propiedades que estas cumplen. Resolver
Más detallesLos estados financieros proporcionan a sus usuarios información útil para la toma de decisiones
El ABC de los estados financieros Importancia de los estados financieros: Aunque no lo creas, existen muchas personas relacionadas con tu empresa que necesitan de esta información para tomar decisiones
Más detallesEl Costeo Directo, una Necesidad para la Toma de Decisiones
El, una Necesidad para la Toma de Decisiones Ficha Técnica Autor : C.P.C. Isidro Chambergo Guillermo Título : El, una Necesidad para la Toma de Decisiones Fuente : Actualidad Empresarial, Nº 17 - Primera
Más detallesNORMA ISO 31000 DE RIESGOS CORPORATIVOS
NORMA ISO 31000 DE RIESGOS CORPORATIVOS La norma ISO 31000 establece principios y guías para el diseño, implementación y mantenimiento de la gestión de riesgos en forma sistemática y transparente de toda
Más detallesAnálisis de propuestas de evaluación en las aulas de América Latina
Esta propuesta tiene como objetivo la operatoria con fracciones. Se espera del alumno la aplicación de un algoritmo para resolver las operaciones. Estas actividades comúnmente presentan numerosos ejercicios
Más detallesMOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA
MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA José Raúl Vaquero Pulido Presidente Asociación Hispana de Documentalistas en Internet http://www.documentalistas.com "La indización automática es la
Más detallesUnidad 5 Utilización de Excel para la solución de problemas de programación lineal
Unidad 5 Utilización de Excel para la solución de problemas de programación lineal La solución del modelo de programación lineal (pl) es una adaptación de los métodos matriciales ya que el modelo tiene
Más detallesPRUEBAS DE HIPÓTESIS
PRUEBAS DE HIPÓTESIS Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe
Más detallesPÓSTER 9. Entrenamiento en habilidades en el mantenimiento de equipos informáticos. Pedro García Fernández
PÓSTER 9 Entrenamiento en habilidades en el mantenimiento de equipos informáticos Pedro García Fernández Departamento de Electrónica y Tecnología de Computadores. Ingeniería Técnica en Informática de Sistemas
Más detallesBASE DE DATOS RELACIONALES
BASE DE DATOS RELACIONALES Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para implementar bases de datos ya
Más detallesMINERIA DE DATOS Y Descubrimiento del Conocimiento
MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de
Más detallesEL DISEÑO FACTORIAL COMPLETO 2 2
EL DISEÑO FACTORIAL COMPLETO 2 2 Joan Ferré Grupo de Quimiometría y Cualimetría Departamento de Química Analítica y Química Orgánica Universidad Rovira i Virgili (Tarragona) INTRODUCCIÓN Para optimizar
Más detallesINSTITUTO UNIVERSITARIO DE SISTEMAS INTELIGENTES Y APLICACIONES NUMÉRICAS EN INGENIERÍA TRABAJO FINAL DE MÁSTER:
INSTITUTO UNIVERSITARIO DE SISTEMAS INTELIGENTES Y APLICACIONES NUMÉRICAS EN INGENIERÍA TRABAJO FINAL DE MÁSTER: Sistema Biométrico de Detección Facial sobre Alumno: Marcos del Pozo Baños Tutor: Dr. Modesto
Más detalles12 Minería de Datos Reglas de asociación.
Objetivos: 12 Minería de Datos Reglas de asociación. Genera reportes a partir de técnicas de Data Mining. Utiliza software de Data Mining. Recursos: Guías prácticas. Datos ejemplo. http://rapidminer.com
Más detallesConstrucción de Escenarios
Construcción de Escenarios Consiste en observar los diferentes resultados de un modelo, cuando se introducen diferentes valores en las variables de entrada. Por ejemplo: Ventas, crecimiento de ventas,
Más detalles1-9 August 2003, Berlin
World Library and Information Congress: 69th IFLA General Conference and Council 1-9 August 2003, Berlin Code Number: 014-S Meeting: 91. Education and Training Simultaneous Interpretation: Yes Informe
Más detalles2. LOS SISTEMAS DE COSTOS
2. LOS SISTEMAS DE COSTOS En el actual desarrollo de las técnicas y sistemas de costos se persiguen tres importantes objetivos: La medición de los costos, la más correcta y precisa asignación de costos
Más detallesInforme de cálculo de índices sintéticos para la LBI I+D+i de TIC. Observatorio Colombiano de Ciencia y Tecnología OCyT
Informe de cálculo de índices sintéticos para la LBI I+D+i de TIC Observatorio Colombiano de Ciencia y Tecnología OCyT Bogotá, D.C., julio de 2015 Tabla de contenido Introducción... 2 Los índices sintéticos
Más detallesOverall Equipment Effectiveness
Overall Equipment Effectiveness Cuando hablamos de mejora continua en un área de producción o de manufactura el OEE es el indicador clave para medir la eficiencia de una maquina o una línea de trabajo.
Más detallesContabilidad Orientada a los Negocios
Tema 5 Introducción Como todos sabemos, al pagar por alguna cosa, cualquiera que esta sea, que jamás haya sido utilizada, se debe desembolsar una cantidad de dinero, esto es porque, al igual que todas
Más detallesforma de entrenar a la nuerona en su aprendizaje.
Sistemas expertos e Inteligencia Artificial,Guía5 1 Facultad : Ingeniería Escuela : Computación Asignatura: Sistemas expertos e Inteligencia Artificial Tema: SISTEMAS BASADOS EN CONOCIMIENTO. Objetivo
Más detalles5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial. Curso de doctoramiento Técnicas de Computación Flexíbeis
5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial Curso de doctoramiento Técnicas de Computación Flexíbeis Learning Vector Quantization (LVQ) Versión supervisada de SOM (SOM
Más detallesPOR QUÉ EL VALOR PRESENTE NETO CONDUCE A MEJORES DECISIONES DE INVERSIÓN QUE OTROS CRITERIOS? ( Brealey & Myers )
CAPÍTULO 5 POR QUÉ EL VALOR PRESENTE NETO CONDUCE A MEJORES DECISIONES DE INVERSIÓN QUE OTROS CRITERIOS? ( Brealey & Myers ) Ya hemos trabajado antes con los principios básicos de la toma de decisiones
Más detallesOperación 8 Claves para la ISO 9001-2015
Operación 8Claves para la ISO 9001-2015 BLOQUE 8: Operación A grandes rasgos, se puede decir que este bloque se corresponde con el capítulo 7 de la antigua norma ISO 9001:2008 de Realización del Producto,
Más detallesPor el rápido crecimiento de Internet la tecnología se ha tenido que adaptar para cubrir las
Capítulo 1 Introducción Por el rápido crecimiento de Internet la tecnología se ha tenido que adaptar para cubrir las demandas de mayor ancho de banda. Para cubrir esta demanda los proveedores de Internet
Más detallesDiagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-
Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics- 1. Introducción Ficheros de datos: TiempoaccesoWeb.sf3 ; AlumnosIndustriales.sf3 El objetivo de esta práctica es asignar un modelo
Más detallesIntroducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual
Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los
Más detallesAUTORA: Juárez Castro Yaric Maritza. Estudiante de la Escuela Profesional de Ingeniería de Sistemas. Universidad Católica Los Ángeles de Chimbote
PERFIL DEL NIVEL DE GESTIÓN DEL DOMINIO PLANIFICAR Y ORGANIZAR DE LAS TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACIONES (TIC) EN LA MUNICIPALIDAD DISTRITAL DE CASTILLA, REGIÓN PIURA, 2013. PROFILE OF THE LEVEL
Más detallesAprobado el proyecto de Ley de Sociedades Cooperativas Andaluza Domingo, 11 de Septiembre de 2011 22:59
El Consejo de Gobierno de la Junta de Andalucía ha aprobado el proyecto de Ley de Sociedades Cooperativas Andaluzas, que reforzará la capacidad competitiva y atenderá las demandas de este sector estratégico
Más detalles*1460507* FCCC/SBI/2014/5. Convención Marco sobre el Cambio Climático. Naciones Unidas
Naciones Unidas Convención Marco sobre el Cambio Climático Distr. general 1 de abril de 2014 Español Original: inglés FCCC/SBI/2014/5 Órgano Subsidiario de Ejecución 40º período de sesiones Bonn, 4 a 15
Más detalles2.- Métodos para la medición de la pobreza
2.- Métodos para la medición de la pobreza Existen tres enfoques principales para la medición de la pobreza y cada uno contiene diversas metodologías para la identificación de los pobres (Boltvinik, 1999).
Más detallesÍn d i c e ALGUNAS NOTAS SOBRE EL FÚTBOL EN CATEGORÍAS DE FORMACIÓN. Fútbol Base: El entrenamiento en categorías de formación
Fútbol Base: El entrenamiento en categorías de formación Ín d i c e INTRODUCCIÓN 11 ALGUNAS NOTAS SOBRE EL FÚTBOL EN CATEGORÍAS DE FORMACIÓN Algunas notas sobre el fútbol en categorias de formación 12
Más detallesEstudio Técnico INTRODUCCIÓN
Estudio Técnico INTRODUCCIÓN Cuando la empresa o persona a decidido generar o fabricar parte de los productos o servicios que el mercado demanda para satisfacer sus necesidades, en ese momento se deben
Más detallesActividades Complementarias.
4.1. Balanceo de Líneas. Unidad IV Monitoreo y Control de Operaciones El análisis de las líneas de producción es el foco central del análisis de disposiciones físicas por productos. El diseño del producto
Más detallesControl de Inventarios SisMod
Control de Inventarios SisMod Para conocer y trabajar con la aplicación de SisMod en el modulo de control de inventarios, debemos realizar los siguientes pasos: Ejecutar la aplicación SisMod, dando doble
Más detallesMANUAL DE USUARIO. Sistema de Administración de Proyectos de Vinculación con la Colectividad (SAPVC) MANUAL DE USUARIO DOCENTE
PAGINA: 1 / 17 MANUAL DE USUARIO DOCENTE SISTEMA DE ADMINISTRACIÓN DE PROYECTOS DE VINCULACIÓN CON LA COLECTIVIDAD (SAPVC) UPSE PAGINA: 2 / 17 ÍNDICE 1 Introducción... 3 2 Generalidades del Sistema...
Más detallesLA ESTRATEGIA NACIONAL DE BOSQUES Y CAMBIO CLIMÁTICO
LA ESTRATEGIA NACIONAL DE BOSQUES Y CAMBIO CLIMÁTICO LA ESTRATEGIA NACIONAL DE BOSQUES Y CAMBIO CLIMÁTICO En palabras simples, el Cambio Climático es la modificación del clima que actualmente ocurre en
Más detallesDiseño Estructurado de Algoritmos
Diseño Estructurado de Algoritmos 1 Sesión No. 5 Nombre: Primitivas para el diseño de instrucciones. Segunda parte. Objetivo de la sesión: Al concluir la sesión el estudiante identificará las diferentes
Más detallesPROGRAMACIÓN POR METAS CON NIVELES DE ASPIRACIÓN IMPRECISOS
Revista de Dirección y Administración de Empresas. Número 19, diciembre 2012 págs. 117-128 Enpresen Zuzendaritza eta Administrazio Aldizkaria. 19. zenbakia, 2012 abendua 117-128 orr. PROGRAMACIÓN POR METAS
Más detallesEl Sistema de Actualización Dinámica del Mapa Acústico de Madrid
paper ID: A085 /p.1 El Sistema de Actualización Dinámica del Mapa Acústico de Madrid P. Perera a & J.S. Santiago b a Bauman Consultoría Técnica, c/ Santa Isabel 19, Pozuelo de Alarcón, 28224 Madrid, placidop@telefonica.net
Más detallesElementos requeridos para crearlos (ejemplo: el compilador)
Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción
Más detallesSistema Inteligente para la elaboración de Mapas Tendenciales de Uso de Suelo. Alberto Ochoa Sandra Bustillos Chloë Malépart Fernando Urbina
Sistema Inteligente para la elaboración de Mapas Tendenciales de Uso de Suelo Alberto Ochoa Sandra Bustillos Chloë Malépart Fernando Urbina Los sistemas de información geográfica ayudan al hombre a modelar
Más detallesAproximación local. Plano tangente. Derivadas parciales.
Univ. de Alcalá de Henares Ingeniería de Telecomunicación Cálculo. Segundo parcial. Curso 004-005 Aproximación local. Plano tangente. Derivadas parciales. 1. Plano tangente 1.1. El problema de la aproximación
Más detallesCurso: Arquitectura Empresarial basado en TOGAF
Metodología para desarrollo de Arquitecturas (ADM) El ADM TOGAF es el resultado de las contribuciones continuas de un gran número de practicantes de arquitectura. Este describe un método para el desarrollo
Más detallesANALISIS MULTIVARIANTE
ANALISIS MULTIVARIANTE Es un conjunto de técnicas que se utilizan cuando se trabaja sobre colecciones de datos en las cuáles hay muchas variables implicadas. Los principales problemas, en este contexto,
Más detalles