LOS modelos de scoring crediticio son aplicaciones que

Tamaño: px
Comenzar la demostración a partir de la página:

Download "LOS modelos de scoring crediticio son aplicaciones que"

Transcripción

1 UNIVERSIDAD NACIONAL DE COLOMBIA 1 Técnicas de Minería de Datos Aplicadas a la Construcción de Modelos de Score Crediticio: Estado del Arte Andrés Yesid Ramírez A. Abstract Un score crediticio es una aplicación que determina si un individuo está en capacidad de cumplir con las exigencias de un crédito o por el contrario, puede presentar un comportamiento moroso o fraudulento. Este trabajo presenta una revisión a las técnicas más empleadas en los modelos de score crediticio desde el punto de vista computacional y de la Minería de Datos. Los modelos de score crediticio son ampliamente utilizados en compañías dedicadas a facilitar a sus clientes la adquisición de productos o servicios mediante la otorgación de un crédito. Adicionalmente, se presenta una comparación entre las técnicas aquí descritas y se exponen algunas aplicaciones de estos modelos en algunas comparías. Finalmente, se presentan las conclusiones de este trabajo. Index Terms scoring crediticio, riesgo, crédito, minería de datos, soft computing, redes neuronales, análisis discriminante, máquinas vectoriales de soporte, árboles de decisión, regresión logística. I. INTRODUCCIÓN LOS modelos de scoring crediticio son aplicaciones que permiten apoyar la toma de decisiones en prestigiosas compañías alrededor del mundo. Estos modelos surgen como una necesidad de poder evaluar de forma ágil y rápida las capacidades de endeudamiento de clientes ante la solicitud de un crédito. Aunque existen diversos tipos de compañías y distintos tipo de créditos, la idea general de un modelo de scoring crediticio es, por un lado, seleccionar aquellos individuos que poseen mejores condiciones económicas para retornar a la compañía el valor total del préstamo solicitado; por otra parte, los modelos de scoring crediticio permiten mitigar el riesgo en que se incurriría si se aprueba un crédito a un individuo que no cumple con una capacidad de pago y endeudamiento. En este trabajo se desea revisar algunas de las técnicas más importantes y empleadas alrededor del mundo en cuanto al tema de modelos de scoring automatizados. Estos modelos emplean información recolectada electrónicamente ya sea a través de bases de datos internas a la organización o adquiridos a partir de terceros. Las principales técnicas pueden incorporar análisis estadístico, herramientas de minería, inteligencia artificial y aprendizaje de máquina. En este trabajo se estudian varios modelos de score crediticio. Inicialmente se presenta un proceso general de cómo funciona la solicitud de un crédito. Luego se desarrolla una revisión de algunas técnicas de minería de datos que suelen ser Maestría en Ingeniería de Sistemas y Computación. utilizadas en la constucción de modelos de scroing crediticio. Adicionalmente, los modelos descritos son comparados de acuerdo a la referencia de los autores que han hecho contribuciones en el área. Luego, se presentan algunas consideraciones finales como aplicaciones y casos de éxito; finalmente se presentan las conclusiones de este trabajo. II. PROCESO GENERAL DE SOLICITUD DE CRÉDITO Existen dos formas de pagar un producto o servicio: de contado y a través de crédito. En el pago de contado, un producto o servicio es pagado inmediatamente se adquiere o se consume. En el pago a crédito, un prestamista se hace cargo del total de la obligación (i.e. el producto o servicio) mientras que el aplicante o solicitante al crédito deberá reincorporar en una o varias cuotas el valor que el prestamista cubrió; al valor de estas cuotas se le suma un valor adicional llamado interés el cual se cobra como una facilidad que proporcionó el prestamista. La solicitud de un crédito es una necesidad existente desde hace varios años en donde se tiene por objeto adquirir un beneficio a través de un producto o un servicio. Básicamente se fundamenta en un compromiso que se adquiere entre una entidad prestamista y un solicitane en donde el solicitante recibe un beneficio en el corto plazo y se compromete a pagarlo inmediatamente después de haberlo adquirido en el corto, mediano y/o largo plazo. Un crédito concedido puede ser empleado para adquirir un producto (e.g. vivienda, automovil) o un servicio (e.g. crédito educativo, uso de una tarjeta de crédito). Un proceso general que se suele dar al interior de las organizaciones al momento de aprovar un crédito puede darse en las siguientes condiciones: 1) Un individuo se acerca a la institución con la cual desea pactar un crédito. El tipo de crédito solicitado varía de industria a industria como por ejemplo, creditos para vivienda, para consumo, para educación, para pago de deudas, solicitud de tarjetas de crédito, etc. 2) La institución hace llenar al cliente uno o varios formularios en donde el individuo debe consignar información relacionada con él como por ejemplo sus datos básicos, referencias familiares, personales, laborales, ubicación, antiguedad y cargo laboral que posee a la actalida, etc. 3) Los datos registrados en los formularios son analizados por expertos y adicionalmente son procesados por software especializado, el scoring, el cual debe emitir una

2 UNIVERSIDAD NACIONAL DE COLOMBIA 2 respuesta la cual indica si es posible asignar inmediatamente un concepto favorable o negativo respecto a la información suministrada por el cliente. 4) Después de la evaluación, la entidad es responsable de entregarle una respuesta al cliente. Aunque este proceso es muy general, no todas las organizaciones emplean los mismos mecanismos para la evaluación de sus clientes o aplicantes. Adicionalmente, a veces el proceso puede ser completamente manual. Por otra parte, las entidades prestamistas procuran proteger sus inversiones, por esta razón prefieren negar créditos a personas que no poseen una capacidad clara de pago del beneficio adquirido. Si se acepta un crédito a un individuo que potencialmente puede incurrir en fraude, la entidad está entrando en gastos adicionales al no poder recuperar su inversión de la manera esperada. Los modelos de scoring crediticio nacen alrededor de los años 1950s cuando Bill Fair y Earl Isaac fundan su compañía dedicada a apoyar las actividades de importantes empresas financieras y de ventas al menudeo [1]. Posteriormente, en los años 1960s se inicia el periodo en el que se desarrolla la industria de las tarjetas de crédito con lo cual los bancos ven una gran posibilidad de empezar utilizar modelos de scoring [1]. III. REVISIÓN DE TÉCNICAS DE MINERÍA DE DATOS EMPLEADAS EN LA CONSTRUCCIÓN DE MODELOS DE SCORING CREDITICIO En esta sección se realiza una breve descripción de algunos de los modelos predictivos más empleados en el área de riesgo crediticio, especificamente se habla de algunas de las técnicas más importantes de minería de datos aplicadas a la construcción de modelos de scoring crediticio. Apoyándose en [2] una clasificación adecuada para las tésnicas influyentes en la construcción de modelos de score crediticio es: Modelos Estadísticos. Se consideran los siguientes metodos: Métodos Paramétricos 1. Comprenden técnicas como Análisis Discriminante (Discriminant Analysis) y Regresión Logística (Logistic Regression). Métodos No Paramétricos 2. Incluye técnicas de Árboles de Decisión, K-Nearest Neighbor (K-NN) y Kernel Density. Modelos de Computación Suave o Soft Computing. Se plantean principalmente dos modelos: Redes Neuronales Artificiales (Artificial Neural Networks, ANN). Máquinas Vectoriales de Soporte (Support Vector Machines, SVM). Conjuntos Rugosos (Rough Sets). Modelos Híbridos. Estos métodos representan una extensión a los modelos existentes y consisten en una combinación de técnicas estadísticas o de soft computing otros modelos relacionados. 1 Los métodos paramétricos requieren un conocimiento a priori acerca de las distribución de los datos. 2 No requieren información previa. Varios estudios se han desarrollado desde hace más de cuarenta años en donde se proponen modelos de scoring crediticio que permiten clasificar a los individuos de acuerdo a su capacidad de pago. En [1] se presenta un Estado del Arte en scoring crediticio y scoring comportamental. El artículo se concentra principalmente en mostrar lo que se ha hecho en el área desde la perspectiva de riesgo. Inicialmente se presenta la historia del scoring crediticio. Se vislumbran algunas de las variables que suelen ser importantes en un modelo como las características de la persona, el capital o valor solicitado, la capacidad de pago, las condiciones del mercado. Dentro del survey se mencionan técnicas empleadas en modelos de scoring como la Regresión Logística, Árboles de Decisión, Redes Neuronales, Algoritmos Genéticos y algunos modelos híbridos que aprovechan caracterísitcas de más de un modelo como la combinación de la Programación Lineal con el uso de Redes Neuronales. Por otra parte, se analiza el scoring comportamental o score aplicado sobre comportamientos en grupos de poblaciones. En este sentido se emplean técnicas que describen cómo es el comportamiento de un cliente de acuerdo a los rasgos de la población que lo rodean. Cuando se empezaron a desarrollar algunas de las técnicas de score crediticio, las soluciones que prevalecieron y que aun se utilizan son soluciones que aprovechan características estadísticas de los individuos a analizar. Los modelos más importantes son la Regresión Logística y el Análisis Discriminante Lineal. [3]establece que el Análisis Discriminate (Discriminant Analysis) y la Regresión Logística (Logistic Regression) con dos de las técnicas más empleadas en los modelos de scoring crediticio. El autor muestra que estas técnicas tienen ciertas deficiencias cuando existen datos con una alta dimensionalidad (i.e. muchos aributos a analizar), cuando la muestra o el número de ejemplos es bastante reducido, la selección de las variables y la incapacidad para modelar información no lineal. Similarmente, se han desarrollado trabajos que hacen importantes comparaciones entre estos dos modelos y otros mucho más elaborados. [4] hace una comparación entre el Análisis Discriminante, el Análisis de Probabilidad Unitaria (Probit Analysis) y las Redes Neuronales Artificiales (Artificial Neural Networks). De la misma manera, [5], [6], [7],[8] hacen comparaciones con otros modelos propuestos similares en donde los autores exponen las desventajas ante la falta de precisión de el Análisis Discriminante y la Regresión Logística. Nuevos modelos han surgido y están siendo ampliamente utilizados en la industria. Estos modelos han demostrado ser más efectivos que la Regresión Logística y el Análisis Discriminante Lineal y sus variantes. De los modelos más empleados se encuentran las Redes Neuronales.[9] expone en su trabajo una comparación de cinco arquitecturas de redes neuronales: Multi-Layer Perceptron (MLP), Mixture Of Experts (MOE), Función de Base Radial (Radial Base Function, RBF), Learning Vector Quantization (LVQ) y la Resonancia Adaptativa Difusa (Fuzzy Adaptive Resonance, FAR); adicionalmente [9] compara las redes neuronales con otros modelos como la Regresión Logística y el Análisis Discriminante. De la misma manera, el empleo de las Máquinas Vectoriales de

3 UNIVERSIDAD NACIONAL DE COLOMBIA 3 Soporte (Support Vector Machines, SVM) prometen mostrar mejores resultados de clasificación y predicción que como lo vienen mostrando las redes neuronales. [10], [11] emplean las Máquinas Vectoriales de Soporte y proponen modelos de scoring crediticio que, según sus experimentos, muestran mejor desempeño y exactitud en la predicción que aquel desempeño mostrado por las redes neuronales. Estos trabajos no concluyen contundentemente cuál de los modelos es mejor, pues el desempeño ante la predicción no es notoria de una manera significativa. Actualmente se están desarrollando nuevas técnicas que puedan mostrar un mejor desempeño. Algunas de estas técnicas consisten en la construcción de modelos híbridos que fusionen crcterísticas de técnicas estadísticas y de aprendizaje de máquina. [6] desarrolla un modelo híbrido que emplea redes neuronales artificiales y Curvas de Regresión Adaptativas Multivariadas (Multivariate Adaptative Regression Splines, MARS). Similarmente, [12] presenta una arquitectura híbrida para generar un modelo de scoring. Se fundamente en dos herramientas ampliamente utilizadas en la minería de datos: Clustering y Redes Neuronales. [7] muestra una combinación de las redes neuronales con el Análisis Discriminante. Todos estos modelos han mostrado ser exitosos, algunos más que otros. Sin embargo, hoy en día se suelen utilizar preferiblemente las redes neuronales con una aruitectura MLP, pues han demostrado ser precisas en las predicciones. Igualmente, los SVM están siendo implementados en distintas empresas y muestran un desempeño, en algunos casos, mejor al presentado por las redes neuronales. Sin embargo, estos modelos suelen ser poco descriptivos y se convierten en cajas negras, pues no se puede obtener información adicional que permita comprender otras características que afectan la decisión. Para solucionar este inconveniente se recurre a otras técnicas como los árboles de decisión y las generación de reglas los cuales son técnicas que son más descriptivas. [13] propone un modelo basado en la Programación Genética (Genetic Programming, GP) el cual se aplica en dos fases; este modelo genera reglas descriptivas de la clasificación que se le debe dar a un individuo. [14] proponen un modelo de scoring basado en GP el cual es comparado contra otros modelos tradicionales ampliamente empleados en el campo de scorings. La Programación Genética GP extrae automáticamente relaciones inteligibles en un sistema que ha sido usado en muchas aplicaciones como en la regresión simbólica y la clasificación. GP es similar a un árbol de decisión; posee conjunto de funciones que contienen sentencias y operadores y un conjunto terminal el cual contiene las entradas del modelo. El procesamiento es similar a los algoritmos genéticos. Aunque existen diversas técnicas con las cuales se puede desarrollar un modelo de scoring, en este trabajo sólo se habla de algunas de las más utilizadas en la industria. La Figura 1 muestra aquellos de los modelos más empleados en la industria: Para fines de este trabajo, se considera hacer una revisión sobre el Análisis Discriminante, la Regresión Logística, Árboles de Decisión, Redes Neuronales y las Máquinas Vectoriales de Figure 1. Modelos de Scoring Crediticio Soporte. Adicionalmente se explica brevemente, algunas de las técnicas híbridas que están siendo implementadas en la actualidad. A. Análisis Discriminante El Análisis Discriminante (Discriminant Analysis, DA) es una técnica de clasificación y discriminación propuesta por Fisher en 1936 [4]. Uno de los requerimientos importantes para poder emplear esta técnica dentro de un modelo de scoring crediticio es que los datos deben ser independientes y deben presentar una distribución normal [4]. De acuerdo a [7] DA es una de las técnicas más empleadas y discutidas dentro del campo de técnicas de clasificación. La idea general de DA es encontrar la mejor combinación lineal de las variables predictoras con el objetivo de clasificar los objetos en dos o más grupos procurando encontrar una exactitud de predicción óptima [7]. Esto es, maximizar la varianza intergrupos respecto a la varianza intra-grupo [8]. Tanto [4], [7] y [8] coinciden en que la ecuación de DA es una función lineal que posee la forma: Z = α + w 1 x 1 + w 2 x w n x n (1) Donde xi (i = 1,2,.., n) es conjunto de datos de entrada (i.e. vector de datos de entrada X), wi (j = 1, 2,..., n) o W es el vector de coeficientes o pesos discriminantes, α es el punto de intersección con un eje y Z es la variable discriminante (i.e. score discriminante). El vector de pesos W, de acuerdo a [5] debe ser tal que maximiza 3 : (W µ 1 W µ 2 )/(W ΣW ) (2) En este coeficiente o ratio, µ 1 y µ 2 son vectores medios poblacionales de dos categorías, W es el vector de pesos traspuesto y Σ es la matriz común de covarianza entre dos poblaciones. Esto quiere decir que si la diferencia entre los vectores medios de pesos es maximizado con relación a la covarianza común, el riesgo de mal-clasificar sería relativamente 3 Se asume que existen dos grupos dentro de la población. Como alcance de este trabajo, un modelo de scoring considera aquellos clientes que manejan su crédito de una manera excelente; el otro grupo son aquellos individuos que son morosos.

4 UNIVERSIDAD NACIONAL DE COLOMBIA 4 bajo [5]. Adicionalmente, [5] expone que DA debe asumir las siguientes condiciones: 1) Las variables predictoras deben ser medidas dentro de un intervalo. 2) la matriz de covarianza de las variables predictoras son iguales para dos grupos. 3) Las variables predictoras siguen una distribución normal multivariada. En [7] se indica que DA es ampliamente utilizado en muchas áreas del conocimiento como biología, medicina, educación, ingeniería, entre otras. B. Regresión Logística La Regresión Logística (Logistic Regression, LR) es una técnica estadística ampliamente utilizada en los modelos de score crediticio, así como en otras áreas. Esta técnica considera un conjunto de variables independientes o predictoras y una variable dependiente con dos posibles valores (i.e. variable dicótoma). De acuerdo a [5], la forma general es: 1 Z = 1 + e z (3) Donde Z es la probabilidad de la clase recordando que la variable dependiente posee dos valores posibles. Para el caso de un modelo de score, se consideran dos posibles resultados: un cliente con buen hábito de pago y uno moroso. Para complementar, z obedece a: de mercado, así como scoring crediticios para préstamos personales y aplicaciones con tarjetas de crédito. C. Árboles de Decisión Los Árboles de Decisión (Decision Trees, DT) son una popular herramienta utilizada en análisis estadístico y minería de datos. DT son ideales para realizar clasificaciòn y predicción [15] y en general, los métodos basados en árboles representan reglas. Según [15], los árboles de decisión son muy útiles en la exploración de datos en donde se desea encontrar relaciones en una cantidad enorme de datos. También DT combina la exploración y modelamiento de datos. Un Árbol de Decisión es una estructura que permite dividir un extenso conjunto de datos relacionados entre sí (i.e. registros), en conjuntos más pequeños de datos a través de la aplicación secuencial de sencillas reglas de decisión [15]. Adicionalmente, los Árboles de Decisión poseen una estructura de árbol donde cada nodo representa un prueba o condición sobre el valor de un atributo, las ramas representan el resultado de la evaluación del atributo y las hojas (i.e. nodos finales en el árbol) son las clases o variables dependientes [16]. La Figura 2 muestra un sencillo ejemplo de DT adaptado de [16] en donde se desea conocer qué tipo de población podría adquirir un computador; en este caso, la clase es saber si se compra o no computador teniendo como referencias atributos como edad, comportamiento crediticio y si es estudiante. z = α + w 1 x 1 + w 2 x w n x n (4) Donde xi (i = 1,2,..., n) es el conjunto de variables predictoras o conjunto de entrada, α es el punto de intersección y wi es el conjunto de coeficientes o vector de pesos W que ajustan el modelo. Esta ecuación también puede ser expresada como: log[p/(1 p)] = α + w 1 x 1 + w 2 x w n x n (5) En donde p es la probabilidad del resultado de interés, i.e. la probabilidad a priori de que un individuo tenga buen hábito de pago o la probabilidad de que un individuo pueda ser moroso o incurrir en fraude. De acuerdo a [6] y [5], LR no hace las suposiciones que realiza DA, pues se indica que siempre que las suposiciones sobre DA sean satisfechas, se espera que LR pueda llegar a ser casi tan eficiente en la predicción como DA. Adicionalmente, [4] y [7] indican que DA ofrece varias ventajas sobre LR como: 1) El vector de pesos W puede ser estimado utilizando la técnica de Mínimos Cuadrados, mientras que para LR se requiere métodos que permitan encontrar la probabilidad máxima. 2) Las probabilidades a priori y los costos de misclasificación pueden ser fácilmente incorporados en una solución DA. En su trabajo, [7] expone que la regresión logística LR ha sido implementada en muchos campos como investigación social y médica, diseño, sistemas de control, predicción, segmentación Figure 2. Ejemplo de un árbol de decisión. Para la construcción del árbol de decisión se utilizan técnicas de particionamiento llamadas Inducción de Árbol de Decisión (Decision Tree Induction) en donde se busca un atributo de un registro que pueda particionar de la mejor manera el conjunto de datos hasta obtener las clases o variables dependientes [16]. Los autores en [15] indican que una manera adecuada de dividir el conjunto de datos es a través de la Pureza y Diversidad en donde se consideran varias técnicas: Diversidad de la Población, también llamada Índice Gini. Ganancia de Información, conocida como Entropía. Índice de Ganancia de Información. Prueba de Chi-Cuadrado.

5 UNIVERSIDAD NACIONAL DE COLOMBIA 5 Para aplicar estas técnicas se deben hacer consideraciones sobre el tipo de atributo que se presenta (e.g. nominal, numérico, discreto, continuo, etc.). Igualmente, se consideran técnicas de pre-procesamiento de datos que permiten lograr una pureza y consistencia en los datos. Algunos algoritmos más conocidos para la construcción de árboles de decisión son ID3, C4.5, C5 4 y CART (Classification And Regression Tree) [15]. D. Redes Neuronales Las Redes Neuronales Artificiales (Artificial Neural Networks, ANN) son unas estructuras computacionales que han sido inspiradas en sistemas neuronales biológicos [17]. Básicamente, una ANN está conformada por nodos llamados neuronas y por las conexiones existentes entre estos nodos. Su objetivo principal es transformar un conjunto de datos de entrada en un conjunto de datos de salida en donde entradas y salidas son datos numéricos. Esta transformación se da a través de la interconexión de las neuronas que conducen los datos desde una capa de entrada hasta una capa de salida. La siguiente figura muestra un modelo general de una red neuronal; la capa de entrada recibe todo el conjunto de variables numéricas, se puede contar con cero o más capas ocultas y una capa de salida donde se encuentran las variables dependientes. Como recomendación, los datos de entrada deben ser numéricos y debe estar normalizados. Adicionalmente, las conexiones entre las neuronas juegan un papel importante en el sistema, pues en ellas se determina cómo debe funcionar el modelo; esto significa que cada conexión posee un peso lo cual influye en las capacidades de clasificación y/o predicción. estableces que con una sola capa oculta es suficiente para modelar un sistema complejo que produzca una buena exactitud. Por otra parte, [18] establece que el número de neuronas en las capas ocultas y el número de capas ocultas puede ser determinado a través de ensayo y error. Para poner en funcionamiento una Red Neuronal se deben considerar tres fases importantes: 1) Construcción de la arquitectura de ANN. Aquí se determinan las variables de entrada, la clase o variable dependiente a predecir y la topología de la red. Tanto las variables de entrada como de salida deben ser previamente normalizados para evitar que algunos atributos tengan más influencia que otros.. 2) Entrenamiento y validación del modelo. En esta fase se ajustan los pesos de las conexiones hasta que el error resultante del modelo sea lo más reducido posible, i.e. la diferencia entre la salida esperada y la real tienda a ser cero. 3) Predicción y/o clasificación. Una vez entrenado el modelo, se procede a mostrarle a la ANN nuevos casos. Estos casos no han sido tratados anteriormente por el sistema. El modelo de ANN debe estar en capacidad de clasificar y/o predecir cada nuevo caso. Sin embargo, [15] considera 7 etapas para la contrucción y puesta en funcionamiento de la ANN, pero para efectos prácticos las tres fases anteriores expresan la misma idea. Para el caso de este trabajo y apoyándose en [19], una red neuronal adecuada en la construcción de un modelo de scoring puede estar conformada por: Tantas neuronas en la capa de entrada como atributos numéricos posea el individuo solicitante del crédito. Una neurona en la capa de salida que clasifique el comportamiento crediticio del cliente; usualmente, bueno o malo. Aunque se podrían considerar más neuronas en esta capa dependiendo de las necesidades que se deseen cubrir. Una capa intermedia u oculta. Figure 3. Modelo General de una Red Neuronal. Una vez definida la arquitectura o la topología de la Red Neuronal, es necesario iniciar el proceso de aprendizaje o entrenamiento. En este proceso, como se mencionó anteriormente, se desea encontrar la combinación adecuada de pesos en las conexiones que conlleven a la reducción del error en la capa de salida. La Figura 4 muestra una neurona de una capa oculta de una Red Neuronal (e.g. Backpropagation Backpropagation Neural Network, BPN). De manera general, cada neurona en determinada capa toma el conjunto de pesos multiplicado por la entrada correspondiente en donde inicialmente los pesos son asignados de manera aleatoria. Esto es: De acuerdo a [12] y [6] el número de capas ocultas y el número de neuronas en las capas ocultas es uno de los problemas más difíciles de tratar; adicionalmente, los autores 4 C4.5 y C5 son extensiones del agoritmo ID3. Los tres modelos han sido desarrollados por J. Ross Quinlan. I = w i x i + θ (6) Donde I es la entrada de la neurona y θ es un peso adicional que influencia el resultado (i.e. bias). Posteriormente se procesa la entrada a través de una función de activación, i.e. la neurona se excita o se inhibe dependiendo del valor I. Existen

6 UNIVERSIDAD NACIONAL DE COLOMBIA 6 Figure 4. Detalle de una Neurona. varios tipos de funciones de activación que suelen producir valores entre 0 y 1 o entre -1 y 1, i.e. el resultado se encuentra normalizado. Algunas de las funciones de activación f(i) más empleadas son la función sigmoidal, la función logística [16] y la función tangente hiperbólica [15]. En la mayoría de los casos, las funciones de activación a emplear en la red neuronal son no lineales (i.e. salida de la neurona) [17]. Finalmente, los pesos deben ser ajustados iterativamente de acuerdo a un criterio apropiado como por ejemplo la minimización del Error Cuadrático Medio (Sum of Squared Error, SEE) [5], [17]: de la tecnología de redes neuronales basado en aprendizaje estadístico. SVM funciona correctamente con datos altamente dimensionales y evita el problema de la maldición de la dimensionalidad [17]. La idea general de SVM es encontrar hiplerplanos óptimos que separen de la mejor manera posible un conjunto de datos en dos o más clases. En la práctica es posible que los datos existentes no puedan ser separables linealmente, por este motivo se recurre a estrategias de cambio de dimensionalidad, i.e., se hace un cambio a un número mayor de dimensiones dependiendo del número de atributos existentes en el conjunto de entrada; una vez hecho el cambio de dimensión, es factible encontrar un hiperplano que separe correctamente los datos en dos clases. Para clarificar este concepto, la figura 5 muestra un conjunto de datos los cuales pueden ser separables en dos clases. Sin embargo, existen muchas soluciones para separar este conjunto de datos. SSE(W ) = 1 2 (yi ŷ i ) 2 (7) Donde el SSE depende de W debido a que la clase estimada ŷes una función de los pesos asignada a las neuronas de las capas ocultas y la capa de salida (i.e. f(i)=ŷ) [17]. Para apoyar el proceso de aprendizaje se utiliza la tasa de aprendizaje (learning rate). La decisión de la escogencia de la tasa de aprendizaje es crucial, pues si se escoge una tasa muy pequeña, el proceso de aprendizaje se vuelve lento y la convergencia es demorada. Por otra parte, si la tasa es grande provocará una oscilación en el modelo y la convergencia no se dará [6]. Para el caso de una BPN, uno de los algoritmos de aprendizaje más empleados es el Gradiente Descendiente [6]. Sin embargo, BPN es sólo una topología específica y una manera de cómo se puede diseñar un modelo de scoring. El autor [9] expone un trabajo muy descriptivo de cinco arquitecturas de redes neuronales aplicadas a modelos de scoring. Los modelos descritos en [9] son: Multi-Layer Perceptron, MLP. Mixture of Experts, MOE. Radial Basis Function, RBF. Learning Vector Quantization, LVQ. Fuzzy Adaptive Resonance, FAR. Adicionalmente, cada modelo es comparado contra los otros cuatro y contra otros modelos como la Regresión Logística, Análisis Discriminante, Kernel Density, CART y K-Nearest Neighbor. E. Máquinas Vectoriales de Soporte De acuerdo a [10], las Máquinas Vectoriales de Soporte (Support Vector Machines, SVM) son el Estado del Arte Figure 5. Separación de clases a través de hiperplanos. Dados estos hiperplanos que separan el conjunto de datos, el objetivo de SVM es poder encontrar un hiperplano óptimo para que separe las clases. La figura 6 expresa este resultado. En este caso, el hiperplano B 1 es mucho mejor que B 2, pues la margen que separa los datos en B 1 (distancia entre b 11 y b 12 ) es mucho más grande que la margen que separa los datos con B 2 (distancia entre b 21 y b 22 ). Las márgenes están definidas por aquellos datos que están más cerca al hiperplano donde b ij son hiperplanos paralelos a B i. De manera general, un hiperplano que separa dos clases está definido por: W.X + b = 0 (8) Donde W es el vector de pesos o coeficientes, X es el vector de datos de entrada en el modelo y b es la intersección en el eje. Adicionalmente, la margen está dada por [17]: d = 2 W (9)

7 UNIVERSIDAD NACIONAL DE COLOMBIA 7 1) Emplear clustering para preprocesar las muestras con el objetivo de aislar aquellas muestras menos representativas. 2) Construcción de una ANN para la generación del modelo de scoring. Para el análisis de clustering se emplea Mapas Auto Organizados (Self-Organized Maps, SOM) el cual permite generar automáticamente los clusters para el estudio. Posteriormente se aplica el algoritmo de K-means que elimina aquellos cluster que no poseen muestras representativas. Por otra parte, [11] propone una combinación entre SVM y Algoritmos Genéticos (Genetic Algorithms, GA). Los autores en [11] muestran las características de las Máquinas Vectoriales de Soporte a través de una breve explicación. En el trabajo también se consideran varias estrategias para construir las SVM. Se emplea Algoritmos Genéticos con el fin de optimizar los parámetros y el subconjunto óptimo de caractarísticas que alimentan el SVM. Figure 6. Hiperplano óptimo para la separación de clases. Que es la función a maximizar la cual se puede escribir equivalentemente como: Sujeto a: W 2 min 2 y i (W.X i + b) 1, i = 1, 2,..., N (10) En donde y i es el valor que toma la clase para el registro i y N es el número de registros a examinar. Aunque este es el caso en donde las clases son linealmente separables, existe una teoría detallada alrededor de SVM donde se proponen estrategias que permiten separar conjuntos de datos no separables linealmente. Los autores en [20], [21], [22] y [17] proponen un análisi detallado de cómo solucionar estos casos. F. Modelos Híbridos Aunque los modelos descritos anteriormente han sido empleados satisfactoriamente en la industria desde los años 1950s, siempre existe la necesidad de proponer modelos que superen a sus antecesores. Por ello, diversos investigadores han invertido esfuerzos en desarrollar arquitecturas que sean capaces de desempeñar un mejor predicción en cuanto a modelos de score crediticio, es decir, que con un mayor grado de exactitud se pueda catalogar a un individuo con una buena o mala capacidad crediticia. El autor en [12] presenta una arquitectura híbrida para generar un modelo de scoring. Se fundamenta en dos herramientas ampliamente utilizadas en la minería de datos: Clustering y Redes Neuronales. En este orden de ideas se consideran dos fases: Similarmente, [6] emplean dos estrategias para la construcción de un modelo de scoring. Primero se utilizan Curvas de regresión Adaptativas Multivariadas (Multivariate Adaptive Regression Splines, MARS) en donde se extraen las variables adecuadas las cuales serán pasadas a un modelo de ANN. MARS es capaz de modelar relaciones complejas no lineales. También pueden capturar la importancia relativa de las variables independientes a las variables dependientes cuando han sido consideradas muchas variables dependientes. Por otra parte, MARS no necesita largos tiempos de entrenamiento. Finalmente, MARS produce resultados que son fácilmente interpretables. La idea final del trabajo es proponer un modelo híbrido que confíe la generación de un modelo de scoring en MARS en primera fase y de Redes Neuronales de Back Propagation en segunda instancia. En [7], los autores establecen un modelo híbrido que aproveche las ventajas de las Redes Neuronales (ANN) trabajando en conjunto con el Análisis Discriminante (DA). Para ello se emplean redes neuronales tipo Back Propagation, BPN. Lo que muestra el trabajo es que este modelo híbrido converge más rápido hacia una solución que una ANN tradicional. En una primera fase, DA es utilizado para determinar las variables apropiadas que alimentarán una ANN. IV. COMPARACIÓN DE MODELOS Una vez que se han descrito los modelos, se procede a hacer una comparación entre los mismos. Esto con el objetivo de determinar cuáles son los modelos que resultan ser más eficientes, esto es, qué modelos posee una mayor precisión y exactitud en el momento de clasificar y/o predecir el comportamiento crediticio de un individuo. En [4] se muestra que dentro de las técnicas tradicionales, la Regresión Lineal es la que mejor exactitud en predicción muestra. Sin embargo, las Redes Neuronales muestran una mayor exactitud en cada una de las ejecuciones que los autores realizan. En general, los modelos aquí presentados predicen mejor los buenos créditos que los malos con excepción de

8 UNIVERSIDAD NACIONAL DE COLOMBIA 8 dos casos de Análisis Discriminante (DA). El mejor predictor para la clase buena (i.e. buen crédito) es una red neuronal probabilística (Probabilistic Neural Networks, PNN) mientras que una Red Neuronal Multicapa Feed-Forward (Multi-Layer Feed Forward Network, MLFN) predice mejor los créditos malos. Según [5] los mejores resultados obtenidos en la ejecución de varios modelos de scoring crediticio, las Redes Neuronales son una gran opción para clasificar los créditos malos. Sin embargo al comparar el promedio de los resultados, tanto de buenos créditos como de malos, la Regresión Logística se aproxima bastante a los resultados obtenidos por una red neuronal. De acuerdo a [12], el modelo híbrido propuesto indica que se obtienen resultados satisfactorios al emplear clustering en la fase de procesamiento de datos y posteriormente aplicar una topología de red neuronal. El autor concluye que este tipo de modelo puede presentar resultados interesantes en el mercado crediticio. Los autores en [23] indican que las redes neuronales presentan una ventaja respecto a otros modelos. Una Red Neuronal Multilayer Perceptron presenta una superioridad en excatitud en predicción frente Naïve Bayes, C4.5, ID3, Red Neuronal de Base Radial, entre otros. Sin embargo, los resultados obtenidos presentan pequeñas diferencias. Por otra parte, en [13] se expone que el modelo planteado de Programación Genética en dos Fases (Two Stage Genetic Programming, 2SGP) es un modelo flexible y apropiado para implementar sobre scoring crediticio y que su exactitud muestra un mejor desempñeo frente a otros modelo propuestos como el Perceptron Multicapa, CART, Programación Genética (Genetic Programming, GP), C4.5, Regresión Lineal (LR), entre otros. Por su parte, los autores en [11] indican que las redes neuronales poseen un mayor grado de precisión en anomalías bancarias y están seguidas por el Análisis Discriminante, Regresión Logística, Árboles de Decisión y K-Nearest Neighbor. Sin embargo el trabajo de los autores advierte que los SVM son muy competitivos frente a las Redes Neuronales y Programación Genética en términos de exactitud. Con un modelo híbrido utilizando SVM y GA, los autores presentan buenos resultados frente a modelos tradicionales más la calidad de la exactitud no es contundente, pues la diferencia entre la precisión de los modelos es baja. Los autores en [6] indican que su modelo híbrido entre ANN y MARS es bastante preciso, pero no supera contundentemente la precisión ofrecida por otros modelos como una Red Neuroanl BPN, pues apenas lo supera por una fracción muy pequeña. Como aporte final del modelo, indica que BPN- MARS logra encontrar las mejores variables independientes y una función de predicción apropiada, tema que suele ser una molestia en las ANN tradicionales. En [7] se plantea que el modelo híbrido brinda mejores resultados que modelos tradicionales como el Análisis Discriminante, la Regresión Logística y Redes Neuronales BPN. El modelo híbrido (ANN-DA) también presenta una disminución en los errores Tipo II (i.e. aquellos errores presentados al catalogar una clase negativa como positiva, llamados falsos negativos) en comparcación con las redes neuronales. V. CASOS DE ÉXITO EN LA IMPLEMENTACIÓN DE MODELOS DE SCORE Actualmente, existen muchas compañías que han implementado satisfactoriamente modelos de score crediticio. Sin embargo, desde la perspectiva comercial, se han venido constituyendo empresas dedicadas a proveer soluciones de alto impacto desde el punto de vista de Inteligencia de Negocios (Business Intelligence, BI), Minería de Datos, Análisis Financiero, Toma de Decisiones, entre otros. Algunas de las compañías que más éxito han tenido en la implementación de modelos de score crediticio son: Fair Isaac (http://www.fairisaac.com). Posee herramientas para el análisis predictivo y de scoring en donde se desea percibir el comportamiento futuro de los clientes. SPSS (http://www.spss.com). A través de Clementine, SPSS brinda una apoyo a las organizaciones con el objetivo de aplicar técnicas de Minería de Datos empleando Análisis Predictivo con estrategias como detección de fraude, mitigación de riesgo, adquisición y retención de clientes, modelos de score crediticio, entre otros. SAS (http://www.sas.com). Proporciona soluciones estadísticas y de minería de datos que son fácilmente implementables en la industria. Se concentra en tratar temas como prevención de lavado de activos (Anti- Money Laundering, AML), Administración de Riesgo, BI, Análisis Predictivo, entre otros. Estas compañías son capaces de ofrecer soluciones inteligentes que puedan apoyar de una manera ágil, cada una de las actividades de cualquier empresa en cualquier industria. Sin embargo, últimamente con los avances técnológicos y la competitividad, desde el punto de vista de desarrollo de software, casas desarrolladoras están ofreciendo soluciones fácilmente adaptables a las complejas industrias. Se tiene el caso de: IBM (http://www.ibm.com). Apoya procesos de toma de decisiones a través de Data Warehousing Business Intelligence & Analysis. Oracle (http://www.oracle.com). Ofrece soluciones completas para apoyo de decisiones a través de la Base de Datos empresarial utilizando Oracle Data Miner, Oracle Data Warehouse y BI. Por otra parte, la lista de empresas que han desarrollado y adquirido modelos a fin de atender su operación diaria se podría considerar interminable. Sin embargo, algunos casos de éxito son: Franquicias proveedoras de tarjetas de crédito como Master Card, American Express, Visa. El uso de modelos de scoring ha reducido considerablemente los tiempos empleados en la evaluación de un cliente. Entidades bancarias como por ejemplo HSBC ofrece servicios a sus clientes para aplicar a la solicitud de tarjetas de crédito a través de Internet. Adicionalmente, Fair Isaac reporta en su portal web a HSBC como un

9 UNIVERSIDAD NACIONAL DE COLOMBIA 9 caso de éxito en donde se pretende integrar sistemas de toma de decisiones alrededor del mundo con el objetivo de mejorar los servicios que presta el banco. VI. CONCLUSIONES En este artículo se han presentado algunas de las técnicas más importantes empleadas en la construcción de modelos de scoring crediticio. Adicionalmente se ha hecho una comparación entre los distintos modelos presentados como la Regresión Logística, el Análisis Discriminante, los Árboles de Decisión, las Redes Neuronales y las Máquinas Vectoriales de Soporte. Adicionalmente se ha hecho una breve revisión de algunos modelos híbridos los cuales son mezclas de otras técnicas. Su objetivo es tratar de producir modelos de scoring que sean superiores a aquellos que la industria viene empleando. Por otra parte, se ha realizado un comparación entre los distintos modelos en donde los modelos sobresalientes son las redes neuronales y las máquinas vectoriales de soporte (SVM). Sin embargo, no se desconoce el el esfuerzo y la precisión presentada por modelos híbridos. Estos modelos híbridos han mostrado lees mejoras frente a modelos tradicionales, sin embargo dichos modelos no son contundentes y la diferencia entre estos y lso tradicionales suele ser muy baja. Por otra parte, de acuerdo a lo que han reportado varios autores, las consideraciones importantes para construir un buen modelo radica en la calidad de los datos escogidos y en la selección adecuada de las variables que influyen en los modelos. Todo esto depende también de las técnicas de minería empleadas en el preprocesamiento de los datos y de cómo afronte el modelo la información disponible. Adicionalmente, este artículo presenta algunos casos de éxito en compañías proveedoras, desarrolladoras y consumidoras de modelos de scoring. La lista de casos exitosos puede ser interminable debido al dinamismo de las diferentes industrias en donde las organizaciones están siendo conscientes de proveer facilidades crediticias a sus consumidores.

10 UNIVERSIDAD NACIONAL DE COLOMBIA 10 REFERENCES [1] L. C. Thomas, A survey of credit and behavioural scoring: forecasting financial risk of lending to consumers, International Journal of Forecasting, vol. 16, pp , [2] J. Huysmans, B. Baesens, J. Vanthienen, and T. van Gestel, Failure prediction with self organizing maps, Expert Systems with Applications, vol. 30, pp , Apr [3] Y. Yang, Adaptive credit scoring with kernel learning methods, European Journal of Operational Research, vol. 183, pp , Dec [4] H. Abdou, J. Pointon, and A. El-Masry, Neural nets versus conventional techniques in credit scoring in egyptian banking, Expert Systems with Applications, vol. In Press, Corrected Proof, p. 1606, [5] V. S. Desai, J. N. Crook, and G. A. Overstreet, A comparison of neural networks and linear scoring models in the credit union environment, European Journal of Operational Research, vol. 95, pp , Nov [6] T.-S. Lee and I.-F. Chen, A two-stage hybrid credit scoring model using artificial neural networks and multivariate adaptive regression splines, Expert Systems with Applications, vol. 28, pp , May [7] T.-S. Lee, C.-C. Chiu, C.-J. Lu, and I.-F. Chen, Credit scoring using the hybrid neural discriminant technique, Expert Systems with Applications, vol. 23, pp , Oct [8] R. Malhotra and D. K. Malhotra, Evaluating consumer loans using neural networks, Omega, vol. 31, pp , Apr [9] D. West, Neural network credit scoring models, Computers & Operations Research, vol. 27, pp , Sept [10] S.-T. Li, W. Shiue, and M.-H. Huang, The evaluation of consumer loans using support vector machines, Expert Systems with Applications, vol. 30, pp , May [11] C.-L. Huang, M.-C. Chen, and C.-J. Wang, Credit scoring with a data mining approach based on support vector machines, Expert Systems with Applications, vol. 33, pp , Nov [12] N.-C. Hsieh, Hybrid mining approach in the design of credit scoring models, Expert Systems with Applications, vol. 28, pp , May [13] J.-J. Huang, G.-H. Tzeng, and C.-S. Ong, Two-stage genetic programming (2sgp) for the credit scoring model, Applied Mathematics and Computation, vol. 174, pp , Mar [14] C.-S. Ong, J.-J. Huang, and G.-H. Tzeng, Building credit scoring models using genetic programming, Expert Systems with Applications, vol. 29, pp , July [15] M. Berry and G. Linoff, Data Mining Techniques. For Marketing Sales and Customer Relationship Management. Wiley Publishing, [16] J. Han and M. Kamber, Data Mining. Concepts and Techniques. Morgan Kaufmann., [17] P. N. Tan, M. Steinbach, and V. Kumar, Introduction to Data Mining. Addison Wesley, [18] Y. S. Kim and S. Y. Sohn, Managing loan customers using misclassification patterns of credit scoring model, Expert Systems with Applications, vol. 26, pp , May [19] M.-C. Chen and S.-H. Huang, Credit scoring and rejected instances reassigning through evolutionary computation techniques, Expert Systems with Applications, vol. 24, pp , May [20] S. Abe, Support Vector Machines for Pattern Classification. Springer, [21] N. Cristianini and J. Shawe-Taylor, An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. Cambridge University Press, [22] V. Kecman, Learning and Soft Computing: Support Vector Machines, Neural Networks, and Fuzzy Logic Models. The MIT Press, 1 ed., Mar [23] Y.-M. Huang, C.-M. Hung, and H. C. Jiau, Evaluation of neural networks and data mining methods on a credit assessment task for class imbalance problem, Nonlinear Analysis: Real World Applications, vol. 7, pp , Sept PLACE PHOTO HERE Andrés Ramírez es estudiante de la Maestría en Ingeniería de Sistemas y Computación de la Universidad Nacional de Colombia. Posee título profesional como Ingeniero de Sistemas de la Universidad Nacional de Colombia (2003) y es Especialista en Sistemas de Información en la Organización de la Universidad de Los Andes (2007). Bogotá D.C., Colombia

MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA

MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA ANDRÉS YESID RAMÍREZ AYA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Propuesta de un modelo basado en redes neuronales para la detección de riesgo crediticio

Propuesta de un modelo basado en redes neuronales para la detección de riesgo crediticio Revista de Investigación ULASALLE, Rev Inv ULASALLE, Número 1, 2012 (55-64) Universidad La Salle Arequipa, Perú Propuesta de un modelo basado en redes neuronales para la detección de riesgo crediticio

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos I. Barbona - Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparison among

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín. Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.

Más detalles

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1 Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1 En los dispositivos móviles como tablets o teléfonos celulares se tiene la opción de implementar o no un sistemas

Más detalles

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES José Alejandro Chiri Aguirre RESUMEN La predicción de recidiva en pacientes que han sido

Más detalles

Credit scoring. por Dr. Marcelo Dabós, Ph.D. (marcelo.dabos@comunidad.ub.edu.ar)

Credit scoring. por Dr. Marcelo Dabós, Ph.D. (marcelo.dabos@comunidad.ub.edu.ar) Credit scoring por Dr. Marcelo Dabós, Ph.D. (marcelo.dabos@comunidad.ub.edu.ar) En base a que los bancos modernos otorgan tarjetas de crédito y créditos personales o los niegan? Qué límite de crédito le

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 5: Redes Neuronales

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 5: Redes Neuronales MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 5: Redes Neuronales 1 Objetivos del tema Conocer las limitaciones de los modelos lineales en problemas de modelización/ clasificación.

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Palabras llave. 1. Introducción. S. Valero 1, M. Ortiz 1, C. Senabre 1, M. Peñarrubia 1, A. Gabaldón 2 y Fco. Garcia 2

Palabras llave. 1. Introducción. S. Valero 1, M. Ortiz 1, C. Senabre 1, M. Peñarrubia 1, A. Gabaldón 2 y Fco. Garcia 2 Clasificación de consumidores eléctricos mediante el uso de varias técnicas de redes neuronales artificiales, e identificación de nuevos clientes con las redes entrenadas S. Valero, M. Ortiz, C. Senabre,

Más detalles

Regresión con SVM para reducir la inconsistencia de la matriz AHP

Regresión con SVM para reducir la inconsistencia de la matriz AHP Regresión con SVM para reducir la inconsistencia de la matriz AHP Fabián E. Favret, Federico Matías Rodríguez, Marianela Daianna Labat Departamento de Ingeniería y Ciencias de la Producción, Universidad

Más detalles

Predicción del índice IBEX-35 aplicando Máquinas de Soporte Vectorial y Redes Neuronales.

Predicción del índice IBEX-35 aplicando Máquinas de Soporte Vectorial y Redes Neuronales. 6th International Conference on Industrial Engineering and Industrial Management. XVI Congreso de Ingeniería de Organización. Vigo, July 18-20, 2012 Predicción del índice IBEX-35 aplicando Máquinas de

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

FINANZAS > ANÁLISIS DE RIESGOS

FINANZAS > ANÁLISIS DE RIESGOS FINANZAS > ANÁLISIS DE RIESGOS Modelos analíticos para el el para analíticos Modelos www.trendmanagement.cl 44 manejo del riesgo de crédito crédito de riesgo del manejo Pablo Coloma Ingeniero Civil Industrial

Más detalles

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1 ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales Elkin García, Germán Mancera, Jorge Pacheco Presentación Los autores han desarrollado un método de clasificación de música a

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

ENSIA 605 Inteligencia de Negocios y Minería de Datos

ENSIA 605 Inteligencia de Negocios y Minería de Datos ENSIA 605 Inteligencia de Negocios y Minería de Datos Profesor: Jaime Miranda P. E mail profesor: jmirandap@fen.uchile.cl OBJETIVOS DEL CURSO OBJETIVO GENERAL Estudiar, analizar, diseñar y aplicar tecnologías

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas. Prof. Lic. Juan M. Bodenheimer jb@instare.

Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas. Prof. Lic. Juan M. Bodenheimer jb@instare. Un presente y futuro de RR.HH. basado en datos: Aplicaciones de Data Mining en la Gestión de Personas Congreso de RR.HH. De Costa Rica 30/10/2012 Prof. Lic. Juan M. Bodenheimer jb@instare.com Nuestra Agenda

Más detalles

Capítulo 1. Introducción. 1.1. Antecedentes

Capítulo 1. Introducción. 1.1. Antecedentes Capítulo 1. Introducción En este capítulo se presenta una descripción general del problema a investigar y el enfoque con el que se aborda. Se establece la necesidad de incorporar técnicas de análisis novedosas

Más detalles

Introducción al DataMining

Introducción al DataMining Introducción al DataMining Lluís Garrido garrido@ecm.ub.es Universitat de Barcelona Índice Qué es el DataMining? Qué puede hacer el DataMining? Cómo hacer el DataMining? Técnicas Metodología del DataMining

Más detalles

Capítulo 2. Las Redes Neuronales Artificiales

Capítulo 2. Las Redes Neuronales Artificiales Capítulo 2. Las Redes Neuronales Artificiales 13 Capitulo 2. Las Redes Neuronales Artificiales 2.1 Definición Redes Neuronales Artificiales El construir una computadora que sea capaz de aprender, y de

Más detalles

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

Minera de datos aplicada a la detección de Cáncer de Mama

Minera de datos aplicada a la detección de Cáncer de Mama Minera de datos aplicada a la detección de Cáncer de Mama Eugenio Hernández Martínez Universidad Carlos III de Madrid 100039081@alumnos.uc3m.es Rodrigo Lorente Sanjurjo Universidad Carlos III de Madrid

Más detalles

Capítulo 1. Minería de datos: Conceptos, técnicas y sistemas...

Capítulo 1. Minería de datos: Conceptos, técnicas y sistemas... , INDICE Introducción, ; XVII Capítulo 1. Minería de datos: Conceptos, técnicas y sistemas... Aproximación al concepto de minería de datos... El proceso de extracción del conocimiento... Técnicas de minería

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Módulo Titulación TÉCNICAS DE APRENDIZAJE AUTOMÁTICO COMPUTACIÓN TECNOLOGÍAS ESPECÍFICAS GRADO EN INGENIERÍA INFORMÁTICA Plan 545 Código 46932 Periodo de

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

Tema 5. Reconocimiento de patrones

Tema 5. Reconocimiento de patrones Tema 5. Reconocimiento de patrones Introducción al reconocimiento de patrones y a la clasificación de formas Un modelo de general de clasificador Características discriminantes Tipos de clasificación Clasificadores

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

ÍNDICE. Introducción... Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1

ÍNDICE. Introducción... Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1 Introducción... XI Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1 Finalidad de los sistemas de información y origen del Business Intelligence... 1 Herramientas para la toma

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

1. Entender los principios de Business Intelligence y sus implicancias para la innovación en los negocios.

1. Entender los principios de Business Intelligence y sus implicancias para la innovación en los negocios. ENFIN748 Business Intelligence y Data Mining Financiero Profesor: PhD. David Díaz E-mail Profesor: ddiaz@unegocios.cl E-mail Tareas: BI-DM@unegocios.cl PRESENTACIÓN DEL CURSO El objetivo de éste curso

Más detalles

CAPÍTULO 5: MODELADO DEL IDS CON REDES NEURONALES

CAPÍTULO 5: MODELADO DEL IDS CON REDES NEURONALES Capítulo 5 Modelado y Simulación del IDS 35 CAPÍTULO 5: MODELADO DEL IDS CON REDES NEURONALES En este capítulo se describe la preparación de los datos para servir como entradas al IDS y la simulación de

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia GUÍA DOCENTE Curso Académico 2015/16 1. Técnicas de Análisis Estadístico basado en Inteligencia Artificial 1.1. Datos de la asignatura Tipo de estudios Titulación Nombre de la asignatura Carácter de la

Más detalles

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO CENTRO UNIVERSITARIO UAEM ATLACOMULCO REPORTE DE INVESTIGACION

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO CENTRO UNIVERSITARIO UAEM ATLACOMULCO REPORTE DE INVESTIGACION UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO CENTRO UNIVERSITARIO UAEM ATLACOMULCO REPORTE DE INVESTIGACION Qué es el momento en una red backpropagation? U.A. REDES NEURONALES INTEGRANTES: JESUS BARRIOS CRESCENCIO

Más detalles

Evaluación de modelos para la predicción de la Bolsa

Evaluación de modelos para la predicción de la Bolsa Evaluación de modelos para la predicción de la Bolsa Humberto Hernandez Ansorena Departamento de Ingeniería Telemática Universidad Carlos III de Madrid Madrid, España 10003975@alumnos.uc3m.es Rico Hario

Más detalles

Desarrollo de un cluster computacional para la compilación de. algoritmos en paralelo en el Observatorio Astronómico.

Desarrollo de un cluster computacional para la compilación de. algoritmos en paralelo en el Observatorio Astronómico. Desarrollo de un cluster computacional para la compilación de algoritmos en paralelo en el Observatorio Astronómico. John Jairo Parra Pérez Resumen Este artículo muestra cómo funciona la supercomputación

Más detalles

Aplicación de los modelos de credit scoring para instituciones microfinacieras.

Aplicación de los modelos de credit scoring para instituciones microfinacieras. Econ. Reynaldo Uscamaita Huillca Aplicación de los modelos de credit scoring para instituciones microfinacieras. OBJETIVO Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar

Más detalles

Curso de Inteligencia Artificial

Curso de Inteligencia Artificial Curso de Inteligencia Artificial Introducción al Aprendizaje Automático Gibran Fuentes Pineda IIMAS, UNAM Definición El aprendizaje automático es el estudio de los metodos para programar las computadoras

Más detalles

Facultad de Ciencias

Facultad de Ciencias Facultad de Ciencias Trabajo Fin de Grado Grado en Estadística Métodos de predicción de fuga con grandes volúmenes de datos Autor: D. Raquel García Fernández Tutor/es: D. Eusebio Arenal Gutiérrez Página

Más detalles

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes:

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes: Data & Text Mining Exponentes: - Dr. Jorge Bacallao Guerra - Ing. Ramón Martinez - Ing. José Villanueva Agosto del 2012 Introducción o Porqué es necesario utilizar data mining o Que ésdata miningy qué

Más detalles

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA CÓDIGO ASIGNATURA 1131-3 DEPARTAMENTO: Ingeniería e Investigaciones Tecnológicas ASIGNATURA: DATA MINING y DATA WAREHOUSE Plan 2009 Ingeniería en Informática Año: 5 (Electiva - Ingeniería de Software)

Más detalles

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Waldo Hasperué 1,2, Laura Lanzarini 1, 1 III-LIDI, Facultad de Informática, UNLP 2 Becario CONICET {whasperue, laural}@lidi.info.unlp.edu.ar

Más detalles

Análisis de los determinantes del riesgo de crédito. Aplicación de técnicas emergentes en el marco de los acuerdos de Basilea II y Solvencia II

Análisis de los determinantes del riesgo de crédito. Aplicación de técnicas emergentes en el marco de los acuerdos de Basilea II y Solvencia II REVISTA ESPAÑOLA DE FINANCIACIÓN Y CONTABILIDAD Vol. XXXVI, n.º 135 julio-septiembre 2007 pp. 649-653 649 Análisis de los determinantes del riesgo de crédito. Aplicación de técnicas emergentes en el marco

Más detalles

IBM SPSS Neural Networks 20

IBM SPSS Neural Networks 20 IBM SPSS Neural Networks 20 Nota: Antes de utilizar esta información y el producto que admite, lea la información general en Avisos el p. 95. sta edición se aplica a IBM SPSS Statistics 20 y a todas las

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Minería de datos para la determinación del grado de exclusión social

Minería de datos para la determinación del grado de exclusión social Minería de datos para la determinación del grado de exclusión social Data mining to determine the degree of social exclusion * Jorge Enrique Rodríguez Rodríguez Fecha de recepción: 23 de agosto de 2008

Más detalles

Repaso de conceptos. Tipos de RNA más utilizados. Técnicas de Clasificación con RNA. Contenido

Repaso de conceptos. Tipos de RNA más utilizados. Técnicas de Clasificación con RNA. Contenido Contenido Introducción al Diseño de Experimentos para el Reconocimiento de Patrones Capítulo 3: Redes Neuronales Artificiales Curso de doctorado impartido por Dr. Quiliano Isaac Moro Dra. Aranzazu Simón

Más detalles

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Otros aspectos Procesado de la entrada Procesado de la salida Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Procesado de la entrada 1. Motivación y tareas

Más detalles

IBM SPSS Modeler Professional

IBM SPSS Modeler Professional IBM SPSS Modeler Professional Características Cree estrategias más efectivas evaluando tendencias y resultados Acceda, prepare y cree modelos de datos estructurados fácilmente con este conjunto de programas

Más detalles

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo 1 Algoritmos de minería de datos incluidos en SQL Server 2008 Los algoritmos que aquí se presentan son: Árboles de decisión de Microsoft, Bayes naive de Microsoft, Clústeres de Microsoft, Serie temporal

Más detalles

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?

Más detalles

Algoritmos. Jordi Gironés Roig PID_00197284

Algoritmos. Jordi Gironés Roig PID_00197284 Algoritmos Jordi Gironés Roig PID_00197284 CC-BY-NC-ND PID_00197284 Algoritmos Los textos e imágenes publicados en esta obra están sujetos excepto que se indique lo contrario a una licencia de Reconocimiento-NoComercial-SinObraDerivada

Más detalles

Deep Learning y Big Data

Deep Learning y Big Data y Eduardo Morales, Enrique Sucar INAOE (INAOE) 1 / 40 Contenido 1 2 (INAOE) 2 / 40 El poder tener una computadora que modele el mundo lo suficientemente bien como para exhibir inteligencia ha sido el foco

Más detalles

IBM SPSS Decision Trees

IBM SPSS Decision Trees IBM Software IBM SPSS Statistics 19 IBM SPSS Decision Trees Identifique grupos y pronostique resultados con facilidad Funciones destacadas Con IBM SPSS Decision Trees podrá: Crear árboles de clasificación

Más detalles

Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización

Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización Minería de Datos Preprocesamiento: Reducción de Datos - Discretización Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: edgar.acuna@upr.edu, eacunaf@gmail.com

Más detalles

Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS

Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS VIII Congreso de Ingeniería de Organización Leganés, 9 y 10 de septiembre de 2004 Extracción de reglas borrosas en problemas de clasificación multiatributo. El enfoque NEFCLASS Javier Puente 1, David de

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE 1. Introducción 2. Etapas 3. Caso práctico Análisis de dependencias introducción varias relaciones una relación 1 variable dependiente > 1 variable dependiente

Más detalles

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source Inteligencia Artificial y Seguridad Informática en plataformas Open Source Jornadas de Software Libre y Seguridad Informática Santa Rosa La Pampa 4 y 5 de Diciembre de 2009 AGENDA Primera Parte Definiciones

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL FACULTAD DE CIENCIAS DE LA INGENIERÍA CARRERA DE INFORMÁTICA Y CIENCIAS DE LA COMPUTACIÓN TEMA:

UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL FACULTAD DE CIENCIAS DE LA INGENIERÍA CARRERA DE INFORMÁTICA Y CIENCIAS DE LA COMPUTACIÓN TEMA: UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL FACULTAD DE CIENCIAS DE LA INGENIERÍA CARRERA DE INFORMÁTICA Y CIENCIAS DE LA COMPUTACIÓN TEMA: DISEÑO DEL SISTEMA DE INDICADOR FINANCIERO BASADO EN EL SCORING DE COBRANZAS;

Más detalles

Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas. Datamining Técnicas

Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas. Datamining Técnicas Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas Datamining Técnicas Yerko Halat 4 de Octubre del 2001 1 Concepto: Lógica Difusa Cliente

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

Inteligencia Artificial. Grado en INFORMÁTICA 4º curso. Modalidad: Presencial

Inteligencia Artificial. Grado en INFORMÁTICA 4º curso. Modalidad: Presencial Grado en INFORMÁTICA 4º curso Modalidad: Presencial Sumario Datos básicos 3 Breve descripción de la asignatura 4 Requisitos previos 4 Objetivos 4 Competencias 5 Contenidos 6 Metodología 6 Criterios de

Más detalles

Finanzas e Investigación de Mercados"

Finanzas e Investigación de Mercados DIPLOMATURA: "Análisis de Datos para Negocios, Finanzas e Investigación de Mercados" Seminario: Introducción a Data Mining y Estadística Dictado: Sábado 13, 20,27 de Abril, 04 de Mayo en el horario de

Más detalles

APROBACIÓN DE CRÉDITOS BANCARIOS UTILIZANDO INTELIGENCIA ARTIFICIAL

APROBACIÓN DE CRÉDITOS BANCARIOS UTILIZANDO INTELIGENCIA ARTIFICIAL APROBACIÓN DE CRÉDITOS BANCARIOS UTILIZANDO INTELIGENCIA ARTIFICIAL Israel Cueva Hidalgo Mayo, 2010 I. INTRODUCCIÓN II. Hoy en día son muchas las instituciones que conceden créditos a sus clientes; pero

Más detalles

MEMORIA-RESUMEN DE TRABAJOS REALIZADOS

MEMORIA-RESUMEN DE TRABAJOS REALIZADOS MEMORIA-RESUMEN DE TRABAJOS REALIZADOS Alumno: Tutor: Tesis: IBRAHIM ESPINO MARTÍN FRANCISCO MARIO HERNÁNDEZ TEJERA Integración de técnicas estadísticas, numéricas y de inteligencia artificial para la

Más detalles

ANÁLISIS DISCRIMINANTE APLICADO AL PROBLEMA DE CREDIT SCORING

ANÁLISIS DISCRIMINANTE APLICADO AL PROBLEMA DE CREDIT SCORING ANÁLISIS DISCRIMINANTE APLICADO AL PROBLEMA DE CREDIT SCORING RESUMEN JUAN MANUEL RIVAS CASTILLO En este documento se emplea el análisis discriminante, que es una técnica del análisis multivariado utilizada

Más detalles

MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL

MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS Yegny Amaya, Edwin Barrientos, Universidad Francisco de Paula Santander, Colombia Diana Heredia Vizcaíno, Universidad

Más detalles

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Manuel Baena García, Rafael Morales Bueno y Carlos Cotta Porras Workshop MOISES Septiembre 2004 1/15 Contenido Inducción

Más detalles

CLASIFICACIÓN DE SEÑALES ELECTROMIOGRÁFICAS (EMG) PARA UNA PRÓTESIS DE MANO CARLOS MARIO BELALCÁZAR SANDOVAL ZULLY VIVIANA RENGIFO VARILA

CLASIFICACIÓN DE SEÑALES ELECTROMIOGRÁFICAS (EMG) PARA UNA PRÓTESIS DE MANO CARLOS MARIO BELALCÁZAR SANDOVAL ZULLY VIVIANA RENGIFO VARILA CLASIFICACIÓN DE SEÑALES ELECTROMIOGRÁFICAS (EMG) PARA UNA PRÓTESIS DE MANO CARLOS MARIO BELALCÁZAR SANDOVAL ZULLY VIVIANA RENGIFO VARILA UNIVERSIDAD DEL CAUCA FACULTAD DE INGENIERÍA ELECTRÓNICA Y TELECOMUNICACIONES

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS Por qué es importante la Minería de Datos? 2 La Minería de Datos es un proceso que permite obtener conocimiento a partir de los datos

Más detalles

CREDIT SCORING: Enfoque y ventajas para las instituciones. financieras. Parte I

CREDIT SCORING: Enfoque y ventajas para las instituciones. financieras. Parte I [.estrategiafinanciera.es ] CREDIT SCORING: Enfoque y ventajas para las instituciones financieras. Parte I Un sistema de scoring preciso al que se le haga un seguimiento correcto representa un instrumento

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Introducción a las Redes Neuronales Aplicadas

Introducción a las Redes Neuronales Aplicadas Introducción a las Redes Neuronales Aplicadas CURSO DE EXPERTOS DE U.C.M. (2012) Juan Miguel Marín Diazaraque jmmarin@est-econ.uc3m.es Universidad Carlos III de Madrid INDICE: Redes Neuronales en Economía

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial. Curso de doctoramiento Técnicas de Computación Flexíbeis

5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial. Curso de doctoramiento Técnicas de Computación Flexíbeis 5.1. Redes de aprendizaje supervisado basadas en la cuantificación vectorial Curso de doctoramiento Técnicas de Computación Flexíbeis Learning Vector Quantization (LVQ) Versión supervisada de SOM (SOM

Más detalles

Data Mining utilizando Redes Neuronales. Juan M. Ale ale@acm.org Facultad de Ingeniería Universidad de Buenos Aires

Data Mining utilizando Redes Neuronales. Juan M. Ale ale@acm.org Facultad de Ingeniería Universidad de Buenos Aires Data Mining utilizando Redes Neuronales Romina Laura Bot rbot@fi.uba.ar Juan M. Ale ale@acm.org Facultad de Ingeniería Universidad de Buenos Aires Resumen: Las Redes Neuronales son ampliamente utilizadas

Más detalles