Tabla de Contenidos. Support Vector Machine Gráficas, estadística y minería de datos con Python. Objetivos. Aspectos Técnicos. Miguel Cárdenas Montes

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tabla de Contenidos. Support Vector Machine Gráficas, estadística y minería de datos con Python. Objetivos. Aspectos Técnicos. Miguel Cárdenas Montes"

Transcripción

1 Support Vector Machine Gráficas, estadística y minería de datos con Python Tabla de Contenidos 1 Objetivos Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain 6-10 de Octubre de Introducción 3 Support Vector Machine 4 Ejemplo 5 Regresión con SVM M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Objetivos Conocer las diferencias entre los métodos de aprendizaje supervisado y no supervisados. Conocer métodos SVM lineales, polinómicos y radiales Introducción Aspectos Técnicos scikit-learn API Support Vector Machine M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

2 Minería de Datos Minería de Datos La Minería de Datos (data mining) es un campo multidisciplinar cuyo objetivo es el descubrimiento de conocimiento en grandes volúmenes de información. La Minería de Datos está relacionado con otras áreas de trabajo como: machine learning, estadísitica, reconocimiento de imágenes, recuperación de información, redes neuronales, inteligencia artificial, computación de altas prestaciones, visualización de datos... La Minería de Datos estuvo en su desarrollo inicial muy ligada a la extración de conocimiento de las bases de datos, Knowledge Discover in Databases. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Minería de Datos Pasos KDD Diferencia con el análisis estadístico Diferencia con métodos estadísticos: la estadística se utiliza para validar o parametrizar un modelo preexistente, no para generarlo. Los sistemas clásicos de estadística pueden ser difíciles de usar y no escalan al número y tipo de datos que se suelen encontrar en bases de datos. 1 Limpieza de datos. Quitar datos ruidosos o inconsistentes. Desafío: Tratar con datos ruidosos y de baja calidad. 2 Integración de datos. Los datos de múltiples fuentes son integrados. Desafío: Tratar con datos no estructurados. 3 Selección de datos. Elegir aquellos que representando al conjunto son una parte reducida del mismo. Desafío: Tratar con grandes volúmnes de datos. 4 Data Mining 5 Evaluación del modelo. 6 Presentación (visualización) del conocimiento. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

3 Algoritmos Supervisados y No Supervisados Algoritmos Supervisados Las dos categorías principales de algoritmos de data mining son los denominados: supervisados y no supervisados. Supervisados: Support Vector Machine, K-Nearest Neighbors No Supervisados: K-means, DBSCAN, Gaussian Mixture Model En este caso, los datos incluyen características y etiquetas. El objetivo consiste en construir un estimador con capacidad predictiva sobre la etiqueta en función de un conjunto de características. Los algoritmos supervisados se dividen a su vez en dos categorías: impacientes y perezosos; y en dos tipos de problemas: clasificación y regresión. En clasificación la etiqueta es discreta o categórica y en regresión es continua. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Algoritmos No Supervisados Aprendizaje Supervisado En este caso, los datos no incluyen etiquetas. Al carecer de etiquetas, el objetivo es encontrar similitudes entre los objetos. Usos Predicción de futuros casos: se usa el modelo para predecir casos futuros. Extracción de conocimiento: el modelo es más fácil de comprender (visualizar), retener y comprender. Comprensión: el modelo es más simple que el conjunto de datos que explica. Cómo de cara es la atención de los humanos? Detección de valores atípicos o anómalos: excepciones que no son cubiertas por el modelo, por ejemplo fraudes or intrusiones. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

4 Aprendizaje No Supervisado Tipos de Datos Usos Encontrar estructuras en los datos. Cuáles son similares? Presentación descriptiva de los datos (no predictiva como en el aprendizaje supervisado). Usos Aprender qué sucede normalmente!; y qué es anómalo! Variables categóricas Nominales (no pueden ser ordenados): tipo de galaxia (eĺıptica, irregular, espiral), macho-hembra. Ordinales (pueden ser ordenadores): números enteros, temperatua si solo se toman los valores enteros. Variables numéricas o continuas: temperatura, distancia. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Qué es clasificación? Qué es predicción o regresión? Función En este caso un modelo o clasificador es construido para predecir atributos categóricos. Ejemplo Predecir si el riesgo de una prestamo es alto o bajo en función de la edad, los ingresos, el capital pedido,... Función En este caso un modelo o preditor es construido para predecir valores continuos o valores ordenados. Ejemplo Predecir cuanto se gastará una familia durante sus vacaciones en función de ciertos parámetros: número de miembros de la familia, edad de los miembros, procedencia, ingresos... M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

5 The Top 10 Algorithms in Data Mining 1 C4.5, presented by Hiroshi Motoda 2 K-Means, presented by Joydeep Ghosh 3 SVM, presented by Qiang Yang 4 Apriori, presented by Christos Faloutsos 5 EM, presented by Joydeep Ghosh 6 PageRank, presented by Christos Faloutsos 7 AdaBoost, presented by Zhi-Hua Zhou 8 knn, presented by Vipin Kumar 9 Naive Bayes, presented by Qiang Yang 10 CART, presented by Dan Steinberg 18 Identified Candidates I Classification: C4.5: Quinlan, J. R C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc. CART: L. Breiman, J. Friedman, R. Olshen, and C. Stone. Classification and Regression Trees. Wadsworth, Belmont, CA, K Nearest Neighbours (knn): Hastie, T. and Tibshirani, R Discriminant Adaptive Nearest Neighbor Classification. IEEE Trans. Pattern Anal. Mach. Intell. (TPAMI). 18, 6 (Jun. 1996), Naive Bayes: Hand, D.J., Yu, K., Idiot s Bayes: Not So Stupid After All? Internat. Statist. Rev. 69, Statistical Learning: SVM: Vapnik, V. N The Nature of Statistical Learning Theory. Springer-Verlag New York, Inc. EM: McLachlan, G. and Peel, D. (). Finite Mixture Models. J. Wiley, New York. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / Identified Candidates II Association Analysis Apriori: Rakesh Agrawal and Ramakrishnan Srikant. Fast Algorithms for Mining Association Rules. In VLDB 94. FP-Tree: Han, J., Pei, J., and Yin, Y.. Mining frequent patterns without candidate generation. In SIGMOD 00. Link Mining PageRank: Brin, S. and Page, L The anatomy of a large-scale hypertextual Web search engine. In WWW-7, HITS: Kleinberg, J. M Authoritative sources in a hyperlinked environment. In Proceedings of the Ninth Annual ACM-SIAM Symposium on Discrete Algorithms, Clustering K-Means: MacQueen, J. B., Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Mathematical Statistics and Probability, BIRCH: Zhang, T., Ramakrishnan, R., and Livny, M BIRCH: an efficient data clustering method for very large databases. In SIGMOD Identified Candidates III Bagging and Boosting AdaBoost: Freund, Y. and Schapire, R. E A decision-theoretic generalization of on-line learning and an application to boosting. J. Comput. Syst. Sci. 55, 1 (Aug. 1997), Sequential Patterns GSP: Srikant, R. and Agrawal, R Mining Sequential Patterns: Generalizations and Performance Improvements. In Proceedings of the 5th International Conference on Extending Database Technology, PrefixSpan: J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto, Q. Chen, U. Dayal and M-C. Hsu. PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth. In ICDE 01. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

6 18 Identified Candidates IV Integrated Mining CBA: Liu, B., Hsu, W. and Ma, Y. M. Integrating classification and association rule mining. KDD-98. Rough Sets Finding reduct: Zdzislaw Pawlak, Rough Sets: Theoretical Aspects of Reasoning about Data, Kluwer Academic Publishers, Norwell, MA, Graph Mining gspan: Yan, X. and Han, J gspan: Graph-Based Substructure Pattern Mining. In ICDM 02. Support Vector Machine M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 SVM I SVM II Support Vector Machine (SVM) es un método supervisado de clasificación, aunque también puede utilizarse en regresión. H1 no separa las clases. H2 y H3 sí separan las clases. H3 maximiza el margen de separación de las clases. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

7 SVM III SVM IV Objetivo maximizar la anchura del margen que separa ambas clases de datos. Existen conjutos de datos no linealmente separables. SVM también puede tratarlos. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Elementos de SVM I SVM Un Support Vector Machine (SVM) ejecuta una clasificación. Para ello tiene que encontrar el hiperplano que maximiza el margen entre las dos clases. Los vectores (casos) que definen el hiperplano se denominan support vectors. SVM usa un mapeo no lineal transformando los datos originales en otros de dimensionalidad superior. En estas nuevas dimensionalidades, SVM busca el hiperplano óptimo que separa las clases. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

8 Ejemplo I Ejemplo SVM linealmente separable. import numpy as np import pylab as pl from sklearn import svm # first training set X = np.r_[ 1,2,0, \ [500,,,,,, 8000], \ [500,,,,,, ] ] Y = [0, 0, 0, 0, 0, \ 1, 1] pl.scatter(x[:, 0], X[:, 1], c=y, cmap=pl.cm.paired) pl.xlabel( Label A ) pl.ylabel( Label B ) pl.axis( tight ) pl.ylim( (0, 8110) ) pl.xlim( (0, 8110) ) pl.show() Label B Label A M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Ejemplo II Ejemplo III SVM linealmente separable. # fit the model and get the separating hyperplane clf = svm.svc(kernel= linear, C=2.0) clf.fit(x, Y) Al añadir un nuevo punto se reoganiza el esquema. Se mantiene que los puntos son linealmente separables (3500, 3500, etiqueta 1). # get the separating hyperplane w = clf.coef_[0] a = -w[0] / w[1] xx = np.linspace(0, 1) yy = a * xx - (clf.intercept_[0]) / w[1] 5000 # plot the parallels to the separating hyperplane that pass through the # support vectors b = clf.support_vectors_[0] yy_down = a * xx + (b[1] - a * b[0]) b = clf.support_vectors_[-1] yy_up = a * xx + (b[1] - a * b[0]) # plot the line, the points, and the nearest vectors to the 0 plane pl.plot(xx, yy, k- ) Label A pl.plot(xx, yy_down, k-- ) pl.plot(xx, yy_up, k-- ) pl.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=80, facecolors= none ) pl.scatter(x[:, 0], X[:, 1], c=y, cmap=pl.cm.paired) Label B # Modified training set X = np.r_[ 1,2,0, \ [500,,,,,, 8000, 3500], \ [500,,,,,,, 3500] ] Y = [0, 0, 0, 0, 0, \ 1, 1, 1] Label B Label A M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

9 Ejemplo IV Ejemplo V Label B Label A Label B Label A Predicción de nuevos puntos. from sklearn import svm X = [[0, 0], [0.4, 0.5], [1, 1], [2, 2]] y = [0, 0, 1, 1] clf = svm.svc() clf.fit(x, y) print clf.predict([[0.5, 1.]]) print clf.predict([[2., 2.]]) print clf.predict([[2., 3.]]) M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Ejemplo VI Datos no linealmente separable. Se cambia un punto de etiqueta (,, etiqueta 1). El resultado gráfico es anómalo si se trata de mantener una separabilidad lineal. Ejemplo VII Sin embargo, con ecuación no lineal (polinómica) se podrían separar los datos. # Modified training set X = np.r_[ 1,2,0, \ [500,,,,,, 8000], \ [500,,,,,, ] ] Y = [0, 0, 1, 0, 0, \ 1, 1] clf = svm.svc(kernel= poly, gamma=4) clf.fit(x, Y) pl.figure() pl.clf() pl.scatter(x[:, 0], X[:, 1], c=y, zorder=10, cmap=pl.cm.paired) pl.axis( tight ) x_min = X[:, 0].min() x_max = X[:, 0].max() y_min = X[:, 1].min() y_max = X[:, 1].max() XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j] Z = clf.decision_function(np.c_[xx.ravel(), YY.ravel()]) 500 # Put the result into a color plot Z = Z.reshape(XX.shape) pl.pcolormesh(xx, YY, Z > 0, cmap=pl.cm.paired) pl.contour(xx, YY, Z, colors=[ k, k, k ], linestyles=[ --, -, -- ], levels=[-.5, 0,.5]) pl.show() M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

10 Tipos de kernel en SVM Parámetros de SVM Lineal Polinómico rbf, radial basis function sigmoide, tangente hiperbólica C Penalización del término de error. Este parámetro, común en todos los kernels, es un compromiso entre las clasificaciones erróneas de las tuplas de entrenamiento contra la simplicidad de la superficie de decisión. Un valor bajo de c hace la superficie de decisión suave, mientras que un valor alto trata de clasificar absolutamente todas las tuplas de entrenamiento correctamente. kernel Tipo de kernel usado en el algoritmo. degree Grado de la función kernel cuando de tipo polinómico. gamma Coeficiente del kernel cuando es de tipo rbf. coef0 Parámetro del kernel cuando es de tipo sigmoide. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Multiclases Complejidad Computacional de SVM Para datos no linealmente separable y más de dos clases es posible hacer mapas (mediante predicción) de las zonas de influencia de cada clase. SVM incrementa los requerimientos computacionales con rapidez con el número de tuplas de entrenamiento. El núcleo de la librería escala como O(n features nsamples 2 ) o como O(n features nsamples 3 ) dependiendo de la eficiencia del uso y de las particularidades de los datos. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

11 Regresión con SVM I Regresión con SVM El método de SVM puede ser extendida a la resolución de problemas de regresión. En SVR la etiqueta categórica tiene que ser cambiada por valores continuos. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Regresión con SVM II Gracias import numpy as np X = np.sort(5 * np.random.rand(40, 1), axis=0) y = np.sin(x).ravel() # Add noise to targets y[::4] += 3 * (0.5 - np.random.rand(10)) # Fit regression model from sklearn.svm import SVR svr_rbf = SVR(kernel= rbf, C=1e3, gamma=0.1) svr_lin = SVR(kernel= linear, C=1e3) svr_poly = SVR(kernel= poly, C=1e3, degree=2) y_rbf = svr_rbf.fit(x, y).predict(x) y_lin = svr_lin.fit(x, y).predict(x) y_poly = svr_poly.fit(x, y).predict(x) # look at the results import pylab as pl pl.scatter(x, y, c= k, label= data ) pl.hold( on ) pl.plot(x, y_rbf, c= g, label= RBF model ) pl.plot(x, y_lin, c= r, label= Linear model ) pl.plot(x, y_poly, c= b, label= Polynomial model ) pl.legend() pl.show() target Support Vector Regression Linear model Polynomial model data data Gracias Preguntas? Más preguntas? M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos I. Barbona - Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparison among

Más detalles

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Ricardo Timarán Pereira, Ph.D. Departamento de Sistemas, Facultad de Ingeniería, Universidad

Más detalles

clustering: Clasificación no Supervisada

clustering: Clasificación no Supervisada clustering: Clasificación no Supervisada Gráficas estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

SISTEMAS DE INDUCCIÓN DE REGLAS Y ÁRBOLES DE DECISIÓN APLICADOS A LA PREDICCIÓN DE INSOLVENCIAS EN EMPRESAS ASEGURADORAS

SISTEMAS DE INDUCCIÓN DE REGLAS Y ÁRBOLES DE DECISIÓN APLICADOS A LA PREDICCIÓN DE INSOLVENCIAS EN EMPRESAS ASEGURADORAS SISTEMAS DE INDUCCIÓN DE REGLAS Y ÁRBOLES DE DECISIÓN APLICADOS A LA PREDICCIÓN DE INSOLVENCIAS EN EMPRESAS ASEGURADORAS Zuleyka Díaz Martínez (a) José Fernández Menéndez (b) Mª Jesús Segovia Vargas (a)

Más detalles

Text Mining Introducción a Minería de Datos

Text Mining Introducción a Minería de Datos Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Problemas de clasificación: problemas de localización

Problemas de clasificación: problemas de localización Problemas de clasificación: problemas de localización Emilio Carrizosa Facultad de Matemáticas Universidad de Sevilla ecarrizosa@us.es Belén Martín-Barragán Facultad de Matemáticas Universidad de Sevilla

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA

MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA ANDRÉS YESID RAMÍREZ AYA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE

Más detalles

Estudio e Implementación de una Máquina de Soporte Vectorial.

Estudio e Implementación de una Máquina de Soporte Vectorial. Estudio e Implementación de una Máquina de Soporte Vectorial. Lázaro Bustio Martínez, Alejandro Mesa Rodríguez lbustio@ccc.inaoep.mx, amesa@ccc.inaoep.mx Resumen. En este trabajo se presentan las Máquinas

Más detalles

Support Vector Machines

Support Vector Machines Support Vector Machines Separadores lineales Clasificacion binaria puede ser vista como la tarea de separar clases en el espacio de caracteristicas w T x + b > 0 w T x + b = 0 w T x + b < 0 f(x) = sign(w

Más detalles

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Waldo Hasperué 1,2, Laura Lanzarini 1, 1 III-LIDI, Facultad de Informática, UNLP 2 Becario CONICET {whasperue, laural}@lidi.info.unlp.edu.ar

Más detalles

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA 5504. Horas / Crédito: 3 horas semanales / 3 Créditos

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA 5504. Horas / Crédito: 3 horas semanales / 3 Créditos Universidad de Puerto Rico Recinto de Rio Piedras Facultad de Administración de Empresas 1 2 I. Titulo del curso: Minería de Datos Prontuario II. Codificación: ESTA 5504 III. Horas / Crédito: 3 horas semanales

Más detalles

Minera de datos aplicada a la detección de Cáncer de Mama

Minera de datos aplicada a la detección de Cáncer de Mama Minera de datos aplicada a la detección de Cáncer de Mama Eugenio Hernández Martínez Universidad Carlos III de Madrid 100039081@alumnos.uc3m.es Rodrigo Lorente Sanjurjo Universidad Carlos III de Madrid

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web A Comparison of Approaches to Semi-supervised Multiclass SVM for Web Page Classification Arkaitz Zubiaga,

Más detalles

Métodos de agregación de modelos y aplicaciones

Métodos de agregación de modelos y aplicaciones Métodos de agregación de modelos y aplicaciones Model aggregation methods and applications Mathias Bourel 1 Recibido: Mayo 2012 Aprobado: Agosto 2012 Resumen.- Los métodos de agregación de modelos en aprendizaje

Más detalles

Práctica 11 SVM. Máquinas de Vectores Soporte

Práctica 11 SVM. Máquinas de Vectores Soporte Práctica 11 SVM Máquinas de Vectores Soporte Dedicaremos esta práctica a estudiar el funcionamiento de las, tan de moda, máquinas de vectores soporte (SVM). 1 Las máquinas de vectores soporte Las SVM han

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia GUÍA DOCENTE Curso Académico 2015/16 1. Técnicas de Análisis Estadístico basado en Inteligencia Artificial 1.1. Datos de la asignatura Tipo de estudios Titulación Nombre de la asignatura Carácter de la

Más detalles

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación ESTUDIO DE TECNICAS DE DATA MINING APLICADAS AL ANALISIS DE DATOS GENERADOS CON LA METODOLOGIA BLENDED LEARNING Marcelo Omar Sosa, Sosa Bruchmann Eugenia Cecilia Departamento Computación/Facultad de Ciencias

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

de Lanús. Buenos Aires, Argentina. rgarcia@unla.edu.ar.

de Lanús. Buenos Aires, Argentina. rgarcia@unla.edu.ar. Behavioral Variability of Clustering and Induction Based on Domain Features Variabilidad del Comportamiento de Agrupamiento e Inducción Basado en las Características del Dominio Marcelo López N. 1, Ramón

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

MODELOS DESCRIPTIVOS Y PREDICTIVOS PARA LA ESTIMACIÓN DE COSTES EN PROYECTOS INFORMÁTICOS

MODELOS DESCRIPTIVOS Y PREDICTIVOS PARA LA ESTIMACIÓN DE COSTES EN PROYECTOS INFORMÁTICOS MODELOS DESCRIPTIVOS Y PREDICTIVOS PARA LA ESTIMACIÓN DE COSTES EN PROYECTOS INFORMÁTICOS Rubén Escribano-García Francisco Javier Martínez-de-Pisón Manuel Castejón-Limas Andrés Sanz-García Roberto Fernández-Martínez

Más detalles

Predicción del índice IBEX-35 aplicando Máquinas de Soporte Vectorial y Redes Neuronales.

Predicción del índice IBEX-35 aplicando Máquinas de Soporte Vectorial y Redes Neuronales. 6th International Conference on Industrial Engineering and Industrial Management. XVI Congreso de Ingeniería de Organización. Vigo, July 18-20, 2012 Predicción del índice IBEX-35 aplicando Máquinas de

Más detalles

ENSIA 605 Inteligencia de Negocios y Minería de Datos

ENSIA 605 Inteligencia de Negocios y Minería de Datos ENSIA 605 Inteligencia de Negocios y Minería de Datos Profesor: Jaime Miranda P. E mail profesor: jmirandap@fen.uchile.cl OBJETIVOS DEL CURSO OBJETIVO GENERAL Estudiar, analizar, diseñar y aplicar tecnologías

Más detalles

CURSO ESTADÍSTICA APLICADA CON R

CURSO ESTADÍSTICA APLICADA CON R CURSO ESTADÍSTICA APLICADA CON R Organizado por: Instituto IMDEA Alimentación Facultad de Ciencias de la Universidad Autónoma de Madrid MADRID, de Septiembre a Diciembre de 2015 Estadística Aplicada con

Más detalles

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes:

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes: Data & Text Mining Exponentes: - Dr. Jorge Bacallao Guerra - Ing. Ramón Martinez - Ing. José Villanueva Agosto del 2012 Introducción o Porqué es necesario utilizar data mining o Que ésdata miningy qué

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Presentación. Introducción a las técnicas de reconocimiento de patrones. Materia de doctorado en ingeniería/informática

Presentación. Introducción a las técnicas de reconocimiento de patrones. Materia de doctorado en ingeniería/informática Presentación Introducción a las técnicas de reconocimiento de patrones Materia de doctorado en ingeniería/informática Tópicos de minería de datos Materia optativa de LCC Docente: Pablo M. Granitto Horarios:

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Impartido por: Juan Alfonso Lara Torralbo 1. Datos del docente NOMBRE Juan Alfonso Lara Torralbo FORMACIÓN

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

Métodos Exploratorios en Minería de Datos

Métodos Exploratorios en Minería de Datos Métodos Exploratorios en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad de Stanford. Duración:

Más detalles

30 oct. SAP Fraud Management. El Camino a la transparencia. La necesidad Gestionar en tiempo real. El medio Una plataforma in-memory

30 oct. SAP Fraud Management. El Camino a la transparencia. La necesidad Gestionar en tiempo real. El medio Una plataforma in-memory SAP Fraud Management 30 oct 2014 El Camino a la transparencia SAP Fraud Management La necesidad Gestionar en tiempo real El medio Una plataforma in-memory La necesidad Gestionar en tiempo real 3 La necesidad:

Más detalles

Uso de Técnicas no Supervisadas en la Construcción de Modelos de Clasificación en Ingeniería del Software

Uso de Técnicas no Supervisadas en la Construcción de Modelos de Clasificación en Ingeniería del Software Uso de Técnicas no Supervisadas en la Construcción de Modelos de Clasificación en Ingeniería del Software María N. Moreno García* y Vivian F. López Batista Departamento de Informática y Automática. Universidad

Más detalles

Algoritmos de agrupamiento

Algoritmos de agrupamiento Algoritmos de agrupamiento D. Pascual 1, F. Pla 2, S. Sánchez 2 1. Departamento de Computación Universidad de Oriente Avda. Patricio Lumumba S/N. 90500 Santiago de Cuba, Cuba dpascual@csd.uo.edu.cu 2.

Más detalles

PROGRAMA DE CURSO. Personal 6 10 3.0 0 7. Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso

PROGRAMA DE CURSO. Personal 6 10 3.0 0 7. Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso PROGRAMA DE CURSO Código Nombre CC5206 Introducción a la Minería de Datos Nombre en Inglés Introduction to Data Mining SCT es Horas de Horas Docencia Horas de Trabajo Docentes Cátedra Auxiliar Personal

Más detalles

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA

FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA FILTRADO DE CONTENIDOS WEB EN ESPAÑOL DENTRO DEL PROYECTO POESIA Enrique Puertas epuertas@uem.es Francisco Carrero fcarrero@uem.es José María Gómez Hidalgo jmgomez@uem.es Manuel de Buenaga buenga@uem.es

Más detalles

Minería de Datos: Conceptos y Tendencias. Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla riquelme@lsi.us.

Minería de Datos: Conceptos y Tendencias. Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla riquelme@lsi.us. ARTÍCULO Minería de Datos: Conceptos y Tendencias José C. Riquelme (1), Roberto Ruiz (2), Karina Gilbert (3) (1) Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla riquelme@lsi.us.es

Más detalles

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información:

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información: Datamining y Aprendizaje Automatizado Prof. Carlos Iván Chesñevar Email: cic@cs.uns.edu.ar Http:\\cs.uns.edu.ar\~cic Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Bahía Blanca,

Más detalles

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid

Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Otros aspectos Procesado de la entrada Procesado de la salida Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Procesado de la entrada 1. Motivación y tareas

Más detalles

Minería de reglas de asociación con programación genética gramatical

Minería de reglas de asociación con programación genética gramatical Minería de reglas de asociación con programación genética gramatical José María Luna Juan Luis Olmo José Raúl Romero Sebastián Ventura Departamento de Informática y Análisis Numérico, Universidad de Córdoba

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Revista Científica Guillermo de Ockham ISSN: 1794-192X investigaciones@ubscali.edu.co Universidad de San Buenaventura Colombia

Revista Científica Guillermo de Ockham ISSN: 1794-192X investigaciones@ubscali.edu.co Universidad de San Buenaventura Colombia Revista Científica Guillermo de Ockham ISSN: 1794-192X investigaciones@ubscali.edu.co Universidad de San Buenaventura Colombia Timarán Pereira, Ricardo Una Lectura sobre deserción universitaria en estudiantes

Más detalles

Datamining y Aprendizaje Automatizado Dep. de Cs. e Ing. de la Computación, UNS 2do. Cuat. 2010. Prof. Carlos Iván Chesñevar

Datamining y Aprendizaje Automatizado Dep. de Cs. e Ing. de la Computación, UNS 2do. Cuat. 2010. Prof. Carlos Iván Chesñevar Datamining y Aprendizaje Automatizado 01 - Introducción. Conceptos Preliminares De qué tratará este curso Conceptos y técnicas básicas de Datamining. Conceptos y técnicas de Aprendizaje Automatizado. Análisis

Más detalles

ANÁLISIS MULTIVARIANTE. Créditos. Teóricos: 6 Prácticos: 3 Total: 9. Profesoras: Agurtzane Amparan, Silvia Marcaida y Arantza Urkaregi

ANÁLISIS MULTIVARIANTE. Créditos. Teóricos: 6 Prácticos: 3 Total: 9. Profesoras: Agurtzane Amparan, Silvia Marcaida y Arantza Urkaregi Presentación ANÁLISIS MULTIVARIANTE MATEMÁTICAS SEGUNDO CICLO OPTATIVA SEGUNDO CUATRIMESTRE Créditos. Teóricos: 6 Prácticos: 3 Total: 9 Profesoras: Agurtzane Amparan, Silvia Marcaida y Arantza Urkaregi

Más detalles

Minería de subgrafos conexos frecuentes

Minería de subgrafos conexos frecuentes Minería de subgrafos conexos frecuentes Autor: Andrés Gago Alonso 1,2 Asesores: Dr. José Eladio Medina Pagola 1 Dr. Jesús Ariel Carrasco Ochoa 2 1 Departamento de Minería de Datos Centro de Aplicaciones

Más detalles

Trabajo Practico N 12

Trabajo Practico N 12 Trabajo Practico N 12 Minería de Datos CATEDRA: Actualidad Informática Ingeniería del Software III Titular: Mgter. Horacio Kuna JTP: Lic. Sergio Caballero Auxiliar: Yachesen Facundo CARRERAS: Analista

Más detalles

POLARIS: A WEB USAGE MINING TOOL POLARIS: UNA HERRAMIENTA PARA MINERIA DE USO DE LA WEB

POLARIS: A WEB USAGE MINING TOOL POLARIS: UNA HERRAMIENTA PARA MINERIA DE USO DE LA WEB Recibido: 14 de agosto de 2009 Aceptado: 22 de octubre de 2009 POLARIS: A WEB USAGE MINING TOOL POLARIS: UNA HERRAMIENTA PARA MINERIA DE USO DE LA WEB PhD. Ricardo Timarán Pereira, Ing. Johana Daza Burbano,

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Secretaría de Docencia Dirección de Estudios Profesionales

Secretaría de Docencia Dirección de Estudios Profesionales I. IDENTIFICACIÓN DEL CURSO PROGRAMA DE ESTUDIO POR COMPETENCIAS Minería de Datos ORGANISMO ACADÉMICO: FACULTAD DE INGENIERÍA Programa Educativo: Ingeniería en Computación Área de docencia: Tratamiento

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Complejidad de los datos en las Redes Neuronales Artificiales: Estado de la Cuestión

Complejidad de los datos en las Redes Neuronales Artificiales: Estado de la Cuestión Complejidad de los datos en las Redes Neuronales Artificiales: Estado de la Cuestión P. Toribio 1, B. G. Rodriguez 1, R. Alejo 2 1 Centro Universitario UAEM Atlacomulco, Universidad Autónoma del Estado

Más detalles

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1 ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los

Más detalles

Orange. Introducción. Componentes. Canvas. www.ailab.si\orange. Ejemplo - Entrada. Victoria Montes vmontes@exa.unicen.edu.ar

Orange. Introducción. Componentes. Canvas. www.ailab.si\orange. Ejemplo - Entrada. Victoria Montes vmontes@exa.unicen.edu.ar Introducción Orange www.ailab.si\orange Victoria Montes vmontes@exa.unicen.edu.ar Es una herramienta para data mining escrita en C++, que define componentes. Es una librería que se importa desde Python.

Más detalles

LAS REDES BAYESIANAS COMO SISTEMAS DE SOPORTE A LA DECISIÓN EN LA EMPRESA

LAS REDES BAYESIANAS COMO SISTEMAS DE SOPORTE A LA DECISIÓN EN LA EMPRESA LAS REDES BAYESIANAS COMO SISTEMAS DE SOPORTE A LA DECISIÓN EN LA EMPRESA Mar Abad Grau María Visitación Hurtado Torres Rosana Montes Soldado Miguel J. Hornos Barranco Lenguajes y Sistemas Informáticos

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Módulo Titulación TÉCNICAS DE APRENDIZAJE AUTOMÁTICO COMPUTACIÓN TECNOLOGÍAS ESPECÍFICAS GRADO EN INGENIERÍA INFORMÁTICA Plan 545 Código 46932 Periodo de

Más detalles

INSTITUTO UNIVERSITARIO DE SISTEMAS INTELIGENTES Y APLICACIONES NUMÉRICAS EN INGENIERÍA TRABAJO FINAL DE MÁSTER:

INSTITUTO UNIVERSITARIO DE SISTEMAS INTELIGENTES Y APLICACIONES NUMÉRICAS EN INGENIERÍA TRABAJO FINAL DE MÁSTER: INSTITUTO UNIVERSITARIO DE SISTEMAS INTELIGENTES Y APLICACIONES NUMÉRICAS EN INGENIERÍA TRABAJO FINAL DE MÁSTER: Sistema Biométrico de Detección Facial sobre Alumno: Marcos del Pozo Baños Tutor: Dr. Modesto

Más detalles

MÁQUINAS DE VECTORES DE SOPORTE

MÁQUINAS DE VECTORES DE SOPORTE MÁQUINAS DE VECTORES DE SOPORTE Introducción Se tiene información de N individuos codificada de la forma Las variables X son vectores que reúnen información numérica del individuo, las variables Y indican

Más detalles

Clasificación de Tráfico de Redes para la Agrupación de Usuarios

Clasificación de Tráfico de Redes para la Agrupación de Usuarios Clasificación de Tráfico de Redes para la Agrupación de Usuarios Jorge E. RODRÍGUEZ Universidad Distrital Francisco José de Caldas Bogotá, Colombia Diana C. MACHADO Universidad Distrital Francisco José

Más detalles

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA

2. CLASIFICACIÓN DE LA ACTIVIDAD CURRICULAR, FORMACIÓN PRÁCTICA Y CARGA HORARIA CÓDIGO ASIGNATURA 1131-3 DEPARTAMENTO: Ingeniería e Investigaciones Tecnológicas ASIGNATURA: DATA MINING y DATA WAREHOUSE Plan 2009 Ingeniería en Informática Año: 5 (Electiva - Ingeniería de Software)

Más detalles

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?

Más detalles

Técnicas de clasificación ordinal aplicadas a un problema de distribución en planta

Técnicas de clasificación ordinal aplicadas a un problema de distribución en planta Técnicas de clasificación ordinal aplicadas a un problema de distribución en planta M. Pérez-Ortiz, C. Hervás-Martínez, L. García-Hernández, L. Salas-Morera, A. Arauzo-Azofra Resumen La gran parte de los

Más detalles

"Big Data Analysis" (Métodos especiales para bases de datos gigantes)

Big Data Analysis (Métodos especiales para bases de datos gigantes) "Big Data Analysis" (Métodos especiales para bases de datos gigantes) Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad

Más detalles

Finanzas e Investigación de Mercados"

Finanzas e Investigación de Mercados DIPLOMATURA: "Análisis de Datos para Negocios, Finanzas e Investigación de Mercados" Seminario: Introducción a Data Mining y Estadística Dictado: Sábado 13, 20,27 de Abril, 04 de Mayo en el horario de

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente Agüero Martin Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.marin@gmail.com López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu Agüero Martín Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.martin@gmail.com

Más detalles

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín. Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.

Más detalles

Tema 5. Reconocimiento de patrones

Tema 5. Reconocimiento de patrones Tema 5. Reconocimiento de patrones Introducción al reconocimiento de patrones y a la clasificación de formas Un modelo de general de clasificador Características discriminantes Tipos de clasificación Clasificadores

Más detalles

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD KDD y MD Dr. Juan Pedro Febles Rodríguez BIOINFO febles@bioinfo.cu http://www.bioinfo.cu CITMA 2005 Temas a tratar Algunos antecedentes académicos. El proceso de descubrimiento de conocimientos en Datos

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Data Mining. Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014

Data Mining. Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014 Data Mining Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014 Outline La información y el proceso KDD 1 La información y el proceso

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

METODOLOGÍA PARA LA DETECCIÓN DE PÉRDIDAS NO TÉCNICAS EN SISTEMAS DE DISTRIBUCIÓN UTILIZANDO MÉTODOS DE MINERIA DE DATOS RUBÉN DARÍO TREJOS RAMÍREZ

METODOLOGÍA PARA LA DETECCIÓN DE PÉRDIDAS NO TÉCNICAS EN SISTEMAS DE DISTRIBUCIÓN UTILIZANDO MÉTODOS DE MINERIA DE DATOS RUBÉN DARÍO TREJOS RAMÍREZ METODOLOGÍA PARA LA DETECCIÓN DE PÉRDIDAS NO TÉCNICAS EN SISTEMAS DE DISTRIBUCIÓN UTILIZANDO MÉTODOS DE MINERIA DE DATOS RUBÉN DARÍO TREJOS RAMÍREZ UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS

Más detalles

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Mª. José Ramírez Quintana José Hernández Orallo Programa: Programación Declarativa e Ingeniería de la Programación Objetivos

Más detalles

técnicas de minería de datos

técnicas de minería de datos 206 Análisis de los resultados del EXANI-II en el Estado de Aguascalientes mediante técnicas de minería de datos LUNA-RAMÍREZ, Enrique* `, CORREA-VILLALÓN, Christian`, VELARDE-MARTÍNEZ, Apolinar` y ERNÁNDEZ-CESSANI,

Más detalles

Data Mining utilizando Redes Neuronales. Juan M. Ale ale@acm.org Facultad de Ingeniería Universidad de Buenos Aires

Data Mining utilizando Redes Neuronales. Juan M. Ale ale@acm.org Facultad de Ingeniería Universidad de Buenos Aires Data Mining utilizando Redes Neuronales Romina Laura Bot rbot@fi.uba.ar Juan M. Ale ale@acm.org Facultad de Ingeniería Universidad de Buenos Aires Resumen: Las Redes Neuronales son ampliamente utilizadas

Más detalles

Tome mejores decisiones mediante la inteligencia predictiva

Tome mejores decisiones mediante la inteligencia predictiva IBM SPSS Modeler Professional Funciones destacadas Acceda, prepare y cree modelos de datos estructurados fácilmente con este conjunto de programas de minería de datos intuitivo y visual. Crea y valide

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

LÍNEAS DE INVESTIGACIÓN: Redes neuronales (I)

LÍNEAS DE INVESTIGACIÓN: Redes neuronales (I) LÍNEAS DE INVESTIGACIÓN: Redes neuronales (I) Objetivo: Usar técnicas neuronales para resolver problemas: * Modelado de sistemas mediante aprendizaje automático a partir de ejemplos * No se conoce ningún

Más detalles

PageRank y HITS. Felipe Bravo Márquez. 8 de noviembre de 2013. F. Bravo-Marquez PageRank y HITS

PageRank y HITS. Felipe Bravo Márquez. 8 de noviembre de 2013. F. Bravo-Marquez PageRank y HITS PageRank y HITS Felipe Bravo Márquez 8 de noviembre de 2013 Analizando la Web como un Grafo La Web es una colección de documentos interconectados por hipervínculos (links). Se modela como un grafo dirigido

Más detalles

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático? Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles