Tabla de Contenidos. Support Vector Machine Gráficas, estadística y minería de datos con Python. Objetivos. Aspectos Técnicos. Miguel Cárdenas Montes

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tabla de Contenidos. Support Vector Machine Gráficas, estadística y minería de datos con Python. Objetivos. Aspectos Técnicos. Miguel Cárdenas Montes"

Transcripción

1 Support Vector Machine Gráficas, estadística y minería de datos con Python Tabla de Contenidos 1 Objetivos Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 6-10 de Octubre de Introducción 3 Support Vector Machine 4 Ejemplo 5 Regresión con SVM M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Objetivos Conocer las diferencias entre los métodos de aprendizaje supervisado y no supervisados. Conocer métodos SVM lineales, polinómicos y radiales Introducción Aspectos Técnicos scikit-learn API Support Vector Machine M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

2 Minería de Datos Minería de Datos La Minería de Datos (data mining) es un campo multidisciplinar cuyo objetivo es el descubrimiento de conocimiento en grandes volúmenes de información. La Minería de Datos está relacionado con otras áreas de trabajo como: machine learning, estadísitica, reconocimiento de imágenes, recuperación de información, redes neuronales, inteligencia artificial, computación de altas prestaciones, visualización de datos... La Minería de Datos estuvo en su desarrollo inicial muy ligada a la extración de conocimiento de las bases de datos, Knowledge Discover in Databases. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Minería de Datos Pasos KDD Diferencia con el análisis estadístico Diferencia con métodos estadísticos: la estadística se utiliza para validar o parametrizar un modelo preexistente, no para generarlo. Los sistemas clásicos de estadística pueden ser difíciles de usar y no escalan al número y tipo de datos que se suelen encontrar en bases de datos. 1 Limpieza de datos. Quitar datos ruidosos o inconsistentes. Desafío: Tratar con datos ruidosos y de baja calidad. 2 Integración de datos. Los datos de múltiples fuentes son integrados. Desafío: Tratar con datos no estructurados. 3 Selección de datos. Elegir aquellos que representando al conjunto son una parte reducida del mismo. Desafío: Tratar con grandes volúmnes de datos. 4 Data Mining 5 Evaluación del modelo. 6 Presentación (visualización) del conocimiento. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

3 Algoritmos Supervisados y No Supervisados Algoritmos Supervisados Las dos categorías principales de algoritmos de data mining son los denominados: supervisados y no supervisados. Supervisados: Support Vector Machine, K-Nearest Neighbors No Supervisados: K-means, DBSCAN, Gaussian Mixture Model En este caso, los datos incluyen características y etiquetas. El objetivo consiste en construir un estimador con capacidad predictiva sobre la etiqueta en función de un conjunto de características. Los algoritmos supervisados se dividen a su vez en dos categorías: impacientes y perezosos; y en dos tipos de problemas: clasificación y regresión. En clasificación la etiqueta es discreta o categórica y en regresión es continua. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Algoritmos No Supervisados Aprendizaje Supervisado En este caso, los datos no incluyen etiquetas. Al carecer de etiquetas, el objetivo es encontrar similitudes entre los objetos. Usos Predicción de futuros casos: se usa el modelo para predecir casos futuros. Extracción de conocimiento: el modelo es más fácil de comprender (visualizar), retener y comprender. Comprensión: el modelo es más simple que el conjunto de datos que explica. Cómo de cara es la atención de los humanos? Detección de valores atípicos o anómalos: excepciones que no son cubiertas por el modelo, por ejemplo fraudes or intrusiones. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

4 Aprendizaje No Supervisado Tipos de Datos Usos Encontrar estructuras en los datos. Cuáles son similares? Presentación descriptiva de los datos (no predictiva como en el aprendizaje supervisado). Usos Aprender qué sucede normalmente!; y qué es anómalo! Variables categóricas Nominales (no pueden ser ordenados): tipo de galaxia (eĺıptica, irregular, espiral), macho-hembra. Ordinales (pueden ser ordenadores): números enteros, temperatua si solo se toman los valores enteros. Variables numéricas o continuas: temperatura, distancia. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Qué es clasificación? Qué es predicción o regresión? Función En este caso un modelo o clasificador es construido para predecir atributos categóricos. Ejemplo Predecir si el riesgo de una prestamo es alto o bajo en función de la edad, los ingresos, el capital pedido,... Función En este caso un modelo o preditor es construido para predecir valores continuos o valores ordenados. Ejemplo Predecir cuanto se gastará una familia durante sus vacaciones en función de ciertos parámetros: número de miembros de la familia, edad de los miembros, procedencia, ingresos... M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

5 The Top 10 Algorithms in Data Mining 1 C4.5, presented by Hiroshi Motoda 2 K-Means, presented by Joydeep Ghosh 3 SVM, presented by Qiang Yang 4 Apriori, presented by Christos Faloutsos 5 EM, presented by Joydeep Ghosh 6 PageRank, presented by Christos Faloutsos 7 AdaBoost, presented by Zhi-Hua Zhou 8 knn, presented by Vipin Kumar 9 Naive Bayes, presented by Qiang Yang 10 CART, presented by Dan Steinberg 18 Identified Candidates I Classification: C4.5: Quinlan, J. R C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc. CART: L. Breiman, J. Friedman, R. Olshen, and C. Stone. Classification and Regression Trees. Wadsworth, Belmont, CA, K Nearest Neighbours (knn): Hastie, T. and Tibshirani, R Discriminant Adaptive Nearest Neighbor Classification. IEEE Trans. Pattern Anal. Mach. Intell. (TPAMI). 18, 6 (Jun. 1996), Naive Bayes: Hand, D.J., Yu, K., Idiot s Bayes: Not So Stupid After All? Internat. Statist. Rev. 69, Statistical Learning: SVM: Vapnik, V. N The Nature of Statistical Learning Theory. Springer-Verlag New York, Inc. EM: McLachlan, G. and Peel, D. (). Finite Mixture Models. J. Wiley, New York. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / Identified Candidates II Association Analysis Apriori: Rakesh Agrawal and Ramakrishnan Srikant. Fast Algorithms for Mining Association Rules. In VLDB 94. FP-Tree: Han, J., Pei, J., and Yin, Y.. Mining frequent patterns without candidate generation. In SIGMOD 00. Link Mining PageRank: Brin, S. and Page, L The anatomy of a large-scale hypertextual Web search engine. In WWW-7, HITS: Kleinberg, J. M Authoritative sources in a hyperlinked environment. In Proceedings of the Ninth Annual ACM-SIAM Symposium on Discrete Algorithms, Clustering K-Means: MacQueen, J. B., Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Mathematical Statistics and Probability, BIRCH: Zhang, T., Ramakrishnan, R., and Livny, M BIRCH: an efficient data clustering method for very large databases. In SIGMOD Identified Candidates III Bagging and Boosting AdaBoost: Freund, Y. and Schapire, R. E A decision-theoretic generalization of on-line learning and an application to boosting. J. Comput. Syst. Sci. 55, 1 (Aug. 1997), Sequential Patterns GSP: Srikant, R. and Agrawal, R Mining Sequential Patterns: Generalizations and Performance Improvements. In Proceedings of the 5th International Conference on Extending Database Technology, PrefixSpan: J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto, Q. Chen, U. Dayal and M-C. Hsu. PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth. In ICDE 01. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

6 18 Identified Candidates IV Integrated Mining CBA: Liu, B., Hsu, W. and Ma, Y. M. Integrating classification and association rule mining. KDD-98. Rough Sets Finding reduct: Zdzislaw Pawlak, Rough Sets: Theoretical Aspects of Reasoning about Data, Kluwer Academic Publishers, Norwell, MA, Graph Mining gspan: Yan, X. and Han, J gspan: Graph-Based Substructure Pattern Mining. In ICDM 02. Support Vector Machine M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 SVM I SVM II Support Vector Machine (SVM) es un método supervisado de clasificación, aunque también puede utilizarse en regresión. H1 no separa las clases. H2 y H3 sí separan las clases. H3 maximiza el margen de separación de las clases. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

7 SVM III SVM IV Objetivo maximizar la anchura del margen que separa ambas clases de datos. Existen conjutos de datos no linealmente separables. SVM también puede tratarlos. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Elementos de SVM I SVM Un Support Vector Machine (SVM) ejecuta una clasificación. Para ello tiene que encontrar el hiperplano que maximiza el margen entre las dos clases. Los vectores (casos) que definen el hiperplano se denominan support vectors. SVM usa un mapeo no lineal transformando los datos originales en otros de dimensionalidad superior. En estas nuevas dimensionalidades, SVM busca el hiperplano óptimo que separa las clases. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

8 Ejemplo I Ejemplo SVM linealmente separable. import numpy as np import pylab as pl from sklearn import svm # first training set X = np.r_[ 1,2,0, \ [500,,,,,, 8000], \ [500,,,,,, ] ] Y = [0, 0, 0, 0, 0, \ 1, 1] pl.scatter(x[:, 0], X[:, 1], c=y, cmap=pl.cm.paired) pl.xlabel( Label A ) pl.ylabel( Label B ) pl.axis( tight ) pl.ylim( (0, 8110) ) pl.xlim( (0, 8110) ) pl.show() Label B Label A M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Ejemplo II Ejemplo III SVM linealmente separable. # fit the model and get the separating hyperplane clf = svm.svc(kernel= linear, C=2.0) clf.fit(x, Y) Al añadir un nuevo punto se reoganiza el esquema. Se mantiene que los puntos son linealmente separables (3500, 3500, etiqueta 1). # get the separating hyperplane w = clf.coef_[0] a = -w[0] / w[1] xx = np.linspace(0, 1) yy = a * xx - (clf.intercept_[0]) / w[1] 5000 # plot the parallels to the separating hyperplane that pass through the # support vectors b = clf.support_vectors_[0] yy_down = a * xx + (b[1] - a * b[0]) b = clf.support_vectors_[-1] yy_up = a * xx + (b[1] - a * b[0]) # plot the line, the points, and the nearest vectors to the 0 plane pl.plot(xx, yy, k- ) Label A pl.plot(xx, yy_down, k-- ) pl.plot(xx, yy_up, k-- ) pl.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=80, facecolors= none ) pl.scatter(x[:, 0], X[:, 1], c=y, cmap=pl.cm.paired) Label B # Modified training set X = np.r_[ 1,2,0, \ [500,,,,,, 8000, 3500], \ [500,,,,,,, 3500] ] Y = [0, 0, 0, 0, 0, \ 1, 1, 1] Label B Label A M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

9 Ejemplo IV Ejemplo V Label B Label A Label B Label A Predicción de nuevos puntos. from sklearn import svm X = [[0, 0], [0.4, 0.5], [1, 1], [2, 2]] y = [0, 0, 1, 1] clf = svm.svc() clf.fit(x, y) print clf.predict([[0.5, 1.]]) print clf.predict([[2., 2.]]) print clf.predict([[2., 3.]]) M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Ejemplo VI Datos no linealmente separable. Se cambia un punto de etiqueta (,, etiqueta 1). El resultado gráfico es anómalo si se trata de mantener una separabilidad lineal. Ejemplo VII Sin embargo, con ecuación no lineal (polinómica) se podrían separar los datos. # Modified training set X = np.r_[ 1,2,0, \ [500,,,,,, 8000], \ [500,,,,,, ] ] Y = [0, 0, 1, 0, 0, \ 1, 1] clf = svm.svc(kernel= poly, gamma=4) clf.fit(x, Y) pl.figure() pl.clf() pl.scatter(x[:, 0], X[:, 1], c=y, zorder=10, cmap=pl.cm.paired) pl.axis( tight ) x_min = X[:, 0].min() x_max = X[:, 0].max() y_min = X[:, 1].min() y_max = X[:, 1].max() XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j] Z = clf.decision_function(np.c_[xx.ravel(), YY.ravel()]) 500 # Put the result into a color plot Z = Z.reshape(XX.shape) pl.pcolormesh(xx, YY, Z > 0, cmap=pl.cm.paired) pl.contour(xx, YY, Z, colors=[ k, k, k ], linestyles=[ --, -, -- ], levels=[-.5, 0,.5]) pl.show() M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

10 Tipos de kernel en SVM Parámetros de SVM Lineal Polinómico rbf, radial basis function sigmoide, tangente hiperbólica C Penalización del término de error. Este parámetro, común en todos los kernels, es un compromiso entre las clasificaciones erróneas de las tuplas de entrenamiento contra la simplicidad de la superficie de decisión. Un valor bajo de c hace la superficie de decisión suave, mientras que un valor alto trata de clasificar absolutamente todas las tuplas de entrenamiento correctamente. kernel Tipo de kernel usado en el algoritmo. degree Grado de la función kernel cuando de tipo polinómico. gamma Coeficiente del kernel cuando es de tipo rbf. coef0 Parámetro del kernel cuando es de tipo sigmoide. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Multiclases Complejidad Computacional de SVM Para datos no linealmente separable y más de dos clases es posible hacer mapas (mediante predicción) de las zonas de influencia de cada clase. SVM incrementa los requerimientos computacionales con rapidez con el número de tuplas de entrenamiento. El núcleo de la librería escala como O(n features nsamples 2 ) o como O(n features nsamples 3 ) dependiendo de la eficiencia del uso y de las particularidades de los datos. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

11 Regresión con SVM I Regresión con SVM El método de SVM puede ser extendida a la resolución de problemas de regresión. En SVR la etiqueta categórica tiene que ser cambiada por valores continuos. M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 Regresión con SVM II Gracias import numpy as np X = np.sort(5 * np.random.rand(40, 1), axis=0) y = np.sin(x).ravel() # Add noise to targets y[::4] += 3 * (0.5 - np.random.rand(10)) # Fit regression model from sklearn.svm import SVR svr_rbf = SVR(kernel= rbf, C=1e3, gamma=0.1) svr_lin = SVR(kernel= linear, C=1e3) svr_poly = SVR(kernel= poly, C=1e3, degree=2) y_rbf = svr_rbf.fit(x, y).predict(x) y_lin = svr_lin.fit(x, y).predict(x) y_poly = svr_poly.fit(x, y).predict(x) # look at the results import pylab as pl pl.scatter(x, y, c= k, label= data ) pl.hold( on ) pl.plot(x, y_rbf, c= g, label= RBF model ) pl.plot(x, y_lin, c= r, label= Linear model ) pl.plot(x, y_poly, c= b, label= Polynomial model ) pl.legend() pl.show() target Support Vector Regression Linear model Polynomial model data data Gracias Preguntas? Más preguntas? M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44 M. Cárdenas (CIEMAT) SVM 6-10 de Octubre de / 44

Support Vector Machine

Support Vector Machine Support Vector Machine Gráficas, estadística y minería de datos con Python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es

Más detalles

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos

Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos I. Barbona - Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos Comparison among

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Support Vector Machines

Support Vector Machines Support Vector Machines Separadores lineales Clasificacion binaria puede ser vista como la tarea de separar clases en el espacio de caracteristicas w T x + b > 0 w T x + b = 0 w T x + b < 0 f(x) = sign(w

Más detalles

Práctica 11 SVM. Máquinas de Vectores Soporte

Práctica 11 SVM. Máquinas de Vectores Soporte Práctica 11 SVM Máquinas de Vectores Soporte Dedicaremos esta práctica a estudiar el funcionamiento de las, tan de moda, máquinas de vectores soporte (SVM). 1 Las máquinas de vectores soporte Las SVM han

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Ricardo Timarán Pereira, Ph.D. Departamento de Sistemas, Facultad de Ingeniería, Universidad

Más detalles

clustering: Clasificación no Supervisada

clustering: Clasificación no Supervisada clustering: Clasificación no Supervisada Gráficas estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

MÉTODO DE CLASIFICACIÓN SUPERVISADA SUPPORT VECTOR MACHINE: UNA APLICACIÓN A LA CLASIFICACIÓN AUTOMÁTICA DE TEXTOS.

MÉTODO DE CLASIFICACIÓN SUPERVISADA SUPPORT VECTOR MACHINE: UNA APLICACIÓN A LA CLASIFICACIÓN AUTOMÁTICA DE TEXTOS. Revista de Epistemología y Ciencias Humanas 37 MÉTODO DE CLASIFICACIÓN SUPERVISADA SUPPORT VECTOR MACHINE: UNA APLICACIÓN A LA CLASIFICACIÓN AUTOMÁTICA DE TEXTOS. Supervised Classification Method Support

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

Text Mining Introducción a Minería de Datos

Text Mining Introducción a Minería de Datos Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T11: Métodos Kernel: Máquinas de vectores soporte {jdiez, juanjo} @ aic.uniovi.es Índice Funciones y métodos kernel Concepto: representación de datos Características y ventajas Funciones

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Introducción La visión artificial, también conocida como visión por computador

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente Agüero Martin Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.marin@gmail.com López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu

Más detalles

Proceso del KDD (minería de datos o DataMining)

Proceso del KDD (minería de datos o DataMining) Qué es el KDD? Es un proceso no trivial que identifica patrones validos, previamente desconocidos, potencialmente utiles y fundamentalmente entendibles en los datos. es como se reconoce de manera teoria

Más detalles

Enfoque propuesto para la detección del humo de señales de video.

Enfoque propuesto para la detección del humo de señales de video. Capítulo 3 Enfoque propuesto para la detección del humo de señales de video. 3.1 Comportamiento del enfoque propuesto. Una visión general del método propuesto se muestra en la figura 2. El método genera

Más detalles

MÁQUINAS DE VECTORES DE SOPORTE

MÁQUINAS DE VECTORES DE SOPORTE MÁQUINAS DE VECTORES DE SOPORTE Introducción Se tiene información de N individuos codificada de la forma Las variables X son vectores que reúnen información numérica del individuo, las variables Y indican

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

SISTEMAS DE INDUCCIÓN DE REGLAS Y ÁRBOLES DE DECISIÓN APLICADOS A LA PREDICCIÓN DE INSOLVENCIAS EN EMPRESAS ASEGURADORAS

SISTEMAS DE INDUCCIÓN DE REGLAS Y ÁRBOLES DE DECISIÓN APLICADOS A LA PREDICCIÓN DE INSOLVENCIAS EN EMPRESAS ASEGURADORAS SISTEMAS DE INDUCCIÓN DE REGLAS Y ÁRBOLES DE DECISIÓN APLICADOS A LA PREDICCIÓN DE INSOLVENCIAS EN EMPRESAS ASEGURADORAS Zuleyka Díaz Martínez (a) José Fernández Menéndez (b) Mª Jesús Segovia Vargas (a)

Más detalles

PROGRAMA DE CURSO. Personal 6 10 3.0 0 7. Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso

PROGRAMA DE CURSO. Personal 6 10 3.0 0 7. Electivo para ICC FI2002 Electromagnetismo. Competencia a la que Tributa el Curso. Propósito del Curso PROGRAMA DE CURSO Código Nombre CC5206 Introducción a la Minería de Datos Nombre en Inglés Introduction to Data Mining SCT es Horas de Horas Docencia Horas de Trabajo Docentes Cátedra Auxiliar Personal

Más detalles

ENSIA 605 Inteligencia de Negocios y Minería de Datos

ENSIA 605 Inteligencia de Negocios y Minería de Datos ENSIA 605 Inteligencia de Negocios y Minería de Datos Profesor: Jaime Miranda P. E mail profesor: jmirandap@fen.uchile.cl OBJETIVOS DEL CURSO OBJETIVO GENERAL Estudiar, analizar, diseñar y aplicar tecnologías

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

30 oct. SAP Fraud Management. El Camino a la transparencia. La necesidad Gestionar en tiempo real. El medio Una plataforma in-memory

30 oct. SAP Fraud Management. El Camino a la transparencia. La necesidad Gestionar en tiempo real. El medio Una plataforma in-memory SAP Fraud Management 30 oct 2014 El Camino a la transparencia SAP Fraud Management La necesidad Gestionar en tiempo real El medio Una plataforma in-memory La necesidad Gestionar en tiempo real 3 La necesidad:

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Finanzas e Investigación de Mercados"

Finanzas e Investigación de Mercados DIPLOMATURA: "Análisis de Datos para Negocios, Finanzas e Investigación de Mercados" Seminario: Introducción a Data Mining y Estadística Dictado: Sábado 13, 20,27 de Abril, 04 de Mayo en el horario de

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

Tema 7. Introducción al reconocimiento de objetos

Tema 7. Introducción al reconocimiento de objetos Tema 7. Introducción al reconocimiento de objetos En resumen, un sistema de reconocimiento de patrones completo consiste en: Un sensor que recoge las observaciones a clasificar. Un sistema de extracción

Más detalles

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación 5.5.1. Denominación: Introducción a la Minería de Datos 5.5.2. Breve Descripción del Contenido: Introducción a la minería de datos. Aprendizaje supervisado, modelos no paramétricos y modelos generalizados

Más detalles

TEMA 1. Introducción

TEMA 1. Introducción TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático

Más detalles

Estudio e Implementación de una Máquina de Soporte Vectorial.

Estudio e Implementación de una Máquina de Soporte Vectorial. Estudio e Implementación de una Máquina de Soporte Vectorial. Lázaro Bustio Martínez, Alejandro Mesa Rodríguez lbustio@ccc.inaoep.mx, amesa@ccc.inaoep.mx Resumen. En este trabajo se presentan las Máquinas

Más detalles

LÍNEAS DE INVESTIGACIÓN: Redes neuronales (I)

LÍNEAS DE INVESTIGACIÓN: Redes neuronales (I) LÍNEAS DE INVESTIGACIÓN: Redes neuronales (I) Objetivo: Usar técnicas neuronales para resolver problemas: * Modelado de sistemas mediante aprendizaje automático a partir de ejemplos * No se conoce ningún

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

código Java Solicitudes Reportes AJI resultados API

código Java Solicitudes Reportes AJI resultados API Analizador Java Inteligente López De Luise María Daniela, miembro IT-Lab de la Universidad de Palermo, mlopez74@palermo.edu Agüero Martín Jorge, miembro IT-Lab de la Universidad de Palermo, agüero.martin@gmail.com

Más detalles

Problemas de clasificación: problemas de localización

Problemas de clasificación: problemas de localización Problemas de clasificación: problemas de localización Emilio Carrizosa Facultad de Matemáticas Universidad de Sevilla ecarrizosa@us.es Belén Martín-Barragán Facultad de Matemáticas Universidad de Sevilla

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Impartido por: Juan Alfonso Lara Torralbo 1. Datos del docente NOMBRE Juan Alfonso Lara Torralbo FORMACIÓN

Más detalles

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación ESTUDIO DE TECNICAS DE DATA MINING APLICADAS AL ANALISIS DE DATOS GENERADOS CON LA METODOLOGIA BLENDED LEARNING Marcelo Omar Sosa, Sosa Bruchmann Eugenia Cecilia Departamento Computación/Facultad de Ciencias

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

Random Forests. Felipe Parra

Random Forests. Felipe Parra Applied Mathematics Random Forests Abril 2014 Felipe Parra Por que Arboles para Clasificación PERFIL DE RIESGO: definir con qué nivel de aversión al riesgo se toman decisiones Interpretación intuitiva

Más detalles

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes:

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes: Data & Text Mining Exponentes: - Dr. Jorge Bacallao Guerra - Ing. Ramón Martinez - Ing. José Villanueva Agosto del 2012 Introducción o Porqué es necesario utilizar data mining o Que ésdata miningy qué

Más detalles

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales Elkin García, Germán Mancera, Jorge Pacheco Presentación Los autores han desarrollado un método de clasificación de música a

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

Support Vector Machine

Support Vector Machine Juan Carlos Caicedo Juan Carlos Mendivelso Maestria en Ingenieria de Sistemas y Computacion Universidad Nacional de Colombia 20 de marzo de 2007 Agenda 1 2 3 4 Outline 1 2 3 4 Clasificador lineal que utiliza

Más detalles

MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA

MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA MODELO HÍBRIDO DE CLASIFICACIÓN BASADO EN ALGORITMOS GENÉTICOS Y MÁQUINAS DE VECTORES DE SOPORTE APLICADO A LA EVALUACIÓN CREDITICIA ANDRÉS YESID RAMÍREZ AYA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE

Más detalles

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín. Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Regresión Lineal. Minería de datos con python. Miguel Cárdenas Montes

Regresión Lineal. Minería de datos con python. Miguel Cárdenas Montes Regresión Lineal Minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 2-6 de Noviembre de 2015

Más detalles

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11

Tema 5. Análisis de regresión (segunda parte) Estadística II, 2010/11 Tema 5 Análisis de regresión (segunda parte) Estadística II, 2010/11 Contenidos 5.1: Diagnóstico: Análisis de los residuos 5.2: La descomposición ANOVA (ANalysis Of VAriance) 5.3: Relaciones no lineales

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Métodos de agregación de modelos y aplicaciones

Métodos de agregación de modelos y aplicaciones Métodos de agregación de modelos y aplicaciones Model aggregation methods and applications Mathias Bourel 1 Recibido: Mayo 2012 Aprobado: Agosto 2012 Resumen.- Los métodos de agregación de modelos en aprendizaje

Más detalles

Clasificación Bayesiana de textos y páginas web

Clasificación Bayesiana de textos y páginas web Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en

Más detalles

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Waldo Hasperué 1,2, Laura Lanzarini 1, 1 III-LIDI, Facultad de Informática, UNLP 2 Becario CONICET {whasperue, laural}@lidi.info.unlp.edu.ar

Más detalles

3. Selección y Extracción de características. Selección: Extracción: -PCA -NMF

3. Selección y Extracción de características. Selección: Extracción: -PCA -NMF 3. Selección y Extracción de características Selección: - óptimos y subóptimos Extracción: -PCA - LDA - ICA -NMF 1 Selección de Características Objetivo: Seleccionar un conjunto de p variables a partir

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Módulo Titulación TÉCNICAS DE APRENDIZAJE AUTOMÁTICO COMPUTACIÓN TECNOLOGÍAS ESPECÍFICAS GRADO EN INGENIERÍA INFORMÁTICA Plan 545 Código 46932 Periodo de

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

ANÁLISIS MULTIVARIANTE. Créditos. Teóricos: 6 Prácticos: 3 Total: 9. Profesoras: Agurtzane Amparan, Silvia Marcaida y Arantza Urkaregi

ANÁLISIS MULTIVARIANTE. Créditos. Teóricos: 6 Prácticos: 3 Total: 9. Profesoras: Agurtzane Amparan, Silvia Marcaida y Arantza Urkaregi Presentación ANÁLISIS MULTIVARIANTE MATEMÁTICAS SEGUNDO CICLO OPTATIVA SEGUNDO CUATRIMESTRE Créditos. Teóricos: 6 Prácticos: 3 Total: 9 Profesoras: Agurtzane Amparan, Silvia Marcaida y Arantza Urkaregi

Más detalles

MEJORA EN LA EFICIENCIA DE GENERACIÓN DE MODELOS

MEJORA EN LA EFICIENCIA DE GENERACIÓN DE MODELOS MEJORA EN LA EFICIENCIA DE GENERACIÓN DE MODELOS MODELO DE BEHAVIOR SCORING Por: Rosario Zolezzi Diners Club Perú Agenda Antecedentes Problemática Objetivos Fases del Modelamiento Uso de la herramienta

Más detalles

de Lanús. Buenos Aires, Argentina. rgarcia@unla.edu.ar.

de Lanús. Buenos Aires, Argentina. rgarcia@unla.edu.ar. Behavioral Variability of Clustering and Induction Based on Domain Features Variabilidad del Comportamiento de Agrupamiento e Inducción Basado en las Características del Dominio Marcelo López N. 1, Ramón

Más detalles

Minera de datos aplicada a la detección de Cáncer de Mama

Minera de datos aplicada a la detección de Cáncer de Mama Minera de datos aplicada a la detección de Cáncer de Mama Eugenio Hernández Martínez Universidad Carlos III de Madrid 100039081@alumnos.uc3m.es Rodrigo Lorente Sanjurjo Universidad Carlos III de Madrid

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN ANÁLISIS MULTIVARIADO

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN ANÁLISIS MULTIVARIADO UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERÍAS MAESTRÍA EN INGENIERÍA DE SISTEMAS Y COMPUTACIÓN ANÁLISIS MULTIVARIADO OBJETIVO GENERAL El curso es de un nivel matemático intermedio y tiene

Más detalles

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA 5504. Horas / Crédito: 3 horas semanales / 3 Créditos

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA 5504. Horas / Crédito: 3 horas semanales / 3 Créditos Universidad de Puerto Rico Recinto de Rio Piedras Facultad de Administración de Empresas 1 2 I. Titulo del curso: Minería de Datos Prontuario II. Codificación: ESTA 5504 III. Horas / Crédito: 3 horas semanales

Más detalles

Análisis de Datos. Práctica de métodos predicción de en WEKA

Análisis de Datos. Práctica de métodos predicción de en WEKA SOLUCION 1. Características de los datos y filtros Una vez cargados los datos, aparece un cuadro resumen, Current relation, con el nombre de la relación que se indica en el fichero (en la línea @relation

Más detalles

MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL

MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL MODELO PREDICTIVO DE DESERCIÓN ESTUDIANTIL APLICACIÓN DE TÉCNICAS DE MINERÍA DE DATOS Yegny Amaya, Edwin Barrientos, Universidad Francisco de Paula Santander, Colombia Diana Heredia Vizcaíno, Universidad

Más detalles

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información:

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información: Datamining y Aprendizaje Automatizado Prof. Carlos Iván Chesñevar Email: cic@cs.uns.edu.ar Http:\\cs.uns.edu.ar\~cic Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Bahía Blanca,

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático? Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

CONSIDERACIONES GENERALES DEL WEB MINING

CONSIDERACIONES GENERALES DEL WEB MINING CONSIDERACIONES GENERALES DEL WEB MINING Sandra Milena Leal Elizabeth Castiblanco Calderón* RESUMEN: el presente artículo describe los conceptos básicos para la utilización del Webmining, dentro de los

Más detalles

Entrenamiento en Gestión de Minería de Datos Aplicada a la Inteligencia en los Negocios

Entrenamiento en Gestión de Minería de Datos Aplicada a la Inteligencia en los Negocios Entrenamiento en Gestión de Minería de Datos Aplicada a la Inteligencia en los Negocios Elaborado por: Luis Francisco Zaldívar, MSE Director www.modelacionderiesgos.com l.zaldivar@modelacionderiesgos.com

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

La inteligencia de marketing que desarrolla el conocimiento

La inteligencia de marketing que desarrolla el conocimiento La inteligencia de marketing que desarrolla el conocimiento SmartFocus facilita a los equipos de marketing y ventas la captación de consumidores con un enfoque muy relevante y centrado en el cliente. Ofrece

Más detalles

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web

Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web A Comparison of Approaches to Semi-supervised Multiclass SVM for Web Page Classification Arkaitz Zubiaga,

Más detalles

"Big Data Analysis" (Métodos especiales para bases de datos gigantes)

Big Data Analysis (Métodos especiales para bases de datos gigantes) "Big Data Analysis" (Métodos especiales para bases de datos gigantes) Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad

Más detalles

Monitoring SIP Traffic Using Support Vector Machines

Monitoring SIP Traffic Using Support Vector Machines Monitoring SIP Traffic Using Support Vector Machines Mohamed Nassar, Radu State, and Olivier Festor Centre de Recherche INRIA Nancy - Grand Est Villers-Lès-Nancy, France Presenta: Juan Ramón Cayón Alcalde

Más detalles

Métricas de complejidad para la transformación del problema de detección de cáncer basado en

Métricas de complejidad para la transformación del problema de detección de cáncer basado en Índice para la transformación del problema de detección de cáncer basado en mamografías Alumna: Núria Macià Antoĺınez Asesora: Ester Bernadó Mansilla Núria Macià Antoĺınez PFC: 1/49 Índice 1 Planteamiento

Más detalles

Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos).

Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos). Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos). Autores: - MsC. Ing. Mario L. Basulto Núñez (ETECSA) mario.basulto@etecsa.cu - Lic.

Más detalles

TEMA 5 ESTUDIOS CORRELACIONALES.

TEMA 5 ESTUDIOS CORRELACIONALES. TEMA 5 ESTUDIOS CORRELACIONALES. 1. INTRODUCCIÓN. 2. CONCEPTO DE CORRELACIÓN. 3. CASOS EN LOS QUE SE UTILIZA LA INVESTIGACIÓN CORRELACIONAL. 4. LIMITACIONES DE LOS ESTUDIOS CORRELACIONALES 1 1. INTRODUCCIÓN.

Más detalles