Aplicación de la técnica de asociación de la minería de datos en un caso de investigación 1

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Aplicación de la técnica de asociación de la minería de datos en un caso de investigación 1"

Transcripción

1 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación 1 Application of the data mining association technique in a research case Juan Camilo Giraldo Mejía* Paola Andrea Noreña Cardona** Diana María Montoya Quintero*** Presentado: 29 de febrero del 2012 Aprobado: 5 de mayo del 2012 Resumen Introducción: hoy en día, la cantidad de datos que ha sido almacenada excede nuestra habilidad para reducirlos y analizarlos sin el uso de técnicas automáticas. Muchas bases de datos transaccionales y científicas crecen en una gran proporción. Metodología: una manera de analizar los datos eficientemente es con la aplicación de técnicas automáticas de minería de datos, siguiendo el proceso de obtención de conocimiento kdd. Este artículo muestra cómo se aplicó el kdd por medio de la técnica A priori : primero se caracterizó el proceso de kdd, la técnica de reglas de asociación, luego se mostró la funcionalidad de la técnica, y posteriormente se aplicó la técnica en un caso de investigación específico del Resultados: las reglas de asociación se obtienen por el algoritmo, la red de dependencias, y el análisis de los resultados. Conclusiones: la técnica A priori es una de las más aplicadas en la búsqueda de reglas de asociación, ya que permite generar resultados y datos interesantes. Palabras clave: algoritmo, conocimiento, innovación, minería de datos, reglas de asociación. Abstract Introduction: Nowadays, the amount of data that is stored exceeds our ability to reduce and analyze data without the use of automated techniques. Many transactional and scientific databases grow at great rates. Methodology: One way to analyze data efficiently is the application of automated techniques of data mining, through the kdd process for acquiring knowledge. This paper shows how the kdd was applied through the a priori technique: first we characterized the kdd process, the association rules technique. Afterwards we showed the functionality of the technique, and then we applied it in a specific research case from Results: We obtained association rules through an algorithm, a dependency network, and results analysis. Conclusions: The a priori technique is one of the most applied methods for the search of association rules, since it can obtain results and interesting facts. Keywords: algorithm, knowledge, innovation, data mining, association rules. Cómo citar este artículo: Giraldo Mejía, Juan Camilo; Noreña Cardona, Paola Andrea y Montoya Quintero, Diana María (2012), Aplicación de la técnica de asociación de la minería de datos en un caso de investigación, en Revista Memorias, vol. 10, núm. 18, pp Artículo de investigación resultado del proyecto de investigación Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico, adelantada entre el 2009 y el 2010 en el Tecnológico de Antioquia, por el grupo de investigación giista. * ** Ingeniero de Sistemas de la Universidad Cooperativa de Colombia, sede Medellín. Magíster en Ingeniería de Sistemas de la Universidad Nacional de Colombia, Medellín. Docente del Tecnológico de Antioquia. Correo electrónico: Ingeniera de Sistemas de la Universidad Cooperativa de Colombia, sede Medellín. Maestrante en Ingeniería de Sistemas de la Universidad Nacional de Colombia. Docente del Tecnológico de Antioquia. Correo electrónico: *** Licenciada en Sistemas de la Universidad de Medellín. Magíster en Ingeniería de Sistemas de la Universidad Nacional de Colombia. Docente del Instituto Tecnológico Metropolitano. Correo electrónico: 36

2 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Introducción El análisis de la información recopilada en un experimento científico, por ejemplo, habitualmente es un proceso manual, basado por lo general en técnicas estadísticas. Sin embargo, cuando la cantidad de datos arrojados por la investigación aumenta, el manejo manual del problema se hace muy complejo, y es aquí donde entra en juego el conjunto de técnicas de análisis automático de la denominada minería de datos. El kdd (Knowledge Discovery in Databases) es el proceso completo de extracción de información que se encarga, además de la preparación de los datos, de la interpretación de los resultados obtenidos. El kdd se ha definido como el proceso no trivial de identificación en los datos de patrones válidos, nuevos, potencialmente útiles, y finalmente comprensibles (fayy96). Tareas comunes en el kdd son la obtención de reglas de asociación y el agrupamiento, o clustering. La minería de datos es un término genérico que abarca resultados de investigación, técnicas y herramientas usadas para extraer información útil de grandes bases de datos. Metodología - aspectos generales Inteligencia de negocios Con la aplicación de la inteligencia de negocios, se presenta una importante oportunidad para las técnicas de minería de datos que ayudan a las empresas a recopilar y analizar información acerca de su desempeño, clientes, competencia de mercado y entorno empresarial. El conocimiento de herramientas de representación y visualización de datos constituye una forma de las técnicas de inteligencia de negocios que presentan información a los usuarios y apoyan a las empresas en la toma de decisiones (Adomavicius y Bockstedt, 2008). Existe una gran variedad de técnicas para realizar agrupamientos y asociaciones sobre los datos, y es posible que los analistas expertos desconozcan las propiedades de cada una de ellas, y por eso la tarea de aplicación de la técnica apropiada en un caso particular, se convierte en todo un problema. Descubrimiento de conocimiento kdd El descubrimiento de conocimiento (kdd) es una de las actividades intelectuales más importantes de la mente humana y de la sociedad. La intuición y el conocimiento son elementos necesarios para los verdaderos descubrimientos. La Interpretación y la apreciación del significado son necesarias para comprender y utilizar el conocimiento. La minería de datos (dm) y el almacenamiento de datos, han promovido el principal medio de kdd con el objetivo de utilizar los conocimientos descubiertos para la toma de decisiones óptimas, es decir, Inteligencia de Negocios (bi) (Rennolls, 2005). Proceso de descubrimiento de conocimiento La teoría del conocimiento tiene tres objetivos principales: llegar a una definición satisfactoria de los conocimientos, determinar qué tipo de proposiciones pueden ser ciertas, y explicar cómo estas proposiciones pueden ser verdaderas; esto se aplica al proceso de descubrimiento de conocimiento y necesita ser desarrollado con el fin de que se pueda tener confianza en que el kdd suministre conocimiento. Si el kdd contiene conocimiento y ciencia, necesita de un almacén de datos construido para fusionar una amplia gama de recursos de bases de datos con relaciones desconocidas entre las variables que han sido extraídas de diferentes fuentes. Esta es la tarea de la relación descubrimiento de conocimiento kdd y minería de datos dm, para revelar, descubrir y 37

3 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación representar adecuadamente conocimiento de los datos (Othman et al., 2010). El proceso de kdd se inicia con la identificación de los datos. Para ello es necesario imaginar qué datos se necesitan, dónde se pueden encontrar y cómo conseguirlos. Una vez se tienen los datos adecuados, se procede a la minería de datos, proceso en el que se seleccionarán las herramientas y técnicas adecuadas para lograr los objetivos pretendidos; y tras este proceso llega el análisis de resultados, con lo que se obtiene el conocimiento pretendido (figura 1). Interpretation/ Evaluation Data Mining Preprocessing Transformation Knowledge Selection xxx xxx xxx xxx xxx xxx xxx xxx xxx Preprocessed Data Transformed Data Patterns Data Target Date Figura 1. Metodología para el descubrimiento de conocimiento Fuente: Fica, 2011 La etapa de selección de la información consiste en obtener desde los diferentes orígenes los datos relevantes para obtener conocimiento. Los orígenes tienen diferentes formatos, como bases de datos de Excel, archivos planos o sistemas gestores de bases de datos. El propósito de seleccionar los datos es consolidarlos en un repositorio de gran tamaño, una bodega de datos, o DataWareHouse. La información que se encuentra allí tuvo un preprocesamiento de datos por medio de una etapa de transformación que busca la consistencia de los datos. Dicha consistencia garantiza la simetría de la información que se pasa de un origen a un destino. Cuando los datos se encuentran en la bodega, ya transformados, se procede a realizar la explotación de la información, buscando obtener conocimiento, lo cual se logra por medio de técnicas de minería de datos. La aplicación de minería de datos consiste en utilizar diferentes técnicas algorítmicas entre ellas agrupamiento o clustering y reglas de asociación (algoritmo A priori ), las cuales extraen conocimiento a partir de modelos específicos; sobre dichos modelos se hace la interpretación de los resultados desde figuras o tablas dinámicas (figura 2). 38

4 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero 70% 60% 50% 40% 30% 20% 10% 0% Entendimiento del dominio Preparación de los datos Figura 2. Esfuerzo requerido por cada fase del proceso kdd Fuente: Rosete, Acosta y Rodríguez, 2009 Data Mining Interpretación y consolidación del conocimiento Como se observa en la figura 2, gran parte del esfuerzo del proceso de kdd recae sobre la fase de preparación de los datos, fase crucial para tener éxito, como ya se comentó anteriormente. Minería de datos En el proceso de análisis de datos, la minería de datos busca organizar las relaciones identificadas por patrones entre los campos relacionales de grandes bases de datos. La minería de datos tiene como resultado el descubrimiento de conocimiento y se compone de la inteligencia de negocios, la identificación de los requerimientos de los datos, el modelado y su verificación (Rajagopalan e Isken, 2001). Es así como la minería de datos contribuye en el proceso de descubrimiento de conocimiento en bases de datos y en el proceso global de descubrir conocimiento útil a partir de los datos. El objetivo de unificar el kdd con la minería de datos es la extracción de alto nivel de conocimiento a partir de conjuntos de datos de gran tamaño en los que el aprendizaje sea automático y exista un patrón de reconocimiento (Lobur et al., 2008). Técnicas de la minería de datos Las técnicas de la minería de datos persiguen el descubrimiento automático del conocimiento contenido en la información almacenada de modo ordenado en grandes bases de datos, y tienen como objetivo descubrir patrones, perfiles y tendencias por medio del análisis de los datos, utilizando tecnologías de reconocimiento (Pérez y Santín, 2007). Las técnicas de la minería de datos pueden redituar los beneficios de automatización en las plataformas de hardware y software existentes, y pueden ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y sean desarrollados nuevos productos. Cuando las herramientas de la minería de datos son implementadas en sistemas de procesamiento paralelo de alto rendimiento, pueden analizar bases de datos masivas en minutos. Cuanto mayor sea la dimensión del problema, mejores soluciones ofrecerá la minería de datos. Cuantas más variables entren en el problema, más difícil resultará encontrar hipótesis de partida interesantes, o aún cuando pudiera, el tiempo necesario no justificará la inversión. 39

5 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación Reglas de asociación Las reglas de asociación son una poderosa técnica de minería de datos, y son utilizadas para buscar por medio de conjuntos de datos reglas que revelan la naturaleza de las relaciones o asociaciones entre datos de las entidades. Las asociaciones resultantes pueden ser utilizadas para filtrar la información, para analizarlas y posiblemente para definir un modelo de predicción basado en la observación del comportamiento (Luo, 2008). Este tipo de técnicas se emplea para establecer las posibles relaciones o correlaciones entre distintas acciones o sucesos aparentemente independientes, permitiendo reconocer cómo la ocurrencia de un suceso o acción puede inducir o generar la aparición de otros (Agrawal, 1993). Gracias a sus características, estas técnicas tienen una gran aplicación práctica en muchos campos, como por ejemplo el comercial, ya que son especialmente interesantes a la hora de comprender los hábitos de compra de los clientes y constituyen un pilar básico tanto en la concepción de las ofertas y ventas cruzadas, como del merchandising (Ramaswamy, 1998). Por lo general, esta forma de extracción de conocimiento se fundamenta en técnicas estadísticas como el análisis de correlación. Uno de los algoritmos que permite obtener reglas de asociación es el A priori, cuyo flujo de información se muestra en la figura 3. Act Activity Diagram Base de Datos <column> Conjunto de ítem Sets Iniciar Seleccionar Convertir a números Verificar frecuencia Enviar atributos SÍ Descartar atributo Existen más atributos para evaluar Terminar Figura 3. Flujo de información del algoritmo A priori Fuente: Giraldo, 2009 NO Tiene frecuencia y soporte altos? Descartar atributo NO NO SÍ Juntar valores Tiene frecuencia y soporte altos? SÍ Generar tripleta Existen más atributos para evaluar Se repite el ciclo hasta el final de las transacciones SÍ Recibir datos 40

6 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Resultados Aplicación de la técnica en un caso específico El problema se orienta a la carencia de innovación y desarrollo tecnológico que presenta nuestro país, lo cual se refleja en algunas empresas, concretamente en los productos que se colocan en el mercado. Contextualización del problema de investigación Colombia tiene graves problemas de competitividad que, sin duda alguna, atentan contra su integración exitosa en los mercados mundiales. Estos problemas se han puesto de manifiesto con mayor fuerza a partir del cambio del modelo de desarrollo económico colombiano que, desde comienzos de los años noventa, dejo atrás la sustitución de importaciones y las políticas proteccionistas por un esquema de apertura comercial financiera. Estos movimientos aperturistas de los noventa seguirán profundizando hacia el futuro, probablemente en el marco de tratados de libre comercio, bilateral y multilateral. En tales escenarios, la competitividad se convierte en elemento fundamental para que un país logre insertarse de manera efectiva y beneficiosa en la economía mundial (Robledo, 2007). Para solucionar esta problemática se propone un modelo que muestra las propiedades fundamentales de las técnicas de asociación y regresión logística y funcionalidad al minero de datos, cuando de descubrir patrones frecuentes e interesantes o relación de variables se trate. El modelo se obtuvo a partir de la caracterización de las dos técnicas en mención: A priori y regresión logística, estableciendo sus atributos o características fundamentales y el flujo de información a partir de los métodos de cada caso. La aplicación y validación del modelo conceptual propuesto se hizo utilizando algunas variables y datos obtenidos de la Encuesta Anual Manufacturera, el cual versa que la innovación y el desarrollo tecnológico son pilares reconocidos de competitividad y factores clave para transformar el conocimiento en riqueza económica, bienestar social y desarrollo humano. Para ello, se utilizaron las herramientas sql Server 2005 como repositorio de información, y sql Server Business Intelligence Development Studio, para crear los orígenes y vistas de datos. Asimismo se utilizó la tecnología Microsoft para generar reglas de asociación, y una red de dependencias con el algoritmo de asociación. Este algoritmo es una implementación de la técnica A priori. Igualmente se aplicó el algoritmo de regresión logística el cual generó gráficos de elevación y visor de redes probabilísticas. En este artículo solo se muestran los resultados obtenidos con la técnica de reglas de asociación. Objetivos de la investigación General Realizar un modelo conceptual sobre algunas de las técnicas de asociación de la minería de datos que le sirva a los analistas de información expertos (mineros de datos) en el momento de necesitar aplicarlas, indicando sus características y funcionalidad para el estudio de objetos de interés sobre un dominio específico. Específicos Identificar y seleccionar algunas técnicas de la minería de datos ofrecidas por la inteligencia artificial para el descubrimiento de reglas de asociación entre los datos de un dominio específico. 41

7 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación Caracterizar las técnicas seleccionadas, con el fin de conocer sus propiedades, funcionalidad y estructura. Presentar los resultados estructurales de cada técnica en términos de recomendaciones o comentarios, fortalezas y limitaciones, funcionalidad, desde una propuesta conceptual Unified Modeling Language (uml). Aplicar el modelo obtenido en un caso de investigación específico, proyecto de investigación que apoya el descubrimiento de conocimiento sobre la innovación en Colombia a partir de las Encuestas de Innovación y Desarrollo Tecnológico, la Encuesta Anual Manufacturera, y la base de datos Scienti. Origen de los datos La Facultad de Minas de la Universidad Nacional de Colombia, sede Medellín, aplicó una encuesta a algunas empresas, con el fin de conocer el nivel de desarrollo e innovación tecnológica que estas aportan con la colocación de sus productos en el mercado. En la base de datos se contó con algunas preguntas de la encuesta y su respectiva codificación, las cuales se convierten en las variables utilizadas en la aplicación de la técnica de asociación de la minería de datos. Descripción de las variables Las variables utilizadas contienen los resultados de la innovación y el impacto de la innovación (tabla 1). Tabla 1. Descripción de variables Variable Descripción Valores Variable I 107 Variable IV402_02 Variable IV402_03 ncuest Fuente: Giraldo, 2009 Identifica la naturaleza jurídica de la empresa. Variable independiente. Indica los productos nuevos como resultado de actividades de innovación. Variable independiente. Indica productos nuevos asociados con nuevos procesos productivos. Corresponde al identificador de cada uno de los 198 registros que se tomaron como muestra de la población total. 1 = empresa unipersonal, 2 = sociedad en comandita simple, 3 = entidad sin ánimo de lucro, 4 = sociedad anónima, 5 = sociedad de hecho, 6 = sociedad comandita por acciones, 7 = sucursal extranjera, 8 = economía solidaria, 9 = sociedad colectiva, 10 = sociedad limitada, 11 = empresa industrial del Estado, 12 = empresa de economía mixta. Sí = 1 No = 2 Sí = 1 No =

8 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Muestra poblacional De 885 registros correspondientes a la población total de empresas encuestadas, se tomó una muestra de 198 registros para aplicar la técnica de asociación. En la tabla 2 se visualizan algunos de estos registros. Tabla 2. Muestra poblacional ncuest I107 IVA_2_3 IV4_3_3 IVA Fuente: Giraldo, 2009 Reglas obtenidas Teniendo en cuenta los antecedentes de nuestro país respecto a innovación tecnológica, y los datos utilizados desde las bases de datos construidas a partir de la Encuesta sobre Desarrollo Tecnológico en el establecimiento industrial colombiano, los resultados son similares a los obtenidos a partir del Modelo de Reglas de Asociación. Las reglas de asociación obtenidas se generaron a partir de una frecuencia o probabilidad de 0,5, y un soporte de 0,6. Lo que se espera es obtener las reglas de asociación más interesantes que muestren la tendencia de haber colocado nuevos productos en el mercado desde 1993 hasta la fecha. La idea es que las reglas generadas superen la frecuencia inicial o mínima frecuencia, teniendo en este caso un tope de frecuencia de 1, es decir el valor máximo establecido en el parámetro de frecuencia para el algoritmo, lo que indica que se generarán reglas entre 0,5 y 1. En la tabla 3 se muestran las reglas de asociación generadas, con las variables de Probabilidad, Importancia y Regla, cuyo análisis es el siguiente: Probabilidad: indica la frecuencia que acompaña la regla obtenida. Es de resaltar que en el caso de las dos reglas del ejemplo la mayor probabilidad es 1, mientras en las demás reglas (ver tabla 3), se ve que la frecuencia se reduce paralelamente a la importancia de la regla obtenida. Importancia: indica la relevancia del interés que tiene la regla respecto a las otras. El procesamiento de los datos a partir del algoritmo de Asociación ha generado las reglas de asociación que muestran los siguientes resultados: la tabla 3 tiene una columna que identifica el tipo de empresa, luego aparece la variable dependiente, es decir nuevos productos colocados en el mercado desde 1993, luego el valor de la variable, después la relación entre variables, y por último aparece el indicador de importancia de esa relación (ver tabla 3). El mayor porcentaje o frecuencia es hacia el valor de 1, es decir que sí se han colocado nuevos productos en el mercado desde Solo la variable Tipo de empresa, con valor unipersonal, muestra valor de 0, lo cual indica que las empresas clasificadas como unipersonales no han colocado nuevos productos en el mercado desde

9 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación Las reglas de asociación muestran que las empresas de tipo anónima y la obtención de nuevos productos a partir de nuevos procesos, han permitido la colocación de nuevos productos en el mercado. La variable Nuevo producto actividades innovación, que en este caso es no, significa que no se han realizado actividades innovadoras en la creación de productos; sin embargo la tendencia, aunque con menor importancia, muestra que sí se han colocado nuevos productos en el mercado desde Las empresas clasificadas como limitadas muestran que han colocado nuevos productos en el mercado desde 1993, con el soporte de actividades y procesos innovadores para producir nuevos elementos. Las empresas unipersonales que han realizado procesos innovadores para obtener productos, tienen mayor importancia que las empresas de tipo unipersonal que no han realizado actividades innovadoras, como premisas, para colocar nuevos productos en el mercado desde Con una mejor probabilidad y mayor importancia aparecen las empresas de tipo empresa industrial, comandita por acciones, sucursal extranjera, sociedad colectiva, sin ánimo de lucro y comandita, cuya premisa es haber hecho nuevos productos a partir de actividades innovadoras, como soporte para la conclusión de colocar nuevos productos en el mercado desde Con menos importancia, algunas empresas de tipo comandita por acciones, comandita, sin ánimo de lucro y empresa industrial, han colocado nuevos productos en el mercado desde 1993, utilizando procesos innovadores. Tabla 3. Algunas reglas de asociación generadas Probabilidad Importancia Regla 1,00 0,50 NUEVOPRODUCTOPROCESOINNOVACION=SI 1,00 0,43 NUEVOPRODUCTOPROCESOINNOVACION=NO 1,00 0,34 NUEVOPRODUCTOPROCESOINNOVACION=NO, TIPOEMPRESA=ANONIMA 1,00 0,33 1,00 0,33 1,00 0,32 1,00 0,31 1,00 0,30 NUEVOPRODUCTOACTIVIDADESINNOVACION=NO, TIPOEMPRESA=ANONIMA NUEVOPRODUCTOPROCESOINNOVACION=SI, NUEVOPRODUCTOACTIVIDADESINNOVACION=NO NUEVOPRODUCTOACTIVIDADESINNOVACION=SI, TIPOEMPRESA=ANONIMA NUEVOPRODUCTOPROCESOINNOVACION=SI, NUEVOPRODUCTOACTIVIDADESINNOVACION=SI NUEVOPRODUCTOPROCESOINNOVACION=SI, TIPOEMPRESA=LIMITADA Fuente: Giraldo,

10 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Red de dependencias Permite ver las relaciones entre las variables de entrada y la variable que se evalúa, en este caso la variable de predicción. Se muestra claramente que la tendencia de no haber colocado nuevos productos en el mercado desde 1993 es de las empresas unipersonales, lo cual se confirma con el valor de 0, es decir la respuesta que corresponde a no. EMPRESAUNIPERSONAL En el caso contrario, el modelo indica que las empresas que han colocado nuevos productos en el mercado, apoyadas en nuevos procesos e innovaciones, son las de tipo unipersonal, comandita, comandita por acciones, limitada, colectiva, empresa industrial y sucursal extranjera (ver figura 4). NUEVOSPRODUCTOSENELMERCADO1993= 0 NUEVOSPRODUCTOSACTIVIDADESINNOVACION=SI TIPOEMPRESA=COMANDITA TIPOEMPRESA=SINANIMOLUCRO TIPOEMPRESA=SUCURSALEXTRAJERA TIPOEMPRESA=COMANDITAPORACCIONES TIPOEMPRESA=UNIPERSONAL NUEVOSPRODUCTOSENELMERCADO1993=1 TIPOEMPRESA=INDUSTRIAL TIPOEMPRESA=ANONIMA NUEVOPRODUCTOPROCESOINNOVACION=NO NUEVOPRODUCTOPROCESOINNOVACION=NO TIPOEMPRESA=SOCIEDADCOLECTIVA Figura 4. Red de dependencias Fuente: Giraldo, 2009 Conclusiones La técnica de Asociación se caracterizó por ser la que se presenta como una de las más aplicadas en la búsqueda de reglas de asociación, además de que se encuentra implementada en diferentes herramientas de software libre y licenciado. La aplicación de esta técnica en el proyecto de investigación Descubrimiento de conocimiento sobre la innovación en Colombia a partir de las encuestas de innovación y desarrollo tecnológico, ha permitido generar resultados, y en ellos datos interesantes que indican el estado en que se encuentra nuestro país en materia de innovación, investigación y desarrollo de nuevas tecnologías. 45

11 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación En este modelo se visualizan los objetos y se resaltan los que generan los grafos o redes de dependencias, las reglas de asociación, que muestran los patrones o elementos interesantes entre variables, e indican las probabilidades relacionadas con el objeto en estudio. Se resalta que la búsqueda en bases de datos es compleja, en el sentido de que no es posible partir de una hipótesis, sin embargo, restringiéndose a un subconjunto de datos por medio de la utilización de la técnica de minería de datos denominada Reglas de Asociación, se puede obtener información de presunta relación entre ellos. Referencias Adomavicius, G. y Bockstedt, J. (2008), c-trend: Temporal Cluster Graphs for Identifying and Visualizing Trends in Multiattribute Transactional Data, en Knowledge and Data Engineering, IEEE Transactions on, vol. 20, núm. 6, pp Agrawal, R., Imielinski, T. y Swami, A. (1993), Minería de reglas de asociación entre los conjuntos de productos en grandes bases de datos, en Actas de 1993 acm Internacional sigmod, Conferencia sigmod, Washington, D.C, pp [en línea], disponible en: cfm?doid= , recuperado: 12 de septiembre del Fica, E. (2011), Data Mining, concepto bit de la semana, Chile, Facultad de Ingeniería e Información, Universidad de Chile. Giraldo, J. (2009), Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico (tesis de maestría), Medellín, Universidad Nacional de Colombia, Facultad de Minas. Lobur, M.; Stekh, Yu.; Kernytskyy, A. y Sardieh, F.M.E. (2008), Some trends in Knowledge Discovery and Data Mining, Perspective Technologies and Methods in mems Design (conferencia, mayo 21), memstech 2008, International Conferencee, iiee. Luo, Q. (2008), Advancing Knowledge Discovery and Data Mining, en Knowledge Discovery and Data Mining, wkdd 2008, First International Workshop on, pp Lutfi, M.; Aris, I.; Abdullah, S.M.; Ali, M.L. y Othman, M.R. (2010), Knowledge Discovery in Distance Relay Event Report: A Comparative Data-Mining Strategy of Rough Set Theory With Decision Tree, en Power Delivery, ieee Transactions on, vol. 25, núm. 4, pp Pérez, C. y Santín, D. (2007), Minería de datos, técnicas y herramientas, España, Thomson Paraninfo S.A. Rajagopalan, B. y Isken, M.W. (2001), Exploiting data preparation to enhance mining and knowledge discovery, Systems, Man, and Cybernetics, Part C: Applications and Reviews, en ieee Transactions on, vol. 31, núm. 4, pp Ramaswamy, S.; Mahajan, S. y Silberschatz, A. (1998), On the discovery of interesting patterns in association rules, en Proc Int. Conf Very Large Databases (vldb 98), pp Rennolls, K. (2005), An intelligent framework (o-ss-e) for data mining, knowledge discovery and business intelligence, Database and Expert Systems Applications, Proceedings, en Sixteenth International Workshop on, pp , Robledo, J. (2007), Descubrimiento de conocimiento sobre la innovación en Colombia a partir de las Encuestas de Innovación y Desarrollo Tecnológico, la Encuesta Anual Manufacturera y la base de datos ScienTI, Bogotá, Universidad Nacional de Colombia. Rosete-Suárez, A.; Acosta, R. y Rodríguez, A. (2009), Predicción de pacientes diabéticos, preprocesado de minería de datos, en Revista Electrónica Cubana de Informática Médica [en línea], disponible en: articulos_htm/prediccionpaciente.htm, recuperado: 20 de agosto del

JUAN CAMILO GIRALDO MEJÍA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE MINAS ESCUELA DE INGENIERÍAS SEDE MEDELLÍN 2009

JUAN CAMILO GIRALDO MEJÍA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE MINAS ESCUELA DE INGENIERÍAS SEDE MEDELLÍN 2009 CARACTERIZACIÓN DE ALGUNAS TÉCNICAS ALGORITMICAS DE LA INTELIGENCIA ARTIFICIAL PARA EL DESCUBRIMIENTO DE ASOCIACIONES ENTRE VARIABLES Y SU APLICACIÓN EN UN CASO DE INVESTIGACIÓN ESPECÍFICO JUAN CAMILO

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productivity in Construction Companies: Knowledge acquired from the databases Hernando Camargo Mila, Rogelio Flórez

Más detalles

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación ESTUDIO DE TECNICAS DE DATA MINING APLICADAS AL ANALISIS DE DATOS GENERADOS CON LA METODOLOGIA BLENDED LEARNING Marcelo Omar Sosa, Sosa Bruchmann Eugenia Cecilia Departamento Computación/Facultad de Ciencias

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD KDD y MD Dr. Juan Pedro Febles Rodríguez BIOINFO febles@bioinfo.cu http://www.bioinfo.cu CITMA 2005 Temas a tratar Algunos antecedentes académicos. El proceso de descubrimiento de conocimientos en Datos

Más detalles

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES Actualmente se vive una época donde se tiene una enorme cantidad de datos que se generan diariamente (del orden de Terabytes, Petabytes 1 (Han, Kamber, & Pei, 2012))

Más detalles

Metodologías híbridas para desarrollo de software: una opción factible para México Eréndira Miriam Jiménez Hernández y Sandra Dinora Orantes Jiménez

Metodologías híbridas para desarrollo de software: una opción factible para México Eréndira Miriam Jiménez Hernández y Sandra Dinora Orantes Jiménez Revista Digital Universitaria 1 de enero 2012 Volumen 13 Número 1 ISSN: 1067-6079 Metodologías híbridas para desarrollo de software: una opción factible para México Eréndira Miriam Jiménez Hernández y

Más detalles

de Lanús. Buenos Aires, Argentina. rgarcia@unla.edu.ar.

de Lanús. Buenos Aires, Argentina. rgarcia@unla.edu.ar. Behavioral Variability of Clustering and Induction Based on Domain Features Variabilidad del Comportamiento de Agrupamiento e Inducción Basado en las Características del Dominio Marcelo López N. 1, Ramón

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

1.1 Titulo Descriptivo del Proyecto

1.1 Titulo Descriptivo del Proyecto 1.1 Titulo Descriptivo del Proyecto Diseño de un Manual empleando Data Mining (Minería de Datos) para predecir el Potencial de Desarrollo de las empresas en la Zona Oriental asociadas a la Comisión Nacional

Más detalles

Anexo 1: MATRIZ DE CONGRUENCIA. Objetivo. Problema. Problema. Objetivos. Hipótesis General. Teórico. General. Especifico. Específicos.

Anexo 1: MATRIZ DE CONGRUENCIA. Objetivo. Problema. Problema. Objetivos. Hipótesis General. Teórico. General. Especifico. Específicos. 170 Anexo 1: MATRIZ DE CONGRUENCIA Problema Problema Objetivo Objetivos Hipótesis Variables Hipótesis Variables Marco General Especifico General Específicos General Especificas Teórico En qué medida el

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

Proceso de Identificación de Errores de Apropiación de Conceptos Basado en Explotación de Información

Proceso de Identificación de Errores de Apropiación de Conceptos Basado en Explotación de Información Proceso de Identificación de Errores de Apropiación de Conceptos Basado en Explotación de Información Saavedra-Martínez, P., Pollo-Cattaneo, F., Rodríguez, D., Britos, P., García-Martínez, R. Grupo de

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

Desarrollo de una Aplicación Móvil para Revisar

Desarrollo de una Aplicación Móvil para Revisar Desarrollo de una Aplicación Móvil para Revisar Horarios de Atención de Tutores de la UNAD Development of a Movil Application for Check Over Office Hours of Tutors of the Unad Correa Rodríguez Arellys

Más detalles

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team

Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Modelado de relaciones existentes en un equipo de proyecto de software Modeling relationships in a software project team Rafael Rodríguez-Puente 1, Eliana B. Ril-Valentin 2 1 Departamento de Técnicas de

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP Universidad Politécnica de Puebla UPP JESÚS ANTONIO GONZÁLEZ BERNAL 1 2 Evolución de la Tecnología BD 1960 s y antes Creación de las BD en archivos primitivos 1970 s hasta principios de los 1980 s BD Jerárquicas

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos

Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Ricardo Timarán Pereira, Ph.D. Departamento de Sistemas, Facultad de Ingeniería, Universidad

Más detalles

Boletín de Asesoría Gerencial*

Boletín de Asesoría Gerencial* Espiñeira, Sheldon y Asociados No. 10-2008 *connectedthinking Contenido Haga click en los enlaces para navegar a través del documento Haga click en los enlaces para llegar directamente a cada sección 4

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio Hidrocarburos: Análisis de Pablo Burgos Casado (Jefe de Área Desarrollo (SGTIC - MITYC)) María Teresa Simino Rueda Rubén Pérez Gómez Israel Santos Montero María Ángeles Rodelgo Sanchez 1. INTRODUCCIÓN

Más detalles

Formalización de Web Mining como Conocimiento Estructurado

Formalización de Web Mining como Conocimiento Estructurado Formalización de Web Mining como Conocimiento Estructurado Gabriel R. Filocamo Carlos I. Chesñevar Laboratorio de Investigación y Desarrollo en Inteligencia Artificial (LIDIA) Departamento de Ciencias

Más detalles

Datamining Introducción

Datamining Introducción Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas Datamining Introducción Yerko Halat 2 de Octubre del 2001 1 Cuál es la diferencia entre

Más detalles

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS Integrante: Profesor: Maximiliano Heise Luis Ríos Fecha de entrega: miércoles 18 de abril de 2012

Más detalles

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM

DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM DESARROLLO E IMPLANTANCIÓN DE UN SISTEMA ACADEMICO PARA EL ICM Sergio Bauz Olvera 1, Washington Jama 2 1 Ingeniero en Estadística e Informática 2003 2 Director de Tesis de Grado, Ing. Washington Jama.

Más detalles

Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix

Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix Presentación Las bases de datos y los sistemas de administración de datos han jugado un papel primordial en el crecimiento y éxito de

Más detalles

Cuba. Pérez González, Luis Orlando Microsoft Excel: una herramienta para la investigación. MediSur, vol. 4, núm. 3, 2006, pp. 68-71.

Cuba. Pérez González, Luis Orlando Microsoft Excel: una herramienta para la investigación. MediSur, vol. 4, núm. 3, 2006, pp. 68-71. MediSur E-ISSN: 1727-897X mikhail@infomed.sld.cu Universidad de Ciencias Médicas de Cienfuegos Cuba Pérez González, Luis Orlando Microsoft Excel: una herramienta para la investigación. MediSur, vol. 4,

Más detalles

3. Evaluación de alternativas tecnológicas.

3. Evaluación de alternativas tecnológicas. Desarrollo e Implementación de un DSS para Mejorar la Eficiencia del Proceso de Planeación de la Oferta Académica (Aplicación para una Universidad privada) Ruiz Galván Alejandro y Chávez Velázquez Raúl

Más detalles

Resumen. Contexto. Palabras clave: integración continua, software científico técnico, calidad de software.

Resumen. Contexto. Palabras clave: integración continua, software científico técnico, calidad de software. Automatización en el desarrollo de Software Crítico en el Ámbito Científico Técnico Alicia Salamon, Patricio Maller, Alejandra Boggio, Natalia Mira, Sofia Perez, Francisco Coenda. Departamento de Informática,

Más detalles

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS.

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. PRESENTA MTIE. Erik Guerrero Bravo. Tula de Allende Hidalgo Septiembre

Más detalles

Aplicación de la minería de datos al Sistema Cubano de Farmacovigilancia

Aplicación de la minería de datos al Sistema Cubano de Farmacovigilancia ARTÍCULOS ORIGINALES Aplicación de la minería de datos al Sistema Cubano de Farmacovigilancia Application of data mining to the Cuban Pharmacovigilance System Omar Calzadilla Fernández de Castro I ; Giset

Más detalles

Análisis de Incidentes Informáticos usando Modelos de Asociación y Métodos del Análisis de Datos Multivariante.

Análisis de Incidentes Informáticos usando Modelos de Asociación y Métodos del Análisis de Datos Multivariante. Análisis de Incidentes Informáticos usando Modelos de Asociación y Métodos del Análisis de Datos Multivariante. García, Alejandro (1), Corso, Cynthia Lorena (2), Gibellini, Fabián (3), Rapallini, Marcos

Más detalles

Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales

Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales Propuesta de un modelo de análisis para estimación del tamaño del software y gestión de costos y riesgos a partir de requerimientos funcionales S.Forigua, O.Ballesteros Abstract. This paper describes the

Más detalles

El fenómeno Big Data y los títulos en Estadística en España.

El fenómeno Big Data y los títulos en Estadística en España. El fenómeno Big Data y los títulos en Estadística en España. Daniel Peña Rector Universidad Carlos III de Madrid V Conferencia Interuniversitaria sobre Titulaciones en Estadística UCM, enero 2014 Indice

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular AUTORES: Fabián Cabrera Cuenca 1, Sergio Jonathan León García 2, Ilse Lorena Ycaza Díaz 3, Juan Aurelio Alvarado

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

Resumen. Palabras claves: Clusteres, Crisp-DM, Morosidad, Sigmoidal, Algoritmos, K-medias, UPeU.

Resumen. Palabras claves: Clusteres, Crisp-DM, Morosidad, Sigmoidal, Algoritmos, K-medias, UPeU. Model Clustering Neural Network Monitoring Applications No K-Means Algorithm for the Segmentation of the Peruvian University Students Union Rodolfo Pacco, Palomino; Del Rosario Montero, Wilson Tomas Anquise,

Más detalles

Área Académica: Sistemas Computacionales. Tema: Introducción a almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas

Área Académica: Sistemas Computacionales. Tema: Introducción a almacén de datos. Profesor: Mtro Felipe de Jesús Núñez Cárdenas Área Académica: Sistemas Computacionales Tema: Introducción a almacén de datos Profesor: Mtro Felipe de Jesús Núñez Cárdenas Periodo: Agosto Noviembre 2011 Keywords Almacén de Datos, Datawarehouse, Arquitectura

Más detalles

Ingeniería de Software con UML Unified Modeling Language Lenguaje Unificado de Modelado

Ingeniería de Software con UML Unified Modeling Language Lenguaje Unificado de Modelado Ingeniería de Software con UML Unified Modeling Language Lenguaje Unificado de Modelado 1. Introducción Unified Modeling Languaje Fuente: Booch- Jacobson-Rumbauch y diversos sitios Internet, entre otros:

Más detalles

UN PASEO POR BUSISNESS INTELLIGENCE

UN PASEO POR BUSISNESS INTELLIGENCE UN PASEO POR BUSISNESS INTELLIGENCE Ponentes: Agreda, Rafael Chinea, Linabel Agenda Sistemas de Información Transaccionales Qué es Business Intelligence? Usos y funcionalidades Business Intelligence Ejemplos

Más detalles

GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS

GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA GOP 06 14 a 17 Outubro de 2007 Rio de Janeiro - RJ GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS EVALUACIÓN DEL DESEMPEÑO

Más detalles

2.16. SERVICE SCIENCE Y SERVICE ANALYTICS EN FEN: ESTUDIO DE OPINIONES, QUEJAS Y CUMPLIDOS DE ALUMNOS

2.16. SERVICE SCIENCE Y SERVICE ANALYTICS EN FEN: ESTUDIO DE OPINIONES, QUEJAS Y CUMPLIDOS DE ALUMNOS 2.16. SERVICE SCIENCE Y SERVICE ANALYTICS EN FEN: ESTUDIO DE OPINIONES, QUEJAS Y CUMPLIDOS DE ALUMNOS Autores: 142-2-12.08 242 OBJETIVO Proceedings del XXIX Encuentro Nacional de Facultades de Administración

Más detalles

Desarrollo de un sistema de información de investigación integrado (IRIS-D, Fase I)

Desarrollo de un sistema de información de investigación integrado (IRIS-D, Fase I) Díaz, W. & Caicedo, C. (2011). Desarrollo de un sistema de información de investigación integrado (IRIS-D, Fase I). Revista Ingenium 5(9), pp 33-37 Desarrollo de un sistema de información de investigación

Más detalles

ASIGNATURA: Tecnologías de Información y Comunicación II

ASIGNATURA: Tecnologías de Información y Comunicación II ASIGNATURA: Tecnologías de Información y Comunicación II 53 HORAS DESCRIPCIÓN DE LA ASIGNATURA: Esta asignatura proporciona al alumno las competencias y herramientas teóricas necesarias para la aplicación

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM?

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM? Introducción En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat, sobre la posibilidad de la creación de nuevo conocimiento, he creido conveniente introducir el tema Data Mining

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos Anteproyecto de Tesis de Magíster en Ingeniería del Software Tesista: Lic. Matilde

Más detalles

Desmitificando Big Data:

Desmitificando Big Data: Desmitificando Big Data: Data Mining y Business Intelligence 2.0 Ignacio Bustillo Ignacio.Bustillo@stratebi.com Twitter: @IgnacioBustillo Fecha presentación: 14 de Noviembre de 2014 'Hello world!' Creador

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

Sistema Generador de Predicciones de Acceso para la Replicación n de Sitios de la Web en Dispositivos Inalámbricos

Sistema Generador de Predicciones de Acceso para la Replicación n de Sitios de la Web en Dispositivos Inalámbricos Cenidet Sistema Generador de Predicciones de Acceso para la Replicación n de Sitios de la Web en Dispositivos Inalámbricos Ing. Gabriel Hernández ndez MéndezM M.C.Juan Gabriel González Serna Ing. Juan

Más detalles

Inteligencia de Negocios (Business Intelligence)

Inteligencia de Negocios (Business Intelligence) ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS Programa de Pregrado Modalidad de Experiencia Laboral Artículo El uso de la Minería de Datos en la Inteligencia de Negocios (Business Intelligence)

Más detalles

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información:

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información: Datamining y Aprendizaje Automatizado Prof. Carlos Iván Chesñevar Email: cic@cs.uns.edu.ar Http:\\cs.uns.edu.ar\~cic Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Bahía Blanca,

Más detalles

Programación en Capas.

Programación en Capas. Programación en Capas. Ricardo J. Vargas Del Valle Universidad de Costa Rica, Ciencias de Computación e Informática, San José, Costa Rica, 506 ricvargas@gmail.com Juan P. Maltés Granados Universidad de

Más detalles

RW.02 RW.01. Curso Data Mining y Aplicaciones en Riesgo de Crédito

RW.02 RW.01. Curso Data Mining y Aplicaciones en Riesgo de Crédito RW.02 RW.01 Curso Data Mining y Aplicaciones en Riesgo de Crédito RICHARD WEBER PhD. En Investigación de Operaciones del Instituto de Tecnología de Aachen, Alemania La actividad comercial de las empresas

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO DIPLOMADO EN MINERÍA DE DATOS Por qué es importante la Minería de Datos? 2 La Minería de Datos es un proceso que permite obtener conocimiento a partir de los datos

Más detalles

Botón menú Objetivo de la Minería de datos.

Botón menú Objetivo de la Minería de datos. Titulo de Tutorial: Minería de Datos N2 Botón menú: Introducción. Las instituciones y empresas privadas coleccionan bastante información (ventas, clientes, cobros, pacientes, tratamientos, estudiantes,

Más detalles

DETECCIÓN DE PATRONES DE ACCESIBILIDAD EN EL DESARROLLO DE PROYECTOS WEB

DETECCIÓN DE PATRONES DE ACCESIBILIDAD EN EL DESARROLLO DE PROYECTOS WEB DETECCIÓN DE PATRONES DE ACCESIBILIDAD EN EL DESARROLLO DE PROYECTOS WEB Villanueva, J. (p) ; Rodríguez, V.; Ortega, F.; Mijares, A. Abstract The use of accessibility requirements in the development of

Más detalles

SQL SERVER 2008 R2 BI 07/07/2010 BUSINESS INTELLIGENCE

SQL SERVER 2008 R2 BI 07/07/2010 BUSINESS INTELLIGENCE Todo en la vida comienza con código VII Encuentro Desarrolladores Microsoft BUSINESS INTELLIGENCE Ana María Bisbé York Servicios Profesionales VII Encuentro Desarrolladores Microsoft Todo en la vida comienza

Más detalles

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR RECURSOS DE INFORMACIÓN Y CONOCIMIENTO EN UN CENTRO I+D+I EN LA PLATAFORMA SURICATA Marrero, S.R; Nelson, J.C; Galán, M; Ocón, A.; Rubio, E. sonia@cicei.com;

Más detalles

Minería de datos para la determinación del grado de exclusión social

Minería de datos para la determinación del grado de exclusión social Minería de datos para la determinación del grado de exclusión social Data mining to determine the degree of social exclusion * Jorge Enrique Rodríguez Rodríguez Fecha de recepción: 23 de agosto de 2008

Más detalles

WEB MINING FOR IDENTIFYING PATTERNS

WEB MINING FOR IDENTIFYING PATTERNS Minería de uso Web para la identificación de patrones Castaño P. Andres P. * Resumen La minería Web es la aplicación de técnicas de minería de datos para descubrir patrones de uso de los usuarios desde

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos Guía docente Impartido por: Juan Alfonso Lara Torralbo 1. Datos del docente NOMBRE Juan Alfonso Lara Torralbo FORMACIÓN

Más detalles

Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México

Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México Gómez Ramírez, Eduardo Maestría en ciencias en el área de cibernética. Un logro

Más detalles

Capítulo 3. Fases de descubrimiento en bases de datos

Capítulo 3. Fases de descubrimiento en bases de datos Capítulo 3. Fases de descubrimiento en bases de datos 3.1 Sistema de gestión de bases de datos La elección del sistema de gestión de bases de datos no es una tarea fácil, si bien todos tienen un mismo

Más detalles

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

Curso del Data Mining al Big Data

Curso del Data Mining al Big Data Curso del Data Mining al Big Data Instructor: Dr. Luis Carlos Molina Félix Presentación. Las bases de datos y los sistemas de administración de datos han jugado un papel primordial en el crecimiento y

Más detalles

Conciencia Tecnológica ISSN: 1405-5597 contec@mail.ita.mx Instituto Tecnológico de Aguascalientes México

Conciencia Tecnológica ISSN: 1405-5597 contec@mail.ita.mx Instituto Tecnológico de Aguascalientes México Conciencia Tecnológica ISSN: 1405-5597 contec@mail.ita.mx Instituto Tecnológico de Aguascalientes México Luna Ramírez, Enrique; Ambriz D., Humberto; Nungaray O., Antonio; Hernández Chessani, David; Rodríguez

Más detalles

Un Protocolo de Caracterización Empírica de Dominios para Uso en Explotación de Información

Un Protocolo de Caracterización Empírica de Dominios para Uso en Explotación de Información Un Protocolo de aracterización Empírica de Dominios para Uso en Explotación de Información Lopez-Nocera, M., Pollo-attaneo, F., Britos, P., García-Martínez, R. Grupo Investigación en Sistemas de Información.

Más detalles

CARACTERIZACIÓN DEL PROCESO DE FUGA DE CLIENTES UTILIZANDO INFORMACIÓN TRANSACCIONAL 1

CARACTERIZACIÓN DEL PROCESO DE FUGA DE CLIENTES UTILIZANDO INFORMACIÓN TRANSACCIONAL 1 CARACTERIZACIÓN DEL PROCESO DE FUGA DE CLIENTES UTILIZANDO INFORMACIÓN TRANSACCIONAL 1 Carolina Segovia csegovia@analytics.cl - Luis Aburto luaburto@analytics.cl Marcel Goic mgoic@dii.uchile.cl Resumen

Más detalles

Gestión de Información en Cuentas Nacionales de Chile

Gestión de Información en Cuentas Nacionales de Chile Gestión de Información en Cuentas Nacionales de Chile Gerencia de Estadísticas Macroeconómicas Departamento Cuentas Nacionales 1 B A N C O C E N T R A L D E C H I L E OCTUBRE 2009 Temario I. Antecedentes

Más detalles

Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos.

Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos. Diseño de almacén de datos para el análisis eficiente de la información de incidentes informáticos y mantenimientos. Ing. Corso Cynthia, Ing. Luque Claudio, Ing. Ciceri Leonardo, Sr Donnet Matías Grupo

Más detalles