Aplicación de la técnica de asociación de la minería de datos en un caso de investigación 1

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Aplicación de la técnica de asociación de la minería de datos en un caso de investigación 1"

Transcripción

1 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación 1 Application of the data mining association technique in a research case Juan Camilo Giraldo Mejía* Paola Andrea Noreña Cardona** Diana María Montoya Quintero*** Presentado: 29 de febrero del 2012 Aprobado: 5 de mayo del 2012 Resumen Introducción: hoy en día, la cantidad de datos que ha sido almacenada excede nuestra habilidad para reducirlos y analizarlos sin el uso de técnicas automáticas. Muchas bases de datos transaccionales y científicas crecen en una gran proporción. Metodología: una manera de analizar los datos eficientemente es con la aplicación de técnicas automáticas de minería de datos, siguiendo el proceso de obtención de conocimiento kdd. Este artículo muestra cómo se aplicó el kdd por medio de la técnica A priori : primero se caracterizó el proceso de kdd, la técnica de reglas de asociación, luego se mostró la funcionalidad de la técnica, y posteriormente se aplicó la técnica en un caso de investigación específico del Resultados: las reglas de asociación se obtienen por el algoritmo, la red de dependencias, y el análisis de los resultados. Conclusiones: la técnica A priori es una de las más aplicadas en la búsqueda de reglas de asociación, ya que permite generar resultados y datos interesantes. Palabras clave: algoritmo, conocimiento, innovación, minería de datos, reglas de asociación. Abstract Introduction: Nowadays, the amount of data that is stored exceeds our ability to reduce and analyze data without the use of automated techniques. Many transactional and scientific databases grow at great rates. Methodology: One way to analyze data efficiently is the application of automated techniques of data mining, through the kdd process for acquiring knowledge. This paper shows how the kdd was applied through the a priori technique: first we characterized the kdd process, the association rules technique. Afterwards we showed the functionality of the technique, and then we applied it in a specific research case from Results: We obtained association rules through an algorithm, a dependency network, and results analysis. Conclusions: The a priori technique is one of the most applied methods for the search of association rules, since it can obtain results and interesting facts. Keywords: algorithm, knowledge, innovation, data mining, association rules. Cómo citar este artículo: Giraldo Mejía, Juan Camilo; Noreña Cardona, Paola Andrea y Montoya Quintero, Diana María (2012), Aplicación de la técnica de asociación de la minería de datos en un caso de investigación, en Revista Memorias, vol. 10, núm. 18, pp Artículo de investigación resultado del proyecto de investigación Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico, adelantada entre el 2009 y el 2010 en el Tecnológico de Antioquia, por el grupo de investigación giista. * ** Ingeniero de Sistemas de la Universidad Cooperativa de Colombia, sede Medellín. Magíster en Ingeniería de Sistemas de la Universidad Nacional de Colombia, Medellín. Docente del Tecnológico de Antioquia. Correo electrónico: Ingeniera de Sistemas de la Universidad Cooperativa de Colombia, sede Medellín. Maestrante en Ingeniería de Sistemas de la Universidad Nacional de Colombia. Docente del Tecnológico de Antioquia. Correo electrónico: *** Licenciada en Sistemas de la Universidad de Medellín. Magíster en Ingeniería de Sistemas de la Universidad Nacional de Colombia. Docente del Instituto Tecnológico Metropolitano. Correo electrónico: 36

2 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Introducción El análisis de la información recopilada en un experimento científico, por ejemplo, habitualmente es un proceso manual, basado por lo general en técnicas estadísticas. Sin embargo, cuando la cantidad de datos arrojados por la investigación aumenta, el manejo manual del problema se hace muy complejo, y es aquí donde entra en juego el conjunto de técnicas de análisis automático de la denominada minería de datos. El kdd (Knowledge Discovery in Databases) es el proceso completo de extracción de información que se encarga, además de la preparación de los datos, de la interpretación de los resultados obtenidos. El kdd se ha definido como el proceso no trivial de identificación en los datos de patrones válidos, nuevos, potencialmente útiles, y finalmente comprensibles (fayy96). Tareas comunes en el kdd son la obtención de reglas de asociación y el agrupamiento, o clustering. La minería de datos es un término genérico que abarca resultados de investigación, técnicas y herramientas usadas para extraer información útil de grandes bases de datos. Metodología - aspectos generales Inteligencia de negocios Con la aplicación de la inteligencia de negocios, se presenta una importante oportunidad para las técnicas de minería de datos que ayudan a las empresas a recopilar y analizar información acerca de su desempeño, clientes, competencia de mercado y entorno empresarial. El conocimiento de herramientas de representación y visualización de datos constituye una forma de las técnicas de inteligencia de negocios que presentan información a los usuarios y apoyan a las empresas en la toma de decisiones (Adomavicius y Bockstedt, 2008). Existe una gran variedad de técnicas para realizar agrupamientos y asociaciones sobre los datos, y es posible que los analistas expertos desconozcan las propiedades de cada una de ellas, y por eso la tarea de aplicación de la técnica apropiada en un caso particular, se convierte en todo un problema. Descubrimiento de conocimiento kdd El descubrimiento de conocimiento (kdd) es una de las actividades intelectuales más importantes de la mente humana y de la sociedad. La intuición y el conocimiento son elementos necesarios para los verdaderos descubrimientos. La Interpretación y la apreciación del significado son necesarias para comprender y utilizar el conocimiento. La minería de datos (dm) y el almacenamiento de datos, han promovido el principal medio de kdd con el objetivo de utilizar los conocimientos descubiertos para la toma de decisiones óptimas, es decir, Inteligencia de Negocios (bi) (Rennolls, 2005). Proceso de descubrimiento de conocimiento La teoría del conocimiento tiene tres objetivos principales: llegar a una definición satisfactoria de los conocimientos, determinar qué tipo de proposiciones pueden ser ciertas, y explicar cómo estas proposiciones pueden ser verdaderas; esto se aplica al proceso de descubrimiento de conocimiento y necesita ser desarrollado con el fin de que se pueda tener confianza en que el kdd suministre conocimiento. Si el kdd contiene conocimiento y ciencia, necesita de un almacén de datos construido para fusionar una amplia gama de recursos de bases de datos con relaciones desconocidas entre las variables que han sido extraídas de diferentes fuentes. Esta es la tarea de la relación descubrimiento de conocimiento kdd y minería de datos dm, para revelar, descubrir y 37

3 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación representar adecuadamente conocimiento de los datos (Othman et al., 2010). El proceso de kdd se inicia con la identificación de los datos. Para ello es necesario imaginar qué datos se necesitan, dónde se pueden encontrar y cómo conseguirlos. Una vez se tienen los datos adecuados, se procede a la minería de datos, proceso en el que se seleccionarán las herramientas y técnicas adecuadas para lograr los objetivos pretendidos; y tras este proceso llega el análisis de resultados, con lo que se obtiene el conocimiento pretendido (figura 1). Interpretation/ Evaluation Data Mining Preprocessing Transformation Knowledge Selection xxx xxx xxx xxx xxx xxx xxx xxx xxx Preprocessed Data Transformed Data Patterns Data Target Date Figura 1. Metodología para el descubrimiento de conocimiento Fuente: Fica, 2011 La etapa de selección de la información consiste en obtener desde los diferentes orígenes los datos relevantes para obtener conocimiento. Los orígenes tienen diferentes formatos, como bases de datos de Excel, archivos planos o sistemas gestores de bases de datos. El propósito de seleccionar los datos es consolidarlos en un repositorio de gran tamaño, una bodega de datos, o DataWareHouse. La información que se encuentra allí tuvo un preprocesamiento de datos por medio de una etapa de transformación que busca la consistencia de los datos. Dicha consistencia garantiza la simetría de la información que se pasa de un origen a un destino. Cuando los datos se encuentran en la bodega, ya transformados, se procede a realizar la explotación de la información, buscando obtener conocimiento, lo cual se logra por medio de técnicas de minería de datos. La aplicación de minería de datos consiste en utilizar diferentes técnicas algorítmicas entre ellas agrupamiento o clustering y reglas de asociación (algoritmo A priori ), las cuales extraen conocimiento a partir de modelos específicos; sobre dichos modelos se hace la interpretación de los resultados desde figuras o tablas dinámicas (figura 2). 38

4 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero 70% 60% 50% 40% 30% 20% 10% 0% Entendimiento del dominio Preparación de los datos Figura 2. Esfuerzo requerido por cada fase del proceso kdd Fuente: Rosete, Acosta y Rodríguez, 2009 Data Mining Interpretación y consolidación del conocimiento Como se observa en la figura 2, gran parte del esfuerzo del proceso de kdd recae sobre la fase de preparación de los datos, fase crucial para tener éxito, como ya se comentó anteriormente. Minería de datos En el proceso de análisis de datos, la minería de datos busca organizar las relaciones identificadas por patrones entre los campos relacionales de grandes bases de datos. La minería de datos tiene como resultado el descubrimiento de conocimiento y se compone de la inteligencia de negocios, la identificación de los requerimientos de los datos, el modelado y su verificación (Rajagopalan e Isken, 2001). Es así como la minería de datos contribuye en el proceso de descubrimiento de conocimiento en bases de datos y en el proceso global de descubrir conocimiento útil a partir de los datos. El objetivo de unificar el kdd con la minería de datos es la extracción de alto nivel de conocimiento a partir de conjuntos de datos de gran tamaño en los que el aprendizaje sea automático y exista un patrón de reconocimiento (Lobur et al., 2008). Técnicas de la minería de datos Las técnicas de la minería de datos persiguen el descubrimiento automático del conocimiento contenido en la información almacenada de modo ordenado en grandes bases de datos, y tienen como objetivo descubrir patrones, perfiles y tendencias por medio del análisis de los datos, utilizando tecnologías de reconocimiento (Pérez y Santín, 2007). Las técnicas de la minería de datos pueden redituar los beneficios de automatización en las plataformas de hardware y software existentes, y pueden ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y sean desarrollados nuevos productos. Cuando las herramientas de la minería de datos son implementadas en sistemas de procesamiento paralelo de alto rendimiento, pueden analizar bases de datos masivas en minutos. Cuanto mayor sea la dimensión del problema, mejores soluciones ofrecerá la minería de datos. Cuantas más variables entren en el problema, más difícil resultará encontrar hipótesis de partida interesantes, o aún cuando pudiera, el tiempo necesario no justificará la inversión. 39

5 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación Reglas de asociación Las reglas de asociación son una poderosa técnica de minería de datos, y son utilizadas para buscar por medio de conjuntos de datos reglas que revelan la naturaleza de las relaciones o asociaciones entre datos de las entidades. Las asociaciones resultantes pueden ser utilizadas para filtrar la información, para analizarlas y posiblemente para definir un modelo de predicción basado en la observación del comportamiento (Luo, 2008). Este tipo de técnicas se emplea para establecer las posibles relaciones o correlaciones entre distintas acciones o sucesos aparentemente independientes, permitiendo reconocer cómo la ocurrencia de un suceso o acción puede inducir o generar la aparición de otros (Agrawal, 1993). Gracias a sus características, estas técnicas tienen una gran aplicación práctica en muchos campos, como por ejemplo el comercial, ya que son especialmente interesantes a la hora de comprender los hábitos de compra de los clientes y constituyen un pilar básico tanto en la concepción de las ofertas y ventas cruzadas, como del merchandising (Ramaswamy, 1998). Por lo general, esta forma de extracción de conocimiento se fundamenta en técnicas estadísticas como el análisis de correlación. Uno de los algoritmos que permite obtener reglas de asociación es el A priori, cuyo flujo de información se muestra en la figura 3. Act Activity Diagram Base de Datos <column> Conjunto de ítem Sets Iniciar Seleccionar Convertir a números Verificar frecuencia Enviar atributos SÍ Descartar atributo Existen más atributos para evaluar Terminar Figura 3. Flujo de información del algoritmo A priori Fuente: Giraldo, 2009 NO Tiene frecuencia y soporte altos? Descartar atributo NO NO SÍ Juntar valores Tiene frecuencia y soporte altos? SÍ Generar tripleta Existen más atributos para evaluar Se repite el ciclo hasta el final de las transacciones SÍ Recibir datos 40

6 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Resultados Aplicación de la técnica en un caso específico El problema se orienta a la carencia de innovación y desarrollo tecnológico que presenta nuestro país, lo cual se refleja en algunas empresas, concretamente en los productos que se colocan en el mercado. Contextualización del problema de investigación Colombia tiene graves problemas de competitividad que, sin duda alguna, atentan contra su integración exitosa en los mercados mundiales. Estos problemas se han puesto de manifiesto con mayor fuerza a partir del cambio del modelo de desarrollo económico colombiano que, desde comienzos de los años noventa, dejo atrás la sustitución de importaciones y las políticas proteccionistas por un esquema de apertura comercial financiera. Estos movimientos aperturistas de los noventa seguirán profundizando hacia el futuro, probablemente en el marco de tratados de libre comercio, bilateral y multilateral. En tales escenarios, la competitividad se convierte en elemento fundamental para que un país logre insertarse de manera efectiva y beneficiosa en la economía mundial (Robledo, 2007). Para solucionar esta problemática se propone un modelo que muestra las propiedades fundamentales de las técnicas de asociación y regresión logística y funcionalidad al minero de datos, cuando de descubrir patrones frecuentes e interesantes o relación de variables se trate. El modelo se obtuvo a partir de la caracterización de las dos técnicas en mención: A priori y regresión logística, estableciendo sus atributos o características fundamentales y el flujo de información a partir de los métodos de cada caso. La aplicación y validación del modelo conceptual propuesto se hizo utilizando algunas variables y datos obtenidos de la Encuesta Anual Manufacturera, el cual versa que la innovación y el desarrollo tecnológico son pilares reconocidos de competitividad y factores clave para transformar el conocimiento en riqueza económica, bienestar social y desarrollo humano. Para ello, se utilizaron las herramientas sql Server 2005 como repositorio de información, y sql Server Business Intelligence Development Studio, para crear los orígenes y vistas de datos. Asimismo se utilizó la tecnología Microsoft para generar reglas de asociación, y una red de dependencias con el algoritmo de asociación. Este algoritmo es una implementación de la técnica A priori. Igualmente se aplicó el algoritmo de regresión logística el cual generó gráficos de elevación y visor de redes probabilísticas. En este artículo solo se muestran los resultados obtenidos con la técnica de reglas de asociación. Objetivos de la investigación General Realizar un modelo conceptual sobre algunas de las técnicas de asociación de la minería de datos que le sirva a los analistas de información expertos (mineros de datos) en el momento de necesitar aplicarlas, indicando sus características y funcionalidad para el estudio de objetos de interés sobre un dominio específico. Específicos Identificar y seleccionar algunas técnicas de la minería de datos ofrecidas por la inteligencia artificial para el descubrimiento de reglas de asociación entre los datos de un dominio específico. 41

7 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación Caracterizar las técnicas seleccionadas, con el fin de conocer sus propiedades, funcionalidad y estructura. Presentar los resultados estructurales de cada técnica en términos de recomendaciones o comentarios, fortalezas y limitaciones, funcionalidad, desde una propuesta conceptual Unified Modeling Language (uml). Aplicar el modelo obtenido en un caso de investigación específico, proyecto de investigación que apoya el descubrimiento de conocimiento sobre la innovación en Colombia a partir de las Encuestas de Innovación y Desarrollo Tecnológico, la Encuesta Anual Manufacturera, y la base de datos Scienti. Origen de los datos La Facultad de Minas de la Universidad Nacional de Colombia, sede Medellín, aplicó una encuesta a algunas empresas, con el fin de conocer el nivel de desarrollo e innovación tecnológica que estas aportan con la colocación de sus productos en el mercado. En la base de datos se contó con algunas preguntas de la encuesta y su respectiva codificación, las cuales se convierten en las variables utilizadas en la aplicación de la técnica de asociación de la minería de datos. Descripción de las variables Las variables utilizadas contienen los resultados de la innovación y el impacto de la innovación (tabla 1). Tabla 1. Descripción de variables Variable Descripción Valores Variable I 107 Variable IV402_02 Variable IV402_03 ncuest Fuente: Giraldo, 2009 Identifica la naturaleza jurídica de la empresa. Variable independiente. Indica los productos nuevos como resultado de actividades de innovación. Variable independiente. Indica productos nuevos asociados con nuevos procesos productivos. Corresponde al identificador de cada uno de los 198 registros que se tomaron como muestra de la población total. 1 = empresa unipersonal, 2 = sociedad en comandita simple, 3 = entidad sin ánimo de lucro, 4 = sociedad anónima, 5 = sociedad de hecho, 6 = sociedad comandita por acciones, 7 = sucursal extranjera, 8 = economía solidaria, 9 = sociedad colectiva, 10 = sociedad limitada, 11 = empresa industrial del Estado, 12 = empresa de economía mixta. Sí = 1 No = 2 Sí = 1 No =

8 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Muestra poblacional De 885 registros correspondientes a la población total de empresas encuestadas, se tomó una muestra de 198 registros para aplicar la técnica de asociación. En la tabla 2 se visualizan algunos de estos registros. Tabla 2. Muestra poblacional ncuest I107 IVA_2_3 IV4_3_3 IVA Fuente: Giraldo, 2009 Reglas obtenidas Teniendo en cuenta los antecedentes de nuestro país respecto a innovación tecnológica, y los datos utilizados desde las bases de datos construidas a partir de la Encuesta sobre Desarrollo Tecnológico en el establecimiento industrial colombiano, los resultados son similares a los obtenidos a partir del Modelo de Reglas de Asociación. Las reglas de asociación obtenidas se generaron a partir de una frecuencia o probabilidad de 0,5, y un soporte de 0,6. Lo que se espera es obtener las reglas de asociación más interesantes que muestren la tendencia de haber colocado nuevos productos en el mercado desde 1993 hasta la fecha. La idea es que las reglas generadas superen la frecuencia inicial o mínima frecuencia, teniendo en este caso un tope de frecuencia de 1, es decir el valor máximo establecido en el parámetro de frecuencia para el algoritmo, lo que indica que se generarán reglas entre 0,5 y 1. En la tabla 3 se muestran las reglas de asociación generadas, con las variables de Probabilidad, Importancia y Regla, cuyo análisis es el siguiente: Probabilidad: indica la frecuencia que acompaña la regla obtenida. Es de resaltar que en el caso de las dos reglas del ejemplo la mayor probabilidad es 1, mientras en las demás reglas (ver tabla 3), se ve que la frecuencia se reduce paralelamente a la importancia de la regla obtenida. Importancia: indica la relevancia del interés que tiene la regla respecto a las otras. El procesamiento de los datos a partir del algoritmo de Asociación ha generado las reglas de asociación que muestran los siguientes resultados: la tabla 3 tiene una columna que identifica el tipo de empresa, luego aparece la variable dependiente, es decir nuevos productos colocados en el mercado desde 1993, luego el valor de la variable, después la relación entre variables, y por último aparece el indicador de importancia de esa relación (ver tabla 3). El mayor porcentaje o frecuencia es hacia el valor de 1, es decir que sí se han colocado nuevos productos en el mercado desde Solo la variable Tipo de empresa, con valor unipersonal, muestra valor de 0, lo cual indica que las empresas clasificadas como unipersonales no han colocado nuevos productos en el mercado desde

9 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación Las reglas de asociación muestran que las empresas de tipo anónima y la obtención de nuevos productos a partir de nuevos procesos, han permitido la colocación de nuevos productos en el mercado. La variable Nuevo producto actividades innovación, que en este caso es no, significa que no se han realizado actividades innovadoras en la creación de productos; sin embargo la tendencia, aunque con menor importancia, muestra que sí se han colocado nuevos productos en el mercado desde Las empresas clasificadas como limitadas muestran que han colocado nuevos productos en el mercado desde 1993, con el soporte de actividades y procesos innovadores para producir nuevos elementos. Las empresas unipersonales que han realizado procesos innovadores para obtener productos, tienen mayor importancia que las empresas de tipo unipersonal que no han realizado actividades innovadoras, como premisas, para colocar nuevos productos en el mercado desde Con una mejor probabilidad y mayor importancia aparecen las empresas de tipo empresa industrial, comandita por acciones, sucursal extranjera, sociedad colectiva, sin ánimo de lucro y comandita, cuya premisa es haber hecho nuevos productos a partir de actividades innovadoras, como soporte para la conclusión de colocar nuevos productos en el mercado desde Con menos importancia, algunas empresas de tipo comandita por acciones, comandita, sin ánimo de lucro y empresa industrial, han colocado nuevos productos en el mercado desde 1993, utilizando procesos innovadores. Tabla 3. Algunas reglas de asociación generadas Probabilidad Importancia Regla 1,00 0,50 NUEVOPRODUCTOPROCESOINNOVACION=SI 1,00 0,43 NUEVOPRODUCTOPROCESOINNOVACION=NO 1,00 0,34 NUEVOPRODUCTOPROCESOINNOVACION=NO, TIPOEMPRESA=ANONIMA 1,00 0,33 1,00 0,33 1,00 0,32 1,00 0,31 1,00 0,30 NUEVOPRODUCTOACTIVIDADESINNOVACION=NO, TIPOEMPRESA=ANONIMA NUEVOPRODUCTOPROCESOINNOVACION=SI, NUEVOPRODUCTOACTIVIDADESINNOVACION=NO NUEVOPRODUCTOACTIVIDADESINNOVACION=SI, TIPOEMPRESA=ANONIMA NUEVOPRODUCTOPROCESOINNOVACION=SI, NUEVOPRODUCTOACTIVIDADESINNOVACION=SI NUEVOPRODUCTOPROCESOINNOVACION=SI, TIPOEMPRESA=LIMITADA Fuente: Giraldo,

10 Juan Camilo Giraldo Mejía - Paola Andrea Noreña Cardona - Diana María Montoya Quintero Red de dependencias Permite ver las relaciones entre las variables de entrada y la variable que se evalúa, en este caso la variable de predicción. Se muestra claramente que la tendencia de no haber colocado nuevos productos en el mercado desde 1993 es de las empresas unipersonales, lo cual se confirma con el valor de 0, es decir la respuesta que corresponde a no. EMPRESAUNIPERSONAL En el caso contrario, el modelo indica que las empresas que han colocado nuevos productos en el mercado, apoyadas en nuevos procesos e innovaciones, son las de tipo unipersonal, comandita, comandita por acciones, limitada, colectiva, empresa industrial y sucursal extranjera (ver figura 4). NUEVOSPRODUCTOSENELMERCADO1993= 0 NUEVOSPRODUCTOSACTIVIDADESINNOVACION=SI TIPOEMPRESA=COMANDITA TIPOEMPRESA=SINANIMOLUCRO TIPOEMPRESA=SUCURSALEXTRAJERA TIPOEMPRESA=COMANDITAPORACCIONES TIPOEMPRESA=UNIPERSONAL NUEVOSPRODUCTOSENELMERCADO1993=1 TIPOEMPRESA=INDUSTRIAL TIPOEMPRESA=ANONIMA NUEVOPRODUCTOPROCESOINNOVACION=NO NUEVOPRODUCTOPROCESOINNOVACION=NO TIPOEMPRESA=SOCIEDADCOLECTIVA Figura 4. Red de dependencias Fuente: Giraldo, 2009 Conclusiones La técnica de Asociación se caracterizó por ser la que se presenta como una de las más aplicadas en la búsqueda de reglas de asociación, además de que se encuentra implementada en diferentes herramientas de software libre y licenciado. La aplicación de esta técnica en el proyecto de investigación Descubrimiento de conocimiento sobre la innovación en Colombia a partir de las encuestas de innovación y desarrollo tecnológico, ha permitido generar resultados, y en ellos datos interesantes que indican el estado en que se encuentra nuestro país en materia de innovación, investigación y desarrollo de nuevas tecnologías. 45

11 Aplicación de la técnica de asociación de la minería de datos en un caso de investigación En este modelo se visualizan los objetos y se resaltan los que generan los grafos o redes de dependencias, las reglas de asociación, que muestran los patrones o elementos interesantes entre variables, e indican las probabilidades relacionadas con el objeto en estudio. Se resalta que la búsqueda en bases de datos es compleja, en el sentido de que no es posible partir de una hipótesis, sin embargo, restringiéndose a un subconjunto de datos por medio de la utilización de la técnica de minería de datos denominada Reglas de Asociación, se puede obtener información de presunta relación entre ellos. Referencias Adomavicius, G. y Bockstedt, J. (2008), c-trend: Temporal Cluster Graphs for Identifying and Visualizing Trends in Multiattribute Transactional Data, en Knowledge and Data Engineering, IEEE Transactions on, vol. 20, núm. 6, pp Agrawal, R., Imielinski, T. y Swami, A. (1993), Minería de reglas de asociación entre los conjuntos de productos en grandes bases de datos, en Actas de 1993 acm Internacional sigmod, Conferencia sigmod, Washington, D.C, pp [en línea], disponible en: cfm?doid= , recuperado: 12 de septiembre del Fica, E. (2011), Data Mining, concepto bit de la semana, Chile, Facultad de Ingeniería e Información, Universidad de Chile. Giraldo, J. (2009), Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico (tesis de maestría), Medellín, Universidad Nacional de Colombia, Facultad de Minas. Lobur, M.; Stekh, Yu.; Kernytskyy, A. y Sardieh, F.M.E. (2008), Some trends in Knowledge Discovery and Data Mining, Perspective Technologies and Methods in mems Design (conferencia, mayo 21), memstech 2008, International Conferencee, iiee. Luo, Q. (2008), Advancing Knowledge Discovery and Data Mining, en Knowledge Discovery and Data Mining, wkdd 2008, First International Workshop on, pp Lutfi, M.; Aris, I.; Abdullah, S.M.; Ali, M.L. y Othman, M.R. (2010), Knowledge Discovery in Distance Relay Event Report: A Comparative Data-Mining Strategy of Rough Set Theory With Decision Tree, en Power Delivery, ieee Transactions on, vol. 25, núm. 4, pp Pérez, C. y Santín, D. (2007), Minería de datos, técnicas y herramientas, España, Thomson Paraninfo S.A. Rajagopalan, B. y Isken, M.W. (2001), Exploiting data preparation to enhance mining and knowledge discovery, Systems, Man, and Cybernetics, Part C: Applications and Reviews, en ieee Transactions on, vol. 31, núm. 4, pp Ramaswamy, S.; Mahajan, S. y Silberschatz, A. (1998), On the discovery of interesting patterns in association rules, en Proc Int. Conf Very Large Databases (vldb 98), pp Rennolls, K. (2005), An intelligent framework (o-ss-e) for data mining, knowledge discovery and business intelligence, Database and Expert Systems Applications, Proceedings, en Sixteenth International Workshop on, pp , Robledo, J. (2007), Descubrimiento de conocimiento sobre la innovación en Colombia a partir de las Encuestas de Innovación y Desarrollo Tecnológico, la Encuesta Anual Manufacturera y la base de datos ScienTI, Bogotá, Universidad Nacional de Colombia. Rosete-Suárez, A.; Acosta, R. y Rodríguez, A. (2009), Predicción de pacientes diabéticos, preprocesado de minería de datos, en Revista Electrónica Cubana de Informática Médica [en línea], disponible en: articulos_htm/prediccionpaciente.htm, recuperado: 20 de agosto del

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

1.1 Titulo Descriptivo del Proyecto

1.1 Titulo Descriptivo del Proyecto 1.1 Titulo Descriptivo del Proyecto Diseño de un Manual empleando Data Mining (Minería de Datos) para predecir el Potencial de Desarrollo de las empresas en la Zona Oriental asociadas a la Comisión Nacional

Más detalles

JUAN CAMILO GIRALDO MEJÍA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE MINAS ESCUELA DE INGENIERÍAS SEDE MEDELLÍN 2009

JUAN CAMILO GIRALDO MEJÍA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE MINAS ESCUELA DE INGENIERÍAS SEDE MEDELLÍN 2009 CARACTERIZACIÓN DE ALGUNAS TÉCNICAS ALGORITMICAS DE LA INTELIGENCIA ARTIFICIAL PARA EL DESCUBRIMIENTO DE ASOCIACIONES ENTRE VARIABLES Y SU APLICACIÓN EN UN CASO DE INVESTIGACIÓN ESPECÍFICO JUAN CAMILO

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS

UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS UNIVERSIDAD DE SANTIAGO DE CHILE INGENIERIA COMERCIAL APLICACIÓN COMPUTACIONAL I INTELIGENCIA DE NEGOCIOS Integrante: Profesor: Maximiliano Heise Luis Ríos Fecha de entrega: miércoles 18 de abril de 2012

Más detalles

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos

Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productividad en Empresas de Construcción: Conocimiento adquirido de las bases de datos Productivity in Construction Companies: Knowledge acquired from the databases Hernando Camargo Mila, Rogelio Flórez

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación

WICC 2014 XVI Workshop de Investigadores en Ciencias de la Computación ESTUDIO DE TECNICAS DE DATA MINING APLICADAS AL ANALISIS DE DATOS GENERADOS CON LA METODOLOGIA BLENDED LEARNING Marcelo Omar Sosa, Sosa Bruchmann Eugenia Cecilia Departamento Computación/Facultad de Ciencias

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes Capítulo 4 Arquitectura para análisis de información propuesta 4.1 Arquitectura Zombi es una arquitectura que proporciona de manera integrada los componentes necesarios para el análisis de información

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Aplicar Tecnologías Emergentes de Base de Datos para construir soluciones de Inteligencia de Negocios de soporte a la Toma de Decisiones

Aplicar Tecnologías Emergentes de Base de Datos para construir soluciones de Inteligencia de Negocios de soporte a la Toma de Decisiones Nombre de la asignatura: Inteligencia de Negocios Créditos: 3-2-5 Aportación al perfil Analizar, modelar, desarrollar, implementar y administrar sistemas de información para aumentar la productividad y

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

Curso del Data Mining al Big Data

Curso del Data Mining al Big Data Curso del Data Mining al Big Data Instructor: Dr. Luis Carlos Molina Félix Presentación. Las bases de datos y los sistemas de administración de datos han jugado un papel primordial en el crecimiento y

Más detalles

Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix

Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix Presentación Las bases de datos y los sistemas de administración de datos han jugado un papel primordial en el crecimiento y éxito de

Más detalles

Portafolio de Servicios y Productos

Portafolio de Servicios y Productos Portafolio de Servicios y Productos Introducción Somos una empresa que se dedica a generar ventajas competitivas para nuestros clientes a través de desarrollos y consultoría en inteligencia de negocios

Más detalles

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Programa de Capacitación y Certificación. INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Contenido PERFIL DE UN ESPECIALISTA EN BASES DE DATOS.... 3 6231. MANTENIENDO UNA BASE DE DATOS DE SQL SERVER 2008

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

BOLETIN DE PRENSA Bogotá, D. C. 04 de Diciembre de 2008

BOLETIN DE PRENSA Bogotá, D. C. 04 de Diciembre de 2008 Bogotá, D. C. 04 de Diciembre de 2008 ENCUESTA DE DESARROLLO E INNOVACION TECNOLOGICA SECTOR SERVICIOS 2004-2005 Contenido Resumen Resumen 1. Inversión en actividades de desarrollo e innovación tecnológica

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

BPMN vs UML. Los Requerimientos y el Modelo del Negocio. Autor: Norberto Figuerola

BPMN vs UML. Los Requerimientos y el Modelo del Negocio. Autor: Norberto Figuerola BPMN vs UML Autor: Norberto Figuerola Los Requerimientos y el Modelo del Negocio Normalmente, siempre que iniciamos un esfuerzo de desarrollo de software éste tiene como objetivo automatizar procesos del

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Inteligencia de Negocios Introducción. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Inteligencia de Negocios Introducción Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1.Introducción 2.Definición 3.ETL 4.Bodega de Datos 5.Data Mart

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Proceso de Identificación de Errores de Apropiación de Conceptos Basado en Explotación de Información

Proceso de Identificación de Errores de Apropiación de Conceptos Basado en Explotación de Información Proceso de Identificación de Errores de Apropiación de Conceptos Basado en Explotación de Información Saavedra-Martínez, P., Pollo-Cattaneo, F., Rodríguez, D., Britos, P., García-Martínez, R. Grupo de

Más detalles

Convierta sus datos en conocimiento para generar utilidades.

Convierta sus datos en conocimiento para generar utilidades. Microsoft SQL Server Business Intelligence ofrece una plataforma integral fortaleciendo a las organizaciones para construir y desplegar soluciones de BI seguras, escalables y manejables. Convierta sus

Más detalles

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN

PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN PROPUESTA METODOLOGICA PARA LA EDUCCIÓN DE REQUISITOS EN PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Paola Britos 1,2, Enrique Fernandez 1,2, Ramón García-Martinez 1,2 Centro de Ingeniería del Software e Ingeniería

Más detalles

IWG-101: Introducción a la Ingeniería. Departamento de Informática, UTFSM 1

IWG-101: Introducción a la Ingeniería. Departamento de Informática, UTFSM 1 IWG-101: Introducción a la Ingeniería Departamento de Informática, UTFSM 1 Gestión de Bases de Datos Gestión de Bases de Datos Base de datos una colección de datos relacionados organizados de manera de

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

SQL Server Business Intelligence parte 1

SQL Server Business Intelligence parte 1 SQL Server Business Intelligence parte 1 Business Intelligence es una de las tecnologías de base de datos más llamativas de los últimos años y un campo donde Microsoft ha formado su camino a través de

Más detalles

DESARROLLO DE UNA APLICACIÓN DE BUSINESS INTELLIGENCE (BI) PARA LA EMPRESA EMPAQPLAST

DESARROLLO DE UNA APLICACIÓN DE BUSINESS INTELLIGENCE (BI) PARA LA EMPRESA EMPAQPLAST DESARROLLO DE UNA APLICACIÓN DE BUSINESS INTELLIGENCE (BI) PARA LA EMPRESA EMPAQPLAST Byron Alejandro Boada Vargas-Machuca, Alvaro Arturo Tituaña Burgos, Ing. Lorena Duque, Ing. Patricio Reyes. RESUMEN

Más detalles

GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS

GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA GOP 06 14 a 17 Outubro de 2007 Rio de Janeiro - RJ GRUPO IX GRUPO DE ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS EVALUACIÓN DEL DESEMPEÑO

Más detalles

CA ERwin Data Profiler

CA ERwin Data Profiler RESUMEN DEL PRODUCTO: CA ERWIN DATA PROFILER CA ERwin Data Profiler CA ERWIN DATA PROFILER AYUDA A LAS ORGANIZACIONES A REDUCIR LOS COSTOS Y RIESGOS ASOCIADOS CON LA INTEGRACIÓN DE DATOS, AL BRINDAR CAPACIDADES

Más detalles

CURSOS VIRTUALES 2014

CURSOS VIRTUALES 2014 El Ministerio de las Tecnologías de la Información y las Comunicaciones con el apoyo académico de la Universidad Nacional de Colombia: Convocan al proceso de inscripción para la oferta de cursos cortos,

Más detalles

Ingeniería de Software

Ingeniería de Software Ingeniería de Software MSDN Ingeniería de Software...1 Ingeniería del Software_/_ Ingeniería y Programación...1 Análisis de Requerimientos...2 Especificación...3 Diseño...4 Desarrollo en Equipo...5 Mantenimiento...6

Más detalles

Academia de la carrera de Licenciatura Informática del Instituto Tecnológico Aguascalientes

Academia de la carrera de Licenciatura Informática del Instituto Tecnológico Aguascalientes 1. DATOS DE LA ASIGNATURA Nombre de la Asignatura: Sistemas de Soporte a la Decisión Carrera: Licenciatura en Informática Clave de la asignatura: IFS-0406 Horas teoría - horas práctica - créditos: 4-2-10

Más detalles

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM?

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM? Introducción En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat, sobre la posibilidad de la creación de nuevo conocimiento, he creido conveniente introducir el tema Data Mining

Más detalles

En verde están algunas propuestas que entendemos que faltan y que ayudarían a mejorar las fichas sustancialmente.

En verde están algunas propuestas que entendemos que faltan y que ayudarían a mejorar las fichas sustancialmente. NOTAS ACLARATORIAS: Esta ficha de grado es la resultante de las dos reuniones celebradas (9 enero 2009 y 23 de febrero de 2009) por la subcomisión creada desde el MICIIN para debatir las fichas de Grado

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

2.16. SERVICE SCIENCE Y SERVICE ANALYTICS EN FEN: ESTUDIO DE OPINIONES, QUEJAS Y CUMPLIDOS DE ALUMNOS

2.16. SERVICE SCIENCE Y SERVICE ANALYTICS EN FEN: ESTUDIO DE OPINIONES, QUEJAS Y CUMPLIDOS DE ALUMNOS 2.16. SERVICE SCIENCE Y SERVICE ANALYTICS EN FEN: ESTUDIO DE OPINIONES, QUEJAS Y CUMPLIDOS DE ALUMNOS Autores: 142-2-12.08 242 OBJETIVO Proceedings del XXIX Encuentro Nacional de Facultades de Administración

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES Actualmente se vive una época donde se tiene una enorme cantidad de datos que se generan diariamente (del orden de Terabytes, Petabytes 1 (Han, Kamber, & Pei, 2012))

Más detalles

Unidad 5. Conceptos y Estructuras de Archivos

Unidad 5. Conceptos y Estructuras de Archivos Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar

Más detalles

CONSIDERACIONES GENERALES DEL WEB MINING

CONSIDERACIONES GENERALES DEL WEB MINING CONSIDERACIONES GENERALES DEL WEB MINING Sandra Milena Leal Elizabeth Castiblanco Calderón* RESUMEN: el presente artículo describe los conceptos básicos para la utilización del Webmining, dentro de los

Más detalles

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Resumen de la conferencia Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Ponente: Luis Muñiz Socio Director de Sisconges & Estrategia y experto en Sistemas

Más detalles

Conjunto de informes y gráficos consolidados en un solo objeto que facilita la visualización y análisis de la información. 2

Conjunto de informes y gráficos consolidados en un solo objeto que facilita la visualización y análisis de la información. 2 1. BLOQUE DESCRIPTIVO 1. Título de la Buena Práctica Uso de una base de datos robusta que ayuda en la toma de decisiones (Data Warehouse), como fuente principal del Sistema de apoyo a la gestión (SAG)

Más detalles

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica C1. Capacidad para la resolución de los problemas matemáticos que puedan plantearse en la ingeniería. Aptitud para aplicar

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

JASPER SERVER BI INTRODUCCION

JASPER SERVER BI INTRODUCCION INTRODUCCION El proceso de toma de decisiones en toda organización, independientemente de la envergadura de esta no es tarea fácil, puesto que cualquier cambio mal tomado implica un alto riesgo de no aprovechar

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

Comparación de características entre las ediciones Estándar y Enterprise

Comparación de características entre las ediciones Estándar y Enterprise Comparación de características entre las ediciones Estándar y Enterprise Enterprise Enterprise es una plataforma completa de datos para ejecutar aplicaciones de misión crítica OLTP (Online Transaction

Más detalles

Muchos de los cambios que han tenido. Competencias TIC para el desarrollo profesional docente: una oportunidad para innovar.

Muchos de los cambios que han tenido. Competencias TIC para el desarrollo profesional docente: una oportunidad para innovar. Competencias TIC para el desarrollo profesional docente: una oportunidad para innovar APLICACIÓN PARA EL ÁREA Arleth Saurith Muchos de los cambios que han tenido lugar en los sistemas educativos como resultado

Más detalles

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD KDD y MD Dr. Juan Pedro Febles Rodríguez BIOINFO febles@bioinfo.cu http://www.bioinfo.cu CITMA 2005 Temas a tratar Algunos antecedentes académicos. El proceso de descubrimiento de conocimientos en Datos

Más detalles

Capítulo I. Marco Teórico

Capítulo I. Marco Teórico 1 Capítulo I. Marco Teórico 1. Justificación Hoy en día existe una gran diversidad de aplicaciones que corren sobre la World Wide Web (WWW o Web), y cada una orientada a un fin en particular, el cuál depende

Más detalles

3. Horario laboral referencial: Lunes Viernes 8:00 a.m. a 6:00 p.m.

3. Horario laboral referencial: Lunes Viernes 8:00 a.m. a 6:00 p.m. Arquitecto de Datos 1. Línea de Negocios: Soluciones de Negocios 2. Funciones Específicas: Participar en la realización de las actividades técnicas de actualización y migraciones a versiones mejoradas

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz

Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz Convertimos lo complicado en sencillo, lo fácil en operativo y eliminamos lo ineficaz Quiénes somos SDManalytics es una compañía especializada en el análisis de datos y en el desarrollo de soluciones para

Más detalles

Microsoft Dynamics NAV

Microsoft Dynamics NAV Microsoft Dynamics NAV Maximizar el valor a través de conocimiento de negocio Business Intelligence White Paper Noviembre 2011 La información contenida en este documento representa el punto de vista actual

Más detalles

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

ANALES DEL XVIII CONGRESO ARGENTINO DE CIENCIAS DE LA COMPUTACIÓN CACIC. 8 al 12 de octubre de 2012. Bahía Blanca, Buenos Aires, Argentina

ANALES DEL XVIII CONGRESO ARGENTINO DE CIENCIAS DE LA COMPUTACIÓN CACIC. 8 al 12 de octubre de 2012. Bahía Blanca, Buenos Aires, Argentina ANALES DEL XVIII CONGRESO ARGENTINO DE CIENCIAS DE LA COMPUTACIÓN XVIII CACIC 2012 8 al 12 de octubre de 2012 Bahía Blanca, Buenos Aires, Argentina XIII Workshop Agentes y Sistemas Inteligentes (WASI)

Más detalles

desarrollo. Dentro del desarrollo de la tesis el proceso de modelado del sistema fue hecho con el

desarrollo. Dentro del desarrollo de la tesis el proceso de modelado del sistema fue hecho con el Capitulo II. Análisis de herramientas y tecnologías de desarrollo. Dentro del desarrollo de la tesis el proceso de modelado del sistema fue hecho con el lenguaje de Modelo de Objetos llamado UML (Unified

Más detalles

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU

SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU SISTEMA DE INFORMACION DE GESTION DE TARJETAS DE CREDITO USANDO DATA MART E INTELIGENCIA DE NEGOCIOS PARA EL AREA COMERCIAL DEL BANCO RIPLEY PERU AGENDA INTRODUCCION PLANTEAMIENTO METODOLOGICO ANTECEDENTES

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Gestión de Información en Cuentas Nacionales de Chile

Gestión de Información en Cuentas Nacionales de Chile Gestión de Información en Cuentas Nacionales de Chile Gerencia de Estadísticas Macroeconómicas Departamento Cuentas Nacionales 1 B A N C O C E N T R A L D E C H I L E OCTUBRE 2009 Temario I. Antecedentes

Más detalles

Curso Data Mining y Aplicaciones en Riesgo de Crédito

Curso Data Mining y Aplicaciones en Riesgo de Crédito RW.02 RW.01 Transferencia Internacional de Curso Data Mining y Aplicaciones en Riesgo de Crédito RICHARD WEBER PhD. En Investigación de Operaciones del Instituto de Tecnología de Aachen, Alemania La actividad

Más detalles

RW.02 RW.01. Curso Data Mining y Aplicaciones en Riesgo de Crédito

RW.02 RW.01. Curso Data Mining y Aplicaciones en Riesgo de Crédito RW.02 RW.01 Curso Data Mining y Aplicaciones en Riesgo de Crédito RICHARD WEBER PhD. En Investigación de Operaciones del Instituto de Tecnología de Aachen, Alemania La actividad comercial de las empresas

Más detalles

Automatizador de Procesos

Automatizador de Procesos Automatizador de Procesos Más que un workflow, esta aplicación es un BPM (Business Process Management), una completa plataforma de automatización de procesos, diseñada para apoyar la transformación empresarial;

Más detalles

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR

METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR METODOLOGÍA PARA ORGANIZAR, RECUPERAR Y COMPARTIR RECURSOS DE INFORMACIÓN Y CONOCIMIENTO EN UN CENTRO I+D+I EN LA PLATAFORMA SURICATA Marrero, S.R; Nelson, J.C; Galán, M; Ocón, A.; Rubio, E. sonia@cicei.com;

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Anexo 1: MATRIZ DE CONGRUENCIA. Objetivo. Problema. Problema. Objetivos. Hipótesis General. Teórico. General. Especifico. Específicos.

Anexo 1: MATRIZ DE CONGRUENCIA. Objetivo. Problema. Problema. Objetivos. Hipótesis General. Teórico. General. Especifico. Específicos. 170 Anexo 1: MATRIZ DE CONGRUENCIA Problema Problema Objetivo Objetivos Hipótesis Variables Hipótesis Variables Marco General Especifico General Específicos General Especificas Teórico En qué medida el

Más detalles

Grado en Ingeniería Informática

Grado en Ingeniería Informática Grado en Ingeniería Informática Competencias Generales y trasversales De acuerdo con la resolución del Consejo de Universidades de fecha 3 de marzo de 2009, para obtener este título de grado en ingeniería

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

Datamining Introducción

Datamining Introducción Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ingeniería Industrial y de Sistemas Datamining Introducción Yerko Halat 2 de Octubre del 2001 1 Cuál es la diferencia entre

Más detalles

CAPÍTULO I FORMULACIÓN DEL PROBLEMA

CAPÍTULO I FORMULACIÓN DEL PROBLEMA CAPÍTULO I FORMULACIÓN DEL PROBLEMA 1.1 Tema de Investigación Propuesta de auditoría a los sistemas de información para evaluar la calidad del software. Caso de Estudio: Departamento Médico del Hospital

Más detalles

Karem Jaquelin Peralta Venegas RESUMEN

Karem Jaquelin Peralta Venegas RESUMEN La crisis corporativa: desencuentro entre la ética y la economía neoclásica Generador de preguntas dinámicas en tiempo real para las MYPE, capturando datos del cliente en los formularios de pedido, consulta

Más detalles

Formalización de Dominios de Negocio para Proyectos de Explotación de Información basada en Técnicas de Ingeniería del Conocimiento

Formalización de Dominios de Negocio para Proyectos de Explotación de Información basada en Técnicas de Ingeniería del Conocimiento Formalización de Dominios de Negocio para Proyectos de Explotación de Información basada en Técnicas de Ingeniería del Conocimiento Vegega, C., Pytel, P., Ramón, H., Rodríguez, D., Pollo-Cattaneo, F.,

Más detalles

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas

FACULTAD DE INGENIERÍA. Bases de Datos Avanzadas FACULTAD DE INGENIERÍA Ingeniería en Computación Bases de Datos Avanzadas Datawarehouse Elaborado por: MARÍA DE LOURDES RIVAS ARZALUZ Septiembre 2015 Propósito Actualmente las empresas necesitan contar

Más detalles

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS.

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. PRESENTA MTIE. Erik Guerrero Bravo. Tula de Allende Hidalgo Septiembre

Más detalles

SISTEMA DE INFORMACIÓN PARA LA ALTA DIRECCIÓN: CUADRO DE MANDO INTEGRAL

SISTEMA DE INFORMACIÓN PARA LA ALTA DIRECCIÓN: CUADRO DE MANDO INTEGRAL 1 SISTEMA DE INFORMACIÓN PARA LA ALTA DIRECCIÓN: CUADRO DE MANDO INTEGRAL Oscar García Arias Jefe de Servicio de Informática Junta de Castilla y León. Consejería de Sanidad 1 Blanca SISTEMA DE INFORMACIÓN

Más detalles

UN PASEO POR BUSISNESS INTELLIGENCE

UN PASEO POR BUSISNESS INTELLIGENCE UN PASEO POR BUSISNESS INTELLIGENCE Ponentes: Agreda, Rafael Chinea, Linabel Agenda Sistemas de Información Transaccionales Qué es Business Intelligence? Usos y funcionalidades Business Intelligence Ejemplos

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

POLÍTICA DE TECNOLOGÍA DE INFORMACIÓN

POLÍTICA DE TECNOLOGÍA DE INFORMACIÓN TABLA DE CONTENIDO 1. OBJETIVO... 1 2. ALCANCE... 1 3. CONTENIDO DE LA POLÍTICA... 1 3.1 Premisas generales para el cumplimiento de la política... 2 3.2 Contenido de la política... 3 3.2.1 Responsabilidades

Más detalles

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín. Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.

Más detalles

Ingeniería de Software I

Ingeniería de Software I Ingeniería de Software I Agenda Objetivo. Unidades de aprendizaje. Formas de evaluación. Bibliografía. 2 Datos del profesor Correo electrónico: egonzalez@upemor.edu.mx Asesorías Jueves de 11:00 a 13:00

Más detalles

IMPLEMENTACION DE SISTEMAS DE INFORMACION CONTABLE

IMPLEMENTACION DE SISTEMAS DE INFORMACION CONTABLE IMPLEMENTACION DE SISTEMAS DE INFORMACION CONTABLE OBJETIVO: Obtener los conocimientos necesarios para realizar implementación de sistemas contables CICLO DE VIDA DE UN SISTEMA DE INFORMACION MANTENIMIENTO

Más detalles