Dirección General de Educación Superior Tecnológica 1. Datos Generales de la asignatura Nombre de la asignatura: Clave de la asignatura: Créditos (Ht-Hp_ créditos): Carrera: Tópicos avanzados de bases de datos GDT-1304 0-4-4 Ingeniería en Sistemas Computacionales, Ingeniería Informática 2. Presentación Caracterización de la asignatura Esta asignatura aporta al perfil del Ingeniero las competencias para diseñar y desarrollar bases de datos utilizando tecnologías emergentes, con el fin de integrar soluciones computacionales para el descubrimiento del conocimiento que posee la empresa en los datos de sistemas existentes, de tal forma que sirva como soporte para la toma de decisiones, considerando los aspectos legales, éticos, sociales y de desarrollo sustentable. Esta asignatura sirve para el descubrimiento de conocimiento en bases de datos que posee una empresa a través de herramientas de minería de datos y bodegas de datos con el fin de explotarlo y que sirva como soporte para la toma de decisiones, proporciona al estudiante de ingeniería un conjunto de mecanismos para el análisis dirigido por lo datos, los cuales permiten moverse a través de los almacenes de datos para encontrar las tendencias, patrones y correlaciones que pueden guiar la toma de decisiones estratégicas. La intensión de esta asignatura es que el egresado construya soluciones que apoyen la toma de decisiones en una empresa. Se pretende que conozca y aplique las tecnologías emergentes de bases de datos, así como, las metodologías y tecnologías existentes para el desarrollo de las soluciones. El reto es formar egresados con la capacidad de proponer a las empresas soluciones que le permitan un análisis estratégico que contribuya a la mejora de su productividad y rentabilidad, para lograr una ventaja estratégica en el mundo altamente competitivo.
Esta asignatura relaciona las bases de otras asignaturas directamente vinculadas con el análisis y desarrollo de software y acceso a bases de datos. Para el buen desarrollo de esta asignatura es necesario contar con las competencias desarrolladas en las asignaturas previas de: fundamentos de bases de datos y tópicos avanzados de programación en temas como diseño, manejo de SQL y aspectos de conectividad entre bases de datos y lenguajes huésped. Intención didáctica Se organiza el temario de la asignatura en cuatro temas donde se sugieren diferentes tecnologías y modelos de bases de datos para el desarrollo de las actividades. Cada tema va conformando un conjunto de conocimientos de tecnologías emergentes y de manejo de la información para el apoyo a la toma de decisión. En el primer tema se estudian los Modelos emergentes de bases de datos, en la cual se cubre el modelo de bases de datos orientados a objetos así como las bases de datos multidimensionales, que sirven como base para la implantación de bodegas de datos y el Procesamiento y análisis en línea (OLAP por sus siglas en inglés). En el segundo tema se aborda el uso de Bodegas de Datos (datawarehouse), se discute y analiza el uso de base de datos multidimensionales vista como una colección de datos sistematizados, integrados, variables en el tiempo para dar soporte al proceso de toma de decisiones. Este proceso aglutina datos de fuentes heterogéneas e involucra esfuerzos de toda la compañía para que el soporte a decisiones actúe en todos los niveles de la empresa. En las Bodegas de datos, los datos antes de ser almacenados son filtrados, normalizados, reorganizados, resumidos para constituir una base de datos confiable. En el tercer tema se estudia el procesamiento analítico en Línea que comprende un conjunto de herramientas que posibilita efectuar la exploración de los datos contenidos en una bodega de datos (datawarehouse). Se enfatiza el uso de análisis multidimensional y se discute el proceso interactivo en que el usuario hace preguntas, recibe informaciones, verifica un dato específico y hace comparaciones. En el cuarto tema se estudia que la minería de datos es una técnica que utiliza herramientas de software, generalmente orientadas para los usuarios que no saben exactamente lo que están investigando, mas procura identificar determinados patrones o tendencias. Es un proceso que separa grandes cantidades de datos mediante un proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles y, en última instancia, comprensibles a partir de los datos, teniendo como objetivo encontrar conocimiento útil relevante y nuevo sobre un fenómeno o actividad, presentando los resultados de manera visual. La intensión de esta asignatura es que el egresado construya soluciones que apoyen la toma de decisiones en una empresa. Se pretende que conozca y aplique las tecnologías
emergentes de bases de datos, así como, las metodologías y tecnologías existentes para el desarrollo de las soluciones. El reto es formar egresados con la capacidad de proponer a las empresas soluciones que le permitan un análisis estratégico que contribuya a la mejora de su productividad y rentabilidad, para lograr una ventaja estratégica en el mundo altamente competitivo. 3. Participantes en el diseño y seguimiento curricular del programa Lugar y fecha de elaboración o revisión Instituto Tecnológico de Celaya, Enero del 2013 Participantes Academia de Sistemas Observaciones Definición y elaboración de los contenidos temáticos correspondientes a las asignaturas del módulo de la especialidad. 4. Competencias a desarrollar Competencia general de la asignatura Conoce y utiliza las tecnologías emergentes de manejo de bases de datos para la generación de soluciones para el apoyo a la toma de decisiones. Competencias específicas El estudiante investiga y conoce las tecnologías emergentes de bases de datos e identifica su aplicación. Diseña e implementa un pequeño datawarehouse definiendo los metadatos necesarios a utilizar para integrarse a soluciones de inteligencia empresarial haciendo una descripción de los usos y aplicaciones que tiene cada una de ellas. Diseña aplicaciones a partir de bases de datos operacionales que permitan implementar procesos de análisis en línea. Investiga y conoce las tecnologías de base de datos para el soporte en la toma de decisiones mediante la minería de datos.
Competencias genéricas Capacidad de abstracción, análisis y síntesis. Capacidad de aplicar los conocimientos en la práctica. Conocimientos sobre el área de estudio y la profesión. Capacidad de comunicación oral y escrita. Habilidades en el uso de las tecnologías de la información y de la comunicación. Capacidad de investigación. Capacidad de aprender y actualizarse permanentemente. Habilidades para buscar, procesar y analizar información procedente de fuentes diversas. Capacidad crítica y autocrítica. Capacidad para actuar en nuevas situaciones. Capacidad creativa. Capacidad para identificar, plantear y resolver problemas. Capacidad para tomar decisiones. Capacidad de trabajo en equipo. Capacidad de motivar y conducir hacia metas comunes. Capacidad para formular y gestionar proyectos. 5. Competencias previas de otras asignaturas Competencias previas Comprende los conceptos básicos de las bases de datos. Construye modelos de bases de datos. Aplica operaciones básicas SQL. Implementa restricciones de integridad. Diseña esquemas de bases de datos relacionales bajo estándares. Crea esquemas de bases de datos en un SGBD. Administra bases de datos a través de un SGBD. Conoce distintas plataformas y SGBD.
6. Temario No. 1. Temas Nombre Modelos emergentes de bases de datos. Subtemas 1.1 Bases de datos orientadas a objetos. (Definición y conceptos de las BDOO, El modelo de datos orientado a objetos, El estándar ODMG, Encapsulamiento, herencia y polimorfismo en BDOO, Persistencia, concurrencia y recuperación en BDOO). 1.2 Bases de datos multidimensionales (BDM), (Definición y conceptos de las BDM., Modelos conceptuales multidimensionales, Cubos e hipercubos de datos, Estructuras nojerárquicas y jerárquicas de los datos, Operadores para datos agregados multidimensionales, Consultas multidimensionales de datos). 2. Bodegas de datos. 3. Procesamiento y análisis en línea. 2.1 Bodegas de datos (datawarehouse). (Definición y objetivo, Funcionamiento, Consideraciones de diseño, Herramientas para extraer, transformar y cargar fuentes de datos. 3.1. Procesamiento y análisis en línea (OLAP), (Definiciones y conceptos, Requerimientos funcionales de los sistemas OLAP, Operadores para manejo de cubos de datos del estándar SQL3, Diseño de consultas a bases de datos multidimensionales, Utilización de herramientas para OLAP). 3.2. Mercados de datos (Data Mart), (Definiciones y conceptos, Fases de construcción, Análisis, Construcción, Post-producción, Tecnologías, Herramientas frontend, Herramientas de bases de datos, Proceso de diseño de consultas del mercado de datos,
4. Minería de datos 4.1. Minería de datos (Data mining), (Definiciones y conceptos, Aplicaciones de la minería de datos, Diseño de mineros de datos, Obtención de información a través de patrones de búsqueda, Técnicas y herramientas de la minería de datos, Tendencias en minería de datos. 7. Actividades de aprendizaje Competencia específica y genéricas (a desarrollar y fortalecer por tema) El estudiante investiga y conoce las tecnologías emergentes de bases de datos e identifica su aplicación. Capacidad de abstracción, análisis y síntesis. Conocimientos sobre el área de estudio y la profesión. Capacidad de comunicación oral y escrita. Capacidad de investigación. Capacidad de aprender y actualizarse permanentemente. Habilidades para buscar, procesar y analizar información procedente de fuentes diversas. Tema 1. Modelos emergentes de bases de datos. (Fuentes: 4,2,1,13) Actividades de aprendizaje El estudiante investiga y conoce las aplicaciones de las tecnologías emergentes de bases de datos, lo presenta mediante un resumen. Competencia específica y genéricas (a desarrollar y fortalecer por tema) Diseña e implementa un datawarehouse definiendo los metadatos necesarios a utilizar para integrarse a soluciones de inteligencia empresarial haciendo una descripción de los usos y aplicaciones que tiene cada una de ellas.
Capacidad de aplicar los conocimientos en la práctica. Capacidad para identificar, plantear y resolver problemas. Capacidad para tomar decisiones. Capacidad de trabajo en equipo. Capacidad de motivar y conducir hacia metas comunes. Capacidad para formular y gestionar proyectos. Tema Actividades de aprendizaje 2. Bodegas de datos. (Fuentes: 7, 10, 5, 8) Investigar en distintas fuentes los modelos de base de datos emergentes (orientado a objetos, multidimensional, activas, deductivas, paralelas, semánticas, etc.), elaborar el informe escrito y discutirlo en el grupo. Discutir en clase las fases de extracción de conocimiento en bases de datos: (1) Determinar las fuentes de información que pueden ser útiles y dónde conseguirlas, (2) Diseñar el esquema de un almacén de datos (Data Warehouse) que consiga unificar de manera operativa toda la información recogida, (3) Implantación del almacén de datos que permita la navegación y visualización previa de sus datos, para discernir qué aspectos puede interesar que sean estudiados, (4) Selección, limpieza y transformación de los datos que se van a analizar. La selección incluye tanto una criba o fusión horizontal (filas) como vertical (atributos), Competencia específica y genéricas (a desarrollar y fortalecer por tema) Diseña aplicaciones a partir de bases de datos operacionales que permitan implementar procesos de análisis en línea.
Capacidad de aplicar los conocimientos en la práctica. Capacidad para identificar, plantear y resolver problemas. Capacidad para tomar decisiones. Capacidad de trabajo en equipo. Capacidad de motivar y conducir hacia metas comunes. Capacidad para formular y gestionar proyectos. Tema 3. Procesamiento y análisis en línea. (Fuentes: 12, 2, 4) Actividades de aprendizaje Investigar en distintas fuentes las tecnologías de bases de datos para el soporte en la toma de decisiones, elaborar el informe escrito y discutirlo en el grupo. Investigar la evolución de los sistemas OLAP, elaborar el informe y discutirlo en el grupo. Utilizar herramientas para generación de cubos OLAP y procesamiento en línea. Competencia específica y genéricas (a desarrollar y fortalecer por tema) Investiga y conoce las tecnologías de base de datos para el soporte en la toma decisiones mediante la minería de datos. Capacidad de abstracción, análisis y síntesis. Capacidad de comunicación oral y escrita. Capacidad de investigación. Capacidad crítica y autocrítica. Capacidad para actuar en nuevas situaciones. Capacidad creativa. Capacidad para identificar, plantear y resolver problemas. Capacidad para tomar decisiones. Capacidad de trabajo en equipo. Capacidad de motivar y conducir hacia metas comunes. Capacidad para formular y gestionar proyectos.
4. Minería de datos. Tema (Fuentes: 12, 5, 11, 9,6) Actividades de aprendizaje Utilizar herramientas de minería de datos y aplicarlas en un caso de estudio. 8. Prácticas (para fortalecer las competencias de los temas y de la asignatura) 1. Definir esquemas de bases de datos multidimensionales 2. Elaborar consultas a bases de datos multidimensionales 3. Diseño e implementación de un data warehouse 4. Uso de herramientas para la extracción, transformación y carga de datos de una base de datos relacional a un data warehouse 5. Definir y aplicar esquemas de análisis de datos 6. Definir y aplicar algoritmos de minería de datos a utilizar 7. Desplegar solución 8. Elaborar aplicaciones para acceder a la solución desplegada (reportes, consultas, visualización de datos, alertas, conocimiento, etc.). 9. Prácticas de filtrado usando herramientas de minería de datos. 10. Prácticas de aprendizaje usando herramientas de minería de datos. 11. Prácticas de meta-aprendizaje usando herramientas de minería de datos. 12. Prácticas de agrupamiento usando herramientas de minería de datos. 9. Proyecto integrador (Para fortalecer las competencias de la asignatura con otras asignaturas) Integra todos los conocimientos adquiridos en las unidades anteriores para la creación de un prototipo hibrido inteligente Presentar en equipo el prototipo realizado. El proyecto integrador debe considerar las siguientes fases: Contextualización y/o diagnóstico Fundamentación Planeación
Ejecución Evaluación Socialización Debe integrar las competencias de las asignaturas que los estudiantes estén cursando en el periodo semestral y tomar como base las competencias de asignaturas señaladas como previas. El proyecto integrador debe tener un criterio de evaluación. 10. Evaluación por competencias (específicas y genéricas de la asignatura) Para efecto de un análisis inicial, el docente realiza una evaluación diagnóstica que le permita ajustar su instrumentación didáctica. A efecto de evaluar que el estudiante haya adquirido las competencias del curso, debe contemplar una evaluación formativa y sumativa, las cuales consideran diferentes ámbitos como la heteroevaluación, autoevaluación y coevaluación. Todo ello debe ser comprobable mediante un portafolio de evidencias, de preferencia en formato digital. Instrumentos: Glosario de conceptos. Línea de tiempo. Mapa mental. Mapa conceptual. Cuadro comparativo. Cuadro sinóptico. Foros de discusión. Informe técnico. Informe analítico. Ensayo. Prácticas. Examen escrito. Proyecto integrador. Herramientas: Lista de cotejo. Rúbrica.
Manual de prácticas. Memoria del evento. 11. Fuentes de información (actualizadas considerando los lineamientos de la APA*) 1. Buyens, J., (2003) Web Database Development. Ed. Microsoft Pres, USA. 2. Date, C.J., (2001) Introducción a los sistemas de bases de datos, 7ª. ed. Ed. Addison Wesley. 3. Hernández Orallo, J. & Ramírez Quintana, M. J. & Ferri Ramírez, C. (2004) Introducción a la minería de datos. Ed. Pearson Prentice Hall. 4. Hoffer, Jeffrey A., (2003). Modern Databases Management 6a. ed. Ed. Prentice Hall, USA. 5. Jarke, M. & Lenzzerini, M. & Vassiliou, Y. & Vassiliadis, P. (2003) Fundamentals of data warehouses. Ed. Springer Verlag. 6. Kargupta, H. & Joshi, A. & Sivakumar, K. & Yesha, Y. (2004) Data Mining Next Generation Challenges and Future Directions. Ed. AAAI Press / The MIT Press. 7. Kimball, (2008) The Data Warehouse lifecycle toolkit: Expert methods for design, developing and deploying Data warehouse. Ed. John Wiley & Sons, USA. 8. Lewis, William J. (2001) Data Warehousing and e-commerce. Ed. Prentice Hall. 9. Liu. (2010) Web Data Mining. Ed. Springer. 10. Poe, V. (1997) Building a Data warehouse for decision support, 2a. Ed. Ed. Prentice Hall, USA. 11. Tan, P. & Steinbach, M. & Kumar, V. (2005) Introduction to Data Mining. Ed. Addison Wesley. 12. Thomsen, E., (1997) OLAP Solutions: Building Multidimensional Information Systems 2a. ed. Ed. John Wiley & Sons, USA. 13. Thurainsighan. (2003) XML Databases and the Semantic Web. Ed. CRC press. 14. Witten Ian H., Frank Eibe, Hall Mark A. (2011) Data Mining. Practical Machine Learning Tools and Techniques. Third Ed. Ed. Elsevier/Morgan Kauffman. * American Psychological Association (APA)