GUÍA DOCENTE. CURSO 2011-2012 Minería de datos: modelos integrados de extracción de conocimiento en bases de datos 1.1. Datos de la asignatura Tipo de estudios Titulación Nombre de la asignatura Carácter de la asignatura Curso 1º Idioma de impartición Coordinador/a de la asignatura Semestre Número de créditos ECTS 4 Máster Métodos en Investigación en Ciencias Económicas y Empresariales Minería de datos: modelos integrados de extracción de conocimiento en bases de datos Obligatoria Español Alfonso Carlos Martínez Estudillo, Salud Millán Lara Segundo semestre 1.2. Datos del equipo de profesores. Facultad de Ciencias Económicas y Empresariales. Página web: www.etea.com Departamentos: Economía General, Ciencias Políticas y Sociología y Gestión Empresarial y Métodos Cuantitativos. Apellidos, Nombre Grupo/s al que imparte clase Despacho Correo electrónico Martínez Estudillo, Alfonso Carlos A B C D H (Inglés ) Millán Lara, Salud A B C D H (Inglés ) Nº Edificio I Planta 4ª Nº Edificio I Planta baja acme@etea.com smillan@etea.com 1.3. Requisitos previos Para cursar esta asignatura se requieren conocimientos básicos informáticos.
1.4. Asistencia a clase La asistencia a clase es un elemento esencial dentro del proceso de aprendizaje de la asignatura, junto con la participación activa del alumnado y el trabajo continuo. La configuración de la asignatura necesita la asistencia y la participación en clase para que se puedan alcanzar los objetivos y competencias de la asignatura. para poder optar al sistema de evaluación propuesto, es preciso asistir, al menos, al 80% de las sesiones presenciales previstas. El/la alumno/a que por concurrir causas objetivas no puedan asistir a clase, lo deberá comunicar a los profesores al comienzo del curso, justificando las circunstancias objetivas indicadas. 1.5. Objetivos del curso En esta materia se introducirán los principales métodos de análisis utilizados para realizar Minería de Datos. La Minería de Datos es una disciplina que pretende descubrir el conocimiento que existe en las bases de datos (normalmente grandes). En la actualidad, las organizaciones disponen de gran cantidad de datos acumulados de una forma sistemática en sus sistemas informáticos. Estas bases de datos contienen información que no es fácil de hacer explícita pero que es crucial en procesos decisionales complejos en entornos inciertos. COMPETENCIAS GENERALES Y ESPECÍFICAS QUE LOS Y LAS ESTUDIANTES DEBEN ADQUIRIR DURANTE SUS ESTUDIOS Y QUE SON EXIGIBLES PARA OTORGAR EL TÍTULO Competencia Básica 1 (CB1): Los y las estudiantes del programa MMInv sabrán aplicar los conocimientos adquiridos y tendrán capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio (Ciencias Sociales: Economía y Empresa). Competencia Básica 4 (CB4): Los y las estudiantes del programa MMInv poseerán las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. Competencia universidad 2 (CU2) Conocer y perfeccionar el nivel de usuario en el ámbito de las TICs. Competencia específica 1 (CE1): Conocimientos Introduce las competencias de Doctorado: CBD1, CBD4 Competencia específica 2 (CE2): Conocimientos Introduce las competencias de Doctorado: CBD1, CBD4 Competencia específica 3 (CE3): Conocimientos Competencia específica 4 (CE4): Conocimientos Competencia específica 5 (CE5): Conocimientos Competencia específica 6 (CE6): Conocimientos Competencia específica 7 (CE7): Conocimientos Ser capaz de entender las principales teorías sobre el conocimiento científico en el área de las Ciencias Sociales (Economía y Empresa), así como las implicaciones éticas de la investigación científica. Ser capaz de comprender y aplicar los modelos y métodos avanzados de análisis cualitativo y cuantitativo en el área de Ciencias Sociales (Economía y Empresa). Ser capaz de diseñar modelos avanzados identificando la estructura de los sistemas, sus componentes o entidades y las relaciones entre ellos en situaciones de decisión dinámicas y complejas. Ser capaz de determinar como la incertidumbre afecta a los procesos de toma de decisiones y a los modelos diseñados para su análisis. Ser capaz de elaborar estrategias avanzadas de análisis cualitativo o cuantitativo sobre los modelos previamente diseñados. Ser capaz de desarrollar estrategias de optimización de modelos y sistemas, comprobando y, en su caso, mejorando de su eficiencia. Ser capaz de aplicar los conocimientos adquiridos a la resolución
Competencia específica 8 (CE8): Conocimientos, CBD6 Competencia específica 10 (CE10): Conocimientos Introduce las competencias de Doctorado: CBD1, CBD2, CBD3, CBD4, CBD5 Competencia transversal cognitiva 1 (CTC1): Introduce las competencias de Doctorado: CBD2, CBD4, CBD6 Competencia transversal cognitiva 2 (CTC2):, CBD6 Competencia transversal instrumental 1 (CTI1 y CU2): Introduce las competencias de Doctorado: CBD1, CBD6 Competencia transversal instrumental 2 (CTI2): Introduce las competencias de Doctorado: CBD5 Competencia transversal instrumental 3 (CTI3 y CU1): Introduce las competencias de Doctorado: CBD5 de situaciones de decisión reales en el ámbito de las Ciencias Sociales (Economía y Empresa). Ser capaz de identificar oportunidades de investigación y mejora en sistemas reales en el ámbito de las Ciencias Sociales (Economía y Empresa). Ser capaz de iniciar un proceso de investigación que conduzca a la realización de una Tesis Doctoral. Ser capaz de buscar, analizar, integrar e interpretar datos e información en situaciones de decisión complejas y bajo incertidumbre en el ámbito de las Ciencias Sociales (Economía y Empresa) Buscar y seleccionar las fuentes donde obtener información relevante y fiable. Analizar e interpretar la información. Clasificar y archivar la información. Identificar contradicciones, falacias o falsas analogías. Ser capaz de identificar, resolver problemas (a menudo con optimización de sistemas complejos) y adoptar decisiones en entornos complejos, multicriterio y bajo incertidumbre en el ámbito de las Ciencias Sociales (Economía y Empresa) Identificar un problema Analizar sus causas. Generar alternativas de decisión o de solución del problema y valorar ventajas e inconvenientes de cada una. Saber encontrar el equilibrio entre la racionalidad y la intuición en la toma de decisiones. Saber optimizar sistemas en situaciones con criterios múltiples. Ser capaz de utilizar de forma avanzada las Tecnologías de la Información para su manejo en el ámbito de estudio Manejar a nivel avanzado de los programas informáticos básicos asociados a las diferentes materias. Manejar a nivel avanzado de los sistemas informáticos (infraestructura) necesarios para la resolución de los modelos. Ser capaz de comunicarse de forma efectiva oralmente y por escrito en lengua castellana con el fin de diseñar o exponer proyectos de I+D+i así como sus resultados ante una audiencia que puede ser lega o experta en los temas en cuestión. Expresar un mensaje oral o escrito de forma correcta Saber escuchar y saber hacer preguntas. Expresar la propia opinión y saber defenderla. Adaptar el discurso verbal y no verbal en función de la intención, la audiencia y la situación. Ser capaz de comunicarse oralmente y por escrito en lengua extranjera (Inglés) con el fin de diseñar o exponer proyectos de I+D+i así como sus resultados ante una audiencia que puede ser lega o experta en los temas en cuestión. Expresar la propia opinión y saber defenderla. Realizar la exposición de un tema. Manejar con soltura la comunicación escrita. Gestión de reuniones de trabajo, seminarios y congresos científicos.
Competencia transversal actitudinal 4 (CTA4): Introduce las competencias de Doctorado: CBD5, CBD6 Capacidad de trabajar en equipo y en red. Identificar claramente los objetivos del grupo y orientar la actuación para lograrlos. Priorizar los intereses colectivos a los personales. Evaluar la actuación del grupo de trabajo y hacer críticas constructivas. Compartir y articular tareas entre los trabajadores de diferentes secciones o departamentos de una empresa o institución, o entre personas que trabajan en diferentes organizaciones. Competencia transversal actitudinal 5 (CTA5): Introduce las competencias de Doctorado: CBD5, CBD6 Competencia transversal actitudinal 6 (CTA6): Introduce las competencias de Doctorado: CBD1, CBD2, CBD3, CBD4, CBD5, CBD6 COMPETENCIAS DE INTERÉS INDIRECTO Competencia Básica 2 (CB2): Competencia Básica 3 (CB3): Competencia universidad 1 (CU1) Competencia universidad 3 (CU3) Competencia específica 9 (CE9): Conocimientos, CBD5 Ser capaz de asumir un compromiso ético con el trabajo y comprender el impacto de las decisiones socioeconómicas en aspectos sociales y medioambientales. Asumir un compromiso ético en las relaciones interpersonales y en las derivadas de la actividad académica. Tener presente la realidad social que les rodea, desde el ámbito local, el regional, estatal y europeo, hasta el internacional, y la capacidad para el compromiso con el cambio de la misma. Tener presente la dimensión ética en toda toma de decisiones Disponibilidad y capacidad para el servicio de los más débiles y desfavorecidos. Ser capaz de desarrollar habilidades de aprendizaje, necesarias para emprender estudios y proyectos de investigación posteriores, y de reconocer la necesidad de la formación continuada para su adecuado desarrollo profesional. Descubrir y desarrollar nuevos temas de investigación Mantenerse actualizado en las nuevas aportaciones en su área de conocimiento. Diseñar y desarrollar nuevos procesos y formas de realizar su actividad (innovar) Los y las estudiantes del programa MMInv serán capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. Los y las estudiantes del programa MMInv sabrán comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades. Acreditar el uso y dominio de una lengua extranjera. Potenciar los hábitos de búsqueda activa de empleo, así como la capacidad de emprendimiento. Ser capaz de aplicar los conocimientos adquiridos en la gestión de proyectos de I+D-i así como en la difusión efectiva de sus resultados en medios científicos. Competencia transversal cognitiva 3 (CTC3): Introduce las competencias de Doctorado: CBD1, CBD2, CBD3, CBD4, CBD5, CBD6 Ser capaz de diseñar proyectos, planificar, organizar y controlar procesos en proyectos de I+D+i en el ámbito de las Ciencias Sociales (Economía y Empresa) Fijar los objetivos y priorizarlos en función de determinados criterios. Determinar funciones y establecer responsabilidades. Gestionar recursos.
Competencia transversal cognitiva 4 (CTC4): Introduce las competencias de Doctorado: CBD3, CBD4, CBD5 Competencia transversal actitudinal 3 (CTA3): Introduce las competencias de Doctorado: CBD5, CBD6 Seleccionar los modelos y las metodologías más apropiados. Evaluar procesos y sus resultados. Ser capaz de gestionar la difusión del conocimiento científico generado en proyectos de I+D+i en el ámbito de las Ciencias Sociales (Economía y Empresa) Seleccionar los temas críticos de interés a publicar. Clarificar objetivos. Selección del medio de difusión más adecuado. Dominar los procesos de envío del material. Gestionar el proceso post-envío. Ser capaz de establecer y mantener unas relaciones interpersonales constructivas. Saber escuchar, dialogar, aceptar las opiniones diferentes, a partir de las propias convicciones firmemente sostenidas. Saber ponerse en el lugar del otro: empatía. Saber tratar a los otros con amabilidad, cordialidad y simpatía. Saberse entender y saber trabajar con personas de etnia, religión, cultura o formación diferente. Saber actuar como mediador/a acercando posiciones divergentes. Tener capacidad crítica y de autocrítica. 1.6. Contenidos del programa Tema 1: Bases de datos y almacenes de datos Los sistemas de información: tipos y metodologías de desarrollo Modelos de bases de datos: el modelo relacional Normalización de bases de datos Diferencias entre bases de datos y almacenes de datos Modelos multidimensionales de datos Tema 2: Extracción de información de Bases de datos Introducción a SQL. Consultas SELECT Consultas de Acción Tema 3: Preparación de los datos para realizar Minería de Datos Eliminación del ruido Integración y transformación de los datos. Reducción de los datos Tema 4: Análisis de Datos Introducción a OLAP. Tipos Definición de Cubos. Componentes Implementación de Cubos. Procesamiento. Tema 5: Minería de Datos Conceptos y Técnicas. Descripción de Metodologías utilizadas en Minería de datos. Aplicaciones a las Ciencias Sociales.
1.7. Referencias de consulta HAN, J. KAMBER, M. (2001) Data Mining: concepts and techniques. Morgan Kaufmann Publishers. W. H. INMON (1996), Building the Data WhareHouse. New York: Jonh Wiley & Sons, M. JAMES (1985), Clasification Algorithm. New York: Jonh Wiley & Sons, H. AHN, H. MOON, M.J. FAZZARI, N. LIM, J.J. CHEN, R.L. KODELL (2007) Classification by ensembles from random partitions of high-dimensional data. Computational Statistics and Data Analysis 51:12 6166-6179 A.C. MARTÍNEZ-ESTUDILLO, C. HERVÁS-MARTÍNEZ, F.J. MARTÍNEZ- ESTUDILLO, N. GARCÍA (2006), Hybridation of evolutionary algorithms and local search by means of a clustering method. IEEE Transaction on Systems, Man and Cybernetics, Part. B: Cybernetics 36:3, 534-546 Tutorial OLAP Microsoft. http://msdn.microsoft.com/es-es/library/ms170208.aspx. MIKE GUNDERLOY, JOSEPH L. JORDEN, DAVID W. TSCHANZ. La Biblia de SQL Server 2005. Anaya Multimedia. 2005. C. ROMERO, S. VENTURA Data Mining in e-learning. Advances in Management Information, Vol. 4. WIT Press. Wessex (UK), 2006 2. Métodos Docentes Los instrumentos didácticos-docentes que utilizaremos en el desarrollo de la asignatura serán fundamentalmente los siguientes: La lección magistral será utilizada para la exposición de los conceptos de cada tema. Los contenidos teóricos se reflejarán sobre plataformas de gestión de bases de datos en una dinámica continua de aplicación. Desarrollo de casos para la aplicación de la teoría relacional de bases de datos y las reglas de normalización. Lecturas comentadas de artículos de investigación. Tutorías individuales en el despacho del profesor para aquellos alumnos que lo requieran. Las horas de consulta semanales establecidas por el profesor servirán de complemento al trabajo realizado en las clases y permitirá una atención más personalizada a aquellos alumnos que lo necesiten.
3. Tiempo estimado de trabajo del estudiante Nº horas % Actividades presenciales 30 30% Clases teóricas: 12 Clases prácticas: 13 Seminarios: 3 Tutorías programadas en todo el cuatrimestre: 2 Actividades no presenciales (trabajo autónomo del estudiante) Preparación de actividades prácticas (ejercicios, trabajos individuales y/o en grupo, etc.) Lectura de artículos y material bibliográfico 10 Realización del trabajo de investigación 30 70 70% Carga total de horas de trabajo 100 100% 30 4. Métodos de evaluación y porcentaje en la calificación final La evaluación del aprendizaje debe comprender tanto el proceso realizado como el resultado obtenido. El examen tradicional sólo permite evaluar el resultado obtenido, dejando al margen el proceso de aprendizaje. Por este motivo, en el sistema de evaluación se valorarán las actividades programadas durante el curso. Los alumnos tendrán que realizar un trabajo de investigación relacionado con el contenido de la asignatura. Los resultados de la investigación serán presentados en el formato de un artículo para congreso científico y habrá de ser presentado y defendido al finalizar el curso. En la calificación final del trabajo se tendrá en cuenta el proceso de elaboración del mismo, su contenido y la exposición realizada. La siguiente tabla muestra los porcentajes que cada método de evaluación supone en la calificación final del alumnado. Métodos de evaluación Trabajo Final 75% Evaluación Continua (comentarios de las lecturas recomendadas, asistencia y participación activa en clase, seguimiento del trabajo final 25% Trabajo Final (en el caso de no poder asistir a clase de forma justificada) 100%