Escuela Técnica Superior de Ingeniería Informática Máster en Ingeniería Informática aplicada a la Industria, a la Ingeniería del Software y a los Sistemas y Tecnologías de la Información GUÍA DOCENTE DE LA ASIGNATURA: Ingeniería de Datos Curso Académico 2011-2012 Versión 2.0-15012010
1. Datos Descriptivos de la Asignatura Código: 135211902 - Centro: Escuela Técnica Superior de Ingeniería Informática. - Titulación: Máster en Ingeniería Informática aplicada a la Industria, a la Ingeniería del Software y a los Sistemas y Tecnologías de la Información. - Plan de Estudios: 2008 - Rama de conocimiento: Sistemas y Tecnologías de la Información. - Intensificación (sólo en caso de Máster): Sistemas y Tecnologías de la Información. - Departamento: Estadística, Investigación Operativa y Computación. - Área de conocimiento: Estadística e Investigación Operativa. - Curso: Primero - Carácter: Optativa - Duración: Bimestral - Créditos: 3 - Dirección Web de la asignatura: www.campusvirtual.ull.es - Idioma: español/inglés (0,4 Créditos) 2. Prerrequisitos para cursar la asignatura Esenciales / Recomendables: Esenciales ninguno Es recomendable haber utilizado software de bases de datos y software estadístico o similar. 3. Profesorado que imparte la asignatura Coordinación / Profesor/a: Enrique González Dávila - Grupo: Único - Departamento: Estadística, Investigación Operativa y Computación. - Área de conocimiento: Estadística e Investigación Operativa. - Centro: Escuela Técnica Superior de Ingeniería Informática. - Lugar Tutoría: Despacho 2ª Planta de la Escuela Técnica Superior de Ingeniería Informática. - Horario Tutoría: Lunes, Martes y Jueves de 13:00 a 15:00 horas. - Teléfono (despacho/tutoría): 922845051 - Correo electrónico: egonzale@ull.es - Dirección web docente: http://www.campusvirtual.ull.es 4. Contextualización de la asignatura en el Plan de Estudios - Bloque Formativo al que pertenece la asignatura: Máster en Ingeniería Informática. - Perfil Profesional: Sistemas y Tecnologías de la Información. - 1 -
5. Objetivos Objetivos del Titulo desarrollados en la asignatura Diseñar programas informáticos ajustados a las necesidades de la empresa Prepara al alumno en técnicas para el diseño y desarrollo de software, con una orientación más próxima al usuario final y a las organizaciones. Objetivos generales de la asignatura Saber de la existencia de técnicas especializadas en la extracción de información de una gran base de datos. Saber la terminología elemental de estudios estadísticos. Saber hacer comparaciones estadísticas elementales, terminología y su aplicación. Saber aplicar las técnicas de reducción de datos y análisis de datos más elementales: análisis de correspondencia, análisis factorial, componentes principales. Saber hacer estadística con paquetes estadísticos especializados (SPSS, STATISTICA, SAS, R). Saber hacer la extracción de información con técnicas adecuadas sobre grandes bases de datos. Saber hacer un informe final escrito y presentar de forma oral los resultados. 6. Competencias Competencias generales del Título desarrolladas en la asignatura G1. Capacidad y habilidad en el manejo de software especializado. G2. Capacidad y habilidad en la resolución de problemas de optimización. G3. Capacidad y habilidad para expresarse con fluidez y eficacia comunicativa en lengua propia. G4. Capacidad y habilidad de comprensión de lecturas de documentos científicos en lengua propia e inglesa. Competencias específicas del Título desarrolladas en la asignatura E1. Saber estructurar gran cantidad de información para ser analizada. E2. Saber la existencia de técnicas específicas en el análisis de gran cantidad de información. E3. Saber la existencia de software especializado en la ingeniería de datos. E4. Saber hacer un análisis elemental descriptivo de la información disponible. E5. Saber hacer un informe final de los resultados obtenidos. E6. Saber utilizar un paquete estadístico especializado. - 2 -
7. Contenidos de la asignatura Módulo I - Profesor/a Enrique González Dávila - Temas (epígrafes): Módulo Introductorio. 1. Sistemas de información. 2. Descubrimiento de Conocimiento a partir de Bases de Datos. 3. Introducción a la Minería de Datos (DM). 4. Relación de DM con otras disciplinas. Módulo II - Profesor/a: Enrique González Dávila - Temas (epígrafes): Módulo Evaluación de clasificadores en Minería de Datos (Análisis ROC). 5. Curvas ROC. 6. Clasificadores crisp. 7. Clasificadores soft. 8. Elección de umbral. Módulo III - Profesor/a: Enrique González Dávila - Temas (epígrafes): Módulo Técnicas de reducción y análisis de datos. 9. Análisis exploratorio de datos. 10. Análisis de correspondencia. 11. Análisis factorial y componentes principales. 12. Árboles de clasificación y decisión. Módulo IV - Profesor/a: Enrique González Dávila Prácticas Práctica 1. Introducción al SPSS. Práctica 2. Introducción al SPSS y software de Minería de Datos. Práctica 3. Curvas ROC y Clasificadores. Práctica 4. Análisis Exploratorio y Análisis de Correspondencias. Práctica 5. Análisis Factorial y componentes principales Práctica 6. Árboles de clasificación y decisión. - 3 -
8. Metodología y Volumen de trabajo del estudiante Metodología y Volumen de trabajo Créditos: 3 Horas: 75 VOLUMEN DE TRABAJO ACTIVIDADES DE APRENDIZAJE PRESENCIALIDAD TRABAJO AUTÓNOMO del alumnado HORAS TOTALES Clase magistral 12 12 Asistencia clases prácticas (aula / sala de demostraciones / prácticas simuladas) 12 12 Realización de seminarios 2 2 Realización de exámenes 2 2 Asistencia a Tutoría Académica-Formativa (presenciales y virtuales) 2 2 Realización de trabajos teóricos 3* 3 Realización de trabajos prácticos 15* 15 Estudio preparación clases teóricas 12* 12 Estudio preparación clases prácticas 10* 10 Preparación de exámenes 5 5 HORAS TOTALES 30 45 75 (*) El alumno invertirá 10 horas en inglés a través de estudio autónomo en lectura comprensiva de documentos científico. 9. Bibliografía / Recursos Bibliografía Básica - Statistical Parrern Recognition, Second Edition. Andrew R. Webb 2002. John Wiley & Sons. - Multivariate Data Analysis. Hair, Joseph F.; Black, W.C.; Babin, Barry; Anderson, Rolph D. 2006. Prentice Hall. - Pattern Classification. Duda, R..;Hart, P.; Store, D. 2001. Wiley-Interscience. - Construction and Assessment of Classification Rules. Hand, D.J. 1997. Wiley, Chichester. - The Elements of Statistical Learning: Data Mining, Inference and Prediction. Hastie, T.J.; Tibshirani, R.J. and Friedman, J.H. 2001. Springer, New York. Bibliografía Complementaria - Introduction to Statistical Pattern Recognition. Second Edition. Fukunaga, K. 1990. Academic Press, London. Recursos - El software utilizado principalmente será el SPSS, si bien, el que lo desee, podrá emplear software libre como el R. Las clases se impartirán con presentaciones Power Point, además del apoyo de la pizarra. - 4 -
10. Sistema de Evaluación y Calificación Recomendaciones La evaluación de la asignatura se realiza atendiendo a tres apartados: - Asistencia y participación (hasta un 25%). Se valorará la participación activa tanto en el desarrollo de las clases magistrales como en las clases prácticas. En el caso de las clases prácticas se valorará el desarrollo continuado de los ejercicios propuestos. - Conceptos teóricos de la materia (hasta un 35%). Mediante una prueba presencial se valorará el aprendizaje de los conceptos teóricos explicados en la asignatura. - Realización de trabajos y proyecto final (hasta un 40%). Se propondrán entre dos y tres trabajos con la intención de valorar el aprendizaje adquirido. Pruebas objetivas Estrategia Evaluativa TIPO DE PRUEBA (5) COMPETENCIAS CRITERIOS PONDERACIÓN E1, E3, E4 y G3 Asistencia y participación Pruebas de desarrollo E2, E5, G2 y G3 Prueba escrita 35% Trabajos y Proyectos E4, E5, E6, G1 y G4 Entrega de Trabajos y proyecto final 25% 40% 11. Cronograma/Calendario de la asignatura 4 er Bimestre SEMANA Temas Clases Teóricas Clases Prácticas Actividad 3: Actividad 4: Actividad 5 Actividad 6: Semana 1: 1,2,3 y 4 4 Semana 2: 4 Práctica 1 Prácitca 2 Semana 3: 5 y 6 4 Semana 4: 7 y 8 3 1 Práctica 3 Semana 5: 9 y 10 3 1 Práctica 4 Semana 6: 11 y 12 3 1 Seminario Práctica 5 Semana 7: 2 2 Práctica 6 Tutorización Faltan por asignar dos horas presenciales dedicadas a la realización del examen - 5 -