TFG Educational Data Mining & Learning Analytics



Documentos relacionados
Base de datos II Facultad de Ingeniería. Escuela de computación.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Trabajo final de Ingeniería

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CENTRO DE POSTGRADO MARCO NORMATIVO PARA LA ORGANIZACIÓN DE LOS TRABAJOS DE FIN DE MÁSTER UNIVERSITARIO

TÓPICOS AVANZADOS DE BASES DE DATOS

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS

CICLO FORMATIVO: CICLO SUPERIOR DE ADMINISTRACION Y FINANZAS MÓDULO: RECURSOS HUMANOS Y RESPONSABILIDAD SOCIAL CORPORATIVA

SISTEMA DE INFORMACION GERENCIAL. Lic.Patricia Palacios Zuleta

5. o. ASIGNATURA: PRACTICUM (Información general) (Código: ) 1. INTRODUCCIÓN 2. OBJETIVOS

REGLAMENTO DEL TRABAJO DE FIN DE GRADO

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

INSTRUCCIONES PARA EL RECONOCIMIENTO Y ADAPTACIÓN DE CRÉDITOS RELATIVOS A LOS MÁSTERES UNIVERSITARIOS (R.D. 1393/2007, de 29 de octubre)

COMMUNITY MANAGER PRESENTACION DEL CURSO PROFESIONAL EN COMMUNITY MANAGER

Inteligencia de Negocio

PLAN DE MEJORA DEL TÍTULO

Guía Docente del Trabajo de Fin de Grado

Informe autoevaluación: Máster Universitario en Marco Institucional y Crecimiento Económico

Plan de estudios. MÓDULO I: Fundamentos I: Historia y Economía (6 ECTS) MÓDULO II: Fundamentos II: Derecho y Relaciones Internacionales (6 ECTS)

Curso del Data Mining al Big Data

NORMAS Y CRITERIOS GENERALES DE RECONOCIMIENTO Y TRANSFERENCIA DE CRÉDITOS PARA LOS MASTER

Anexo 3 MÓDULO DE FORMACIÓN EN CENTROS DE TRABAJO PROGRAMA FORMATIVO. Centro de trabajo: Tutor del centro de trabajo:

CRITERIOS DE PROMOCIÓN Y TITULACIÓN EN E.S.O.

Metodología básica de gestión de proyectos. Octubre de 2003

Curso de Minería de Datos Instructor: Dr. Luis Carlos Molina Félix

INFORME FINAL EVALUACIÓN PARA RENOVACIÓN DE LA ACREDITACIÓN

Programa de Criminología UOC

Presentación del Curso Virtual GESTIÓN DE TALENTO HUMANO

CURSO: CURSO ADMINISTRADOR HADOOP

Presentación del Curso Virtual GESTIÓN DE RIESGOS LABORALES

MICROSOFT PROJECT 2010

Análisis de Datos. Práctica de métodos predicción de en WEKA

Calidad de Sistemas de Información

CRITERIOS GENERALES DE EVALUACIÓN 1. COMPRENSIÓN EXPRESIÓN DE MENSAJES DIVERSOS.

Encuesta Permanente de Hogares

FUNDAMENTOS DE ENFERMERÍA II

TITULACIÓN: MÁSTER UNIVERSITARIO EN TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIONES EN REDES MÓVILES

Máster Universitario en Profesor de Educación Secundaria Obligatoria y Bachillerato, Formación Profesional y Enseñanza de Idiomas

El presente documento supone la adaptación de dicha normativa a las características particulares de la Facultad de Psicología de la UNED.

Las normas ISO en su versión actual proveen un sistema de calidad disciplinado que tiene como pilares básicos:

SUPLEMENTO EUROPASS AL TÍTULO

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos

Estudio de la Empresa Agrícola. Métodos de estudio. Estudio de caso

NORMA TÉCNICA DE COMPETENCIA LABORAL


Facultad de Medicina Grado en [nombre del grado] 9. Sistema de Garantía Interna de Calidad

RESUMEN INFORMATIVO PROGRAMACIÓN DIDÁCTICA CURSO 2015/2016. MATERIA: ECONOMÍA Y ORGANIZACIÓN DE EMPRESAS CURSO: 2º BACHILLERATO HH. y CC.SS.

FORMATIVO DE GRADO SUPERIOR DE DESARROLLO DE APLICACIONES WEB PROGRAMACIÓN DEL MÓDULO PROFESIONAL PROYECTO DE DESARROLLO DE APLICACIONES WEB

GUÍA PARA LA ELABORACIÓN DEL TRABAJO FIN DE GRADO DE LA FACULTAD DE FILOSOFÍA Y LETRAS ( )

TEMARIO SISTEMAS DE GESTION DE LA CALIDAD EN EMPRESAS DE SERVICIOS

NORMATIVA DE LA ESCUELA DE NEGOCIOS AFUNDACIÓN PARA LA REALIZACIÓN DEL TRABAJO FIN DE GRADO

Salvaguarda y Seguridad de los Datos (Online)

Etapas del proceso de reclutamiento: estructura el sistema de trabajo a realizar.

EVALUACIÓN PARA LA RENOVACIÓN DE LA ACREDITACIÓN

INFORME FINAL SEGUIMIENTO

PROGRAMA DE LA ASIGNATURA. Curso académico

Tú eres la noche de Imagina 2011

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática

GUÍA DOCENTE DE MARKETING INTERNO Curso Madrid, 25 de Julio 2012

Proyecto de administración de sistemas informáticos en red

CAPÍTULO I. Introducción. En la industria del hospedaje a través del tiempo se han dado diversos cambios en la

PROTOCOLO DE EVALUACIÓN PARA LA VERIFICACIÓN DE TÍTULOS OFICIALES (GRADO Y MÁSTER)

REQUISITOS PARA LA GESTIÓN DE LA FORMACION PROFESIONAL INICIAL

1.Organización general

MARKETING ESTRATÉGICO

TÍTULO VI: TRABAJO FIN DE GRADO

Implantación de Aplicaciones Web Fecha:

CI Politécnico Estella

Anexo 11. Manual de Administración

CURSO: CURSO DESARROLLADOR HADOOP

Certificado de Profesionalidad:Administració n y Programación en Sistemas de Planificación de Recursos Empresariales y de Gestión de Relaciones con

MÁSTER: MÁSTER DESARROLLADOR BIG DATA

CURSOS DE COMERCIO EXTERIOR

Itinerario de Adaptación al. Grado en Ingeniería Informática. Por la Universidad de Las Palmas de Gran Canaria

Curso de Especialización en Gestión de Empresas Retail

Plan de Estudios. Posgrado en Publicidad, Marketing y Social Media. Escuela de Negocios Europea de Barcelona. Miembro de:

MANUAL DE PROCESOS DEL SGIC. Directriz 2: Orientación de las enseñanzas a los estudiantes. P2.3: Proceso de desarrollo de la enseñanza

Objetivos y Competencias

(Fundamentos de la Gobernanza y la Gestión de Seguridad de la TI. Certificación ISO 27000)

GLOSARIO DE TERMINOLOGIA SOBRE SISTEMAS DE GESTIÓN DE LA CALIDAD

O jeto de apre r ndizaje

IBM SPSS Modeler Novedades de la Versión

Transcripción:

TFG Educational Data Mining & Learning Analytics Estudio de las Matriculaciones de A.D.E. en la UOC Autor: Antonio Blanco Carpintero Tutor: Ramón Caihuelas Quiles

Introducción Educational Data Mining Soporte a profesores Recomendaciones para estudiantes Predicciones y modelaje de comportamientos Mediciones sobre rendimiento de los estudiantes Análisis de los grupos sociales Análisis, planificación y construcción de cursos y eventos

R como lenguaje para Data Mining Aspectos principales de R Multitud de paquetes adicionales fácilmente instalables Posibilidad de comunicarse con bases de datos y ficheros Exportar resultados en diversos formatos Disponibilidad de un entorno gráfico Accesibilidad a grandes datos de internet como Google, Twitter y Facebook

Enfoque y Método Seguido Objetivo Definición de la Tarea Origen de los Datos Preparación de los Datos Procesamiento de los Datos Evaluación Análisis Selección de los Datos Limpieza Transformación Selección del Modelo Elaboración del Modelo Verificación Validación

Construcción de un Modelo Conocimiento Previo Base de Datos (Conjunto de Observaciones) Método de Construcción del Modelo Modelo1... n Conocimientos de Minería de Datos Origen de los Datos Herramientas de Utilidad (lenguage R, Rattle, Rstudio, Weka) Preparación de los Datos (limpieza, organización, procesamiento, ) Construcción de Modelos (Agregación, Clasificación, )

Planificación del Proyecto TFG - Educational Data Mining & Learning Analytics Plan de Trabajo Tratamiento de Datos Procesamiento de Datos Entrega Final y Presentación Virtual Tribunal

Productos Obtenidos Entre los productos más relevantes obtenidos: Algoritmos en código R Diferentes estudios de los datos con técnicas complementarias Resultados de la ejecución de los algoritmos Gráficas explicativas de los resultados Ficheros de datos resultantes de la investigación Memoria del Proyecto Presentación Virtual

Extracción de los Datos Fichero TFG_EDMLA.dat. Datos de Matriculaciones ADE Fichero GR01.ass.1sem. Códigos de Asignaturas ADE Campo de Datos Descripción Formato Rango de Valores Id_Alumno Es el campo que identifica a un alumno Alfanumérico 10 posiciones 0000000000-999999999 Fa_ass1 Indicador de la matriculación de la asignatura1 Alfanumérico 1 posición 0 No matricula 1 Sí matricula Supera_ass1 Indicador de la superación de la asignatura1 Alfanumérico 1 posición 0 No supera 1 Sí supera Fa_ass45 Indicador de la matriculación de la asignatura45 Alfanumérico 1 posición 0 No matricula 1 Sí matricula Supera_ass45 Indicador de la superación de la asignatura45 Alfanumérico 1 posición 0 No supera 1 Sí supera

Extracción de los Datos Variables Alumnos Asignaturas Extracción de los datos Id_ Alumno Observaciones Asignaturas Matriculadas Asignaturas Aprobadas

Estudio de los Datos Característica Asignatura Valor Frecuencias Total de Matriculaciones 14666 Absolutas Total de Aprobados 10348 Total de Suspensos 4318 Asignatura con mayor número de matriculaciones 01.500 2581 Asignatura con menor número de matriculaciones 01.542 4 01.543 4 Asignatura con mayor número de aprobados 01.505 1844 Asignatura con menor número de aprobados 01.542 2 Asignatura con mayor número de suspensos 01.500 812 Asignatura con menor número de suspensos 01.543 1 01.550 1 Tasas Asignatura con mayor tasa de aprobados/matriculados 01.513 0,9070 Asignatura con menor tasa de aprobados/matriculados 01.523 0,2857 Asignatura con mayor tasa aprobados/suspensos 01.513 9,7500 Asignatura con menor tasa aprobados/suspensos 01.523 0,4000

Descripción de los Datos 0 200 400 600 800 1000 1200 1400 1600 1800 2000 01.500 01.505 01.507 01.502 01.506 01.503 01.504 01.509 01.501 01.508 01.520 01.521 01.516 01.517 01.519 01.524 01.526 01.528 01.513 01.529 01.518 01.514 01.512 01.510 01.515 01.522 01.511 01.527 01.523 01.530 01.535 01.554 01.549 01.525 01.537 01.547 01.542 01.534 01.545 01.552 01.561 01.550 01.544 01.536 01.543 Matriculaciones vs Resultados Aprobados Suspensos

NNFM Matriz de Factores No Negativos Descomposición de datos binarios X ~ W H Uso en clustering

Matriz de Bases Clústers de Asignaturas Clúster 1: 01.500, 01.505, 01.507 Clúster 2: 01.500, 01.502, 01,520 Clúster 3: 01.504, 01.508, 01.521 y otras Clúster 4: 01.501, 01.503, 01.509 y otras Clúster 5: 01.505, 01.506 Obtenemos las mayores similitudes entre las asignaturas entre grupos reducidos

PCA Análisis de Componentes Principales Componente Principal i n PC i = a i,j X i,j j=1 Diferentes tipos de rotaciones practicadas varimax oblimin promax

PCA Análisis de Componentes Principales RC1. 01.500, 01.502 (en valor negativo) junto con 01.513, 01.518, 01.517, 01.521, 01.524, 01.528 (en valor positivo) RC2. 01.500, 01.502, 01.507 (en valor negativo) junto con 01.501, 01.503, 01.504 y 01.508 (en valor positivo) RC3. 01.505, 01.506 (en valor negativo) junto con 01.520 y 01.522 (en valor positivo) RC4. 01.510, 01.511, 01.512, 01.515, 01.519, 01.526, 01.527, 01.529 (todas ellas positivas) RC5. 01.535, 01.536, 01.537, 01.542, 01.549 (todas ellas en valores positivos)

K-means Clúster de Asignaturas 6 clústers Clúster Matriculaciones Matr_% Asignaturas 1 1363 9,29 01.503, 01.504 2 2271 15,48 01.507 3 2339 15,95 01.505 4 4159 28,36 01.500, 01.502 5 3087 21,05 otras 6 1447 9,87 01.506

Preparación de un Clasificador El clasificador de Éxito o Fracaso se basa en la diferencia entre asignaturas matriculadas y las asignaturas aprobadas de tal manera: Asignaturas Matriculadas Asignaturas Aprobadas > 0 en caso contrario "Fracaso" "Éxito N_Alumno 1 2 3 45 Clasificador Éxito/Fracaso Al_1 0/1 0/1 0/1 0/1 Éxito o Fracaso Al_n 0/1 0/1 0/1 0/1 Éxito o Fracaso

Clústers Alumnos y Clasificación Éxito - Fracaso Relación de Clústers Clúster Éxito Fracaso 1 787 183 2 676 205 3 678 149 4 673 236 5 628 122 6 448 86

Árboles de Decisión Modelo ctree Asignaturas más relevantes: 01.507 01.522 01.505» 01.504

Árboles de Decisión Modelo rpart Complejidad 0,001 Casos significativos de Fracaso: EF=Fracaso cover=27 (1%) prob=0.63 3<0.5 && 2<0.5 && 7<0.5 && 26>=0.5 && 17<0.5 EF=Fracaso cover=35 (1%) prob=0.57 3<0.5 && 2<0.5 && 7<0.5 && 26<0.5 && 19<0.5 && 13>=0.5 && 1< 0.5 && 8<0.5

Árboles de Decisión Modelo rpart Complejidad 0,0001 Casos significativos de Fracaso: EF=Fracaso cover=27 (1%) prob=0.63 3<0.5 && 2<0.5 && 7<0.5 && 26>=0.5 && 17<0.5 EF=Fracaso cover=13 (0%) prob=0.62 3>=0.5 && 12<0.5 && 2<0.5 && 14<0.5 && 7<0.5 && 11>=0.5 && 6>=0.5 EF=Fracaso cover=35 (1%) prob=0.57 3<0.5 && 2<0.5 && 7<0.5 && 26<0.5 && 19<0.5 && 13>=0.5 && 1<0.5 && 8<0.5 EF=Fracaso cover=9 (0%) prob=0.56 3<0.5 && 2<0.5 && 7>=0.5 && 11>=0.5 && 1>=0.5

Árboles de Decisión Árbol J48 con Weka Leyenda: =0 No matricula =1 Sí matricula Nodos relevantes Asociados al Fracaso: 01.537 01.520 && 01.516 01.522 && 01.523 01.517 01.503 01.521 01.526

Conclusiones Trabajo Evolutivo de Proceso de Aprendizaje y crecimiento Personal Obtención de una visión global de lo que es un proyecto, su planteamiento, puesta en marcha y finalización Evaluación de riesgos y enfrentamiento a inconvenientes Añade Conocimiento y Experiencia