PUCP Buena práctica: Uso de una base de datos robusta que ayuda en la toma de decisiones (Data Warehouse), como fuente principal del Sistema de apoyo a la gestión (SAG) y de estudios estadísticos requeridos por la PUCP 3ra reunión técnica - CINDA Barcelona España Octubre 2014
Año de inicio de la Buena Práctica: 2003 2003-2004: Piloto de Indicadores de calidad, herramientas disponibles gratuitas. 2004: Diseño de primer alcance del Data Warehouse (DWH), obtención de respaldo de autoridades, selección y adquisición de herramientas a usarse en el desarrollo. 2005: Puesta en producción inicial del SAG-PUCP: indicadores de calidad de las carreras de pregrado así como información de graduados y titulados. 2006-2007: alumnos, postulantes, ingresantes a una unidad, egresados, docentes, cursos y notas. 2008: Ingresantes a una especialidad; Dashboard de un alumno. 2010: Estadísticas de Colegios; Dashboards para Facultades y Departamentos académicos. 2014: Encuestas de Egresados, Dashboards a nivel Universidad de acceso directo a través del campus virtual, incorporación de informes de tipo Self- BI, incorporación de informes para dispositivos móviles
Metodología: Definición de la infraestructura y las herramientas de desarrollo. Definición de requerimientos Diseño dimensional y análisis de fuentes de datos. Diseño físico e implementación de base de datos. Desarrollo e implementación de los procesos de extracción, transformación y carga de datos (ETLs). Análisis, diseño y desarrollo de aplicaciones para la explotación de la base de datos. Implementación, mantenimiento y crecimiento.
Recursos humanos, técnicos y materiales involucrados en la Buena Práctica Personal capacitado en diseño de DWH, técnicas BI y estadística. Personal con conocimiento de la institución (know-how durante proceso de autoevaluación e indicadores de calidad) Software: Manejador de Base de Datos Herramienta para facilitar el poblamiento de la nueva base de datos (Herramienta ETL) Herramienta de Desarrollo de Aplicaciones de Usuario Final Hardware: Servidor para la Base de Datos Servidor de Aplicaciones Servidor para la Herramienta ETL
Replicabilidad de la Buena Práctica La metodología es replicable en cualquier otra universidad. Se debe contar con el respaldo de las altas autoridades y con un equipo que domine el know-how de la institución. Contar con una sólida base de datos transaccional que guarde información histórica. Hacer una buena limpieza de los datos y que la información que se muestre sea confiable. No solo por las decisiones que se pueden tomar a partir de ellos sino porque de eso dependerá la confianza que genere y el uso que se le dé.
Originalidad Es original porque que cuando se puso en marcha no habíamos visto en ninguna otra universidad el uso de metodologías propias del ámbito empresarial (BI). Hemos hecho diversas presentaciones a nivel nacional e internacional del SAG-PUCP
Generación de valor Provee información a todas las autoridades académicas y analistas de la información en la universidad. Colegios: Información de indicadores de calidad de sus egresados en la universidad. Alumnos: Seguimiento de su desempeño ciclo a ciclo. Docentes: Seguimiento de su desempeño ciclo a ciclo. Institucional: Plataforma para poder hacer un seguimiento de los principales indicadores de la institución para efectos de evaluación, acreditación y comparación. Por ejemplo, indicadores de calidad de la docencia (proyecto CINDA).
Etapas y productos de un proyecto de BI Etapa Productos Análisis del requerimiento institucional Objetivos en términos de BI Poblaciones a estudiar (Unidades de observación) Relación preliminar de indicadores y dimensiones a estudiar Relación preliminar de informes, aplicaciones o técnicas a usar Exploración de fuentes de datos disponibles Descripción y modelos de datos disponibles (de bases de datos transaccionales, de encuestas, etc.) Informe de diagnóstico de calidad de los datos disponibles ETL Diseño Modelos de datos a generar (DW, DM u otra base con los indicadores y dimensiones en estructura apropiada para procesamiento analítico) Especificaciones para ETC Procesamiento analítico Desarrollo Programas o jobs ETC Puesta en producción Manuales de uso Ejecución Base de datos a ser usada en el procesamiento analítico Diseño Prototipos de informes y aplicaciones o Relación de técnicas a usar Desarrollo Programas o aplicaciones de procesamiento analítico Puesta en producción Manuales de uso Ejecución (a cargo de personal BI especializado o del usuario) Resultados del procesamiento analítico Análisis de resultados Informe con Conclusiones y Recomendaciones (a cargo de personal BI especializado o del usuario) Decisiones (a cargo del usuario)
Proyecto BI no estándar Ficha resumen Objetivo institucional Objetivo en términos de BI Población a estudiar Relación preliminar de indicadores y dimensiones a estudiar Descripción de datos disponibles y su calidad Mejorar la calidad de los admitidos Mejorar la capacidad que tienen los procesos de admisión de predecir el rendimiento en la universidad. Admitidos a la PUCP de los últimos n años Indicadores de rendimiento en el colegio (Promedios de notas escolares por área, por año y total, condición de haber tenido buen rendimiento en el colegio) Indicadores de rendimiento en las pruebas de admisión (Puntajes parciales y final) Indicador de rendimiento académico en la universidad (Coeficiente de rendimiento académico estandarizado en la PUCP) Existe información de buena calidad de: Notas en los cursos llevados en el colegio en secundaria Puntajes parciales y final en las pruebas de admisión Notas en los cursos llevados en la PUCP de los admitidos a la PUCP de los últimos n años Modelo de datos a generar El modelo E-R de los datos a generar se encuentra en Relación de técnicas a usar Análisis factorial considerando los indicadores de rendimiento en el Colegio y en las Pruebas de admisión Análisis de correlación bivariados del rendimiento en la Universidad versus cada indicador de rendimiento en el Colegio y en las Pruebas de admisión Análisis de regresión considerando como variable dependiente al rendimiento en la Universidad y como variables independientes a las variables que mostraron buena correlación Conclusiones y decisiones Conclusiones El rendimiento escolar es una dimensión importante y diferente a la de las partes de las pruebas de admisión Existe una muy buena correlación entre el rendimiento en el colegio y el rendimiento académico en la universidad. El rendimiento en el colegio debe tener un peso igual a p% para maximizar la capacidad predictiva de los procesos de admisión masivos. Decisiones Usar un peso igual a p% en las fórmulas de los procesos masivos de admisión Crear modalidades de admisión para los alumnos con buen rendimiento escolar: o Para el 1/3 superior de los mejores colegios (ITS) o Para el 1/5 superior de todos los colegios (PAEE) Hacer otro estudio para seleccionar a los mejores colegios.
DEMO