Inteligencia de Negocio

Documentos relacionados
Inteligencia de Negocio

Redacción del Proyecto Fin de Carrera 1

NORMAS GENERALES DE ELABORACIÓN Y PRESENTACIÓN DE TRABAJOS FIN DEL GRADO EN COMUNICACIÓN AUDIOVISUAL DE LA UNIVERSIDAD DE GRANADA

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tarea 3 Búsqueda por Interpolación y Extrapolación

I JORNADAS ANDALUZAS VIRTUALES SOBRE GESTION DE RESIDUOS SANITARIOS

PROYECTO FINAL DE MÓDULO GUÍA DE REALIZACIÓN

BREVE GUÍA PARA TRABAJOS FIN DE GRADO

Tareas y métodos de evaluación

Aprendizaje no supervisado

Organización y Gestión de Archivos

UNIVERSIDAD MIGUEL HERNÁNDEZ ESCUELA POLITÉCNICA SUPERIOR DE ELCHE

GUÍA DE APOYO PARA EL USO DE. Docente

NORMAS GENERALES DE ELABORACIÓN Y PRESENTACIÓN DE TRABAJOS FIN DEL GRADO PARA LOS GRADOS DE LA FACULTAD DE COMUNICACIÓN Y DOCUMENTACIÓN

PAUTAS PARA LA PRESENTACIÓN DE TRABAJOS: LIBRO DIGITAL DE LAS II JORNADAS DE INVESTIGACIÓN EN CIENCIA POLÍTICA

Internacionalización y comercialización

4.4 ACTIVIDAD DE APRENDIZAJE 4.4: Diseñar la Interfaz Gráfica del Usuario Descripción de la AA4.4:

EJERCICICIO Nº11: INSERTAR CONTENIDOS DENTRO DE CADA TEMA

Diseño y simulación de un algoritmo basado en lógica difusa para el despacho de ascensores en un edificio

Proyecto para mejorar el proceso de otorgamiento de licencia de funcionamiento en las municipalidades

Resumen Curso Google Analytics

Dónde se guardan los ficheros de una asignatura?

Métricas para la validación de Clustering

Crear Tareas. Crear Tareas. 1 de 8. En este tutorial vamos a revisar el comportamiento de la herramienta "Tarea".

CENTRO JUVENIL CURSO DE MONITOR DE TIEMPO LIBRE INFANTIL Y JUVENIL INDICACIONES PARA LA REALIZACIÓN DE LA MEMORIA DE PRÁCTICAS.

1.- Compruebe que. 2.- Solicite autorización de la Comisión Académica del Programa de Doctorado para la presentación de la tesis.

Trabajo Fin de Grado Facultad de Ciencias Sociales y de la Educación, UCJC GUÍA DEL ALUMNO

Revisión de archivos en la Herramienta Turnitin

Programa Aprendizaje en Línea (PAL) Revisión de archivos en la Herramienta Turnitin

Portal web de seguridad viaria y visor móvil de accidentalidad

ANEXO 1 OPCIÓN: ANÁLISIS DE CASO

- MANUAL DE USUARIO DE LA PLATAFORMA DE EDICION DE PROYECTOS DE LA XERENCIA MUNICIPAL DE URBANISMO DE VIGO -

REPORTE FINAL DE ESTADÍA PROFESIONAL

Registro y presentación de ofertas

3.2. Agregar y modificar recursos

Aprobado por la Comisión de Trabajo Fin de Grado en sesión de 26 de Septiembre de 2013

Puntos importantes de la Guía de la Monografía:

Manual de usuario del Front Office de ATENEA para la solicitud de informes de accidente de tráfico

AMPLIACIÓN DE SISTEMAS INTELIGENTES

IAAE - Inteligencia Artificial Aplicada a la Ingeniería

GUÍA PARA LA ELABORACIÓN Y PRESENTACIÓN DE TRABAJOS ESCRITOS 1. ESTRUCTURA DEL TRABAJO ESCRITO: Debe contener obligatoriamente las siguientes partes:

Guía Docente Modalidad Presencial. Sistemas Operativos I. Curso 2016/17. Grado en Ingeniería de. Sistemas de Información

Estructura y formato del TFG

GUIA PARA EL USUARIO REGISTRO NACIONAL DE SANCIONES DE DESTITUCION Y DESPIDO RNSDD

MANUAL EMPRESA CONTRATISTA VERSIÓN 3.0

PROYECTO GRUPAL. GUIA DE LA ACTIVIDAD DE TRABAJO COLABORATIVO Muestreo y Estimación de Parámetros METODOLOGÍA. Procedimiento:

Paquete. Precio del Paquete Pyme Básico: 9,99 euros/mes (IVA no incluido)

(1)NOMBRE DE LA ASIGNATURA O UNIDAD DE APRENDIZAJE: SEMINARIO DE TESIS II

PLAN DE TRABAJO

Estadística Básica. Unidad 2. Actividades

1. Actividades de conocimiento del centro escolar y su contexto. 2. Actividades de conocimiento de la organización y gestión del aula.

GUÍA ESTRUCTURADA DE EVALUACIÓN

Syllabus Investigacion de mercados II Grado en Marketing

Cuerpo de Profesores Técnicos de Formación Profesional

NOVEDADES EN MOODLE CURSO 2016/2017

TRABAJO FIN DE GRADO CIENCIA Y TECNOLOGÍA DE LOS ALIMENTOS

Retórica y métrica literarias

Funcionalidades básicas del docente

Transcripción:

UNIVERSIDAD DE GRANADA E.T.S. de Ingenierías Informática y de Telecomunicación Departamento de Ciencias de la Computación e Inteligencia Artificial Inteligencia de Negocio Guión de Prácticas Práctica 2: Segmentación para Análisis Empresarial Curso 2017-2018 Cuarto Curso del Grado en Ingeniería Informática

Práctica 3 Segmentación para Análisis Empresarial 1. Objetivos y Evaluación En esta segunda práctica de la asignatura Inteligencia de Negocio veremos el uso de técnicas de aprendizaje no supervisado para análisis empresarial. Se trabajará con un conjunto de datos sobre el que se aplicarán distintos algoritmos de agrupamiento (clustering). A la luz de los resultados obtenidos se deberán crear informes y análisis lo suficientemente profundos. La práctica se calificará hasta un máximo de 2 puntos. Se valorará el acierto en los recursos de análisis gráficos empleados, la complejidad de los experimentos realizados, la interpretación de los resultados, la organización y redacción del informe, etc. 2. Descripción del problema: accidentes mortales de tráfico en España Una compañía aseguradora quiere comprender mejor las dinámicas en accidentes de tráfico en España. Para ello, a partir de diversas variables que caracterizan el accidente, se pretende encontrar grupos de accidentes similares y relaciones de causalidad que expliquen tipos y gravedad de los accidentes. Para ello se cuenta con los datos publicados por la Dirección General de Tráfico (DGT) en https://sedeapl.dgt.gob.es/web_iest_consulta/subcategoria.faces que incluye información desagregada (microdatos) de más de 30 variables entre los años 2008 y 2015. En esta práctica, nos centraremos en los datos para el año 2013 (89.519 accidentes). En la web de la asignatura se incluye el conjunto de datos procesado a partir de la fuente original sobre el que se trabajará en esta práctica. 1

3 Tareas a Realizar 2 3. Tareas a Realizar La práctica consiste en aplicar y analizar técnicas de agrupamiento para descubrir grupos en el conjunto de datos bajo estudio. El trabajo se realizará empleando librerías y paquetes de Python, principalmente pandas, scikit-learn, matplotlib y seaborn. Se recomienda consultar los siguientes enlaces: http://scikit-learn.org/stable/modules/clustering.html http://www.learndatasci.com/k-means-clustering-algorithms-python-intro/ http://hdbscan.readthedocs.io/en/latest/comparing_clustering_algorithms.html https://joernhees.de/blog/2015/08/26/scipy-hierarchical-clustering-and-dendrogram-tutorial/ http://www.learndatasci.com/k-means-clustering-algorithms-python-intro/ Nos interesaremos en segmentar los accidentes seleccionando previamente grupos de interés según las variables categóricas. Por ejemplo, analizar solo accidentes donde ha habido colisión de vehículos, solo en carreteras urbanas, en determinadas condiciones ambientales, etc. También se puede considerar la hora y/o día de la semana para seleccionar subgrupos de interés (fines de semana, horario de mañana, etc.). Queda a elección libre del alumno escoger varios casos (al menos tres) y realizar el estudio sobre ellos. Será necesario también aplicar una normalización para que las métricas de distancia y la visualización funcionen correctamente. Deberán justificarse las decisiones tomadas respecto al tratamiento de las variables. En cada caso de estudio se analizarán 5 algoritmos distintos de agrupamiento (siendo al menos uno de ellos K-means) obteniéndose el tiempo de ejecución y métricas de rendimiento tales como Silhouette y el índice Calinski-Harabaz. Además, se analizará el efecto de algunos parámetros determinantes (por ejemplo, el valor de k si el algoritmo necesita fijarlo a priori) en al menos 2 algoritmos distintos para cada caso de estudio. El análisis deberá apoyarse en visualizaciones tales como nubes de puntos (scatter matrix), dendrogramas y mapas de temperatura (heatmap). Por ejemplo, en la figura 3.1 se incluye un scatter matrix de K-means (k = 4) en tipos de accidente donde ha habido colisión de vehículos. Se recomienda que sobre estas visualizaciones se construyan tablas que caractericen aproximadamente cada grupo. Por ejemplo, en esa figura se puede observar que el cluster 1 corresponde a accidentes no mortales donde hay varios vehículos implicados. En la web de la asignatura se incluye un script de ejemplo que puede servir como punto de partida para realizar la práctica. A partir de los resultados obtenidos se deberán extraer conclusiones sobre los tipos de accidentes. Se valorará el acierto en la selección de casos de estudio que mejor reflejen los grupos encontrados en los datos.

4 Esquema de la Documentación 3 Figura 3.1: Ejemplo de resultado de K-means con k = 4 4. Esquema de la Documentación La documentación entregada deberá ajustarse al siguiente esquema (debe respetarse la numeración y nombre de las secciones): 1. Introducción: se hablará sobre el problema abordado y todas las consideraciones generales que se deseen indicar. 2. Caso de estudio X: se incluirá una sección por cada caso de estudio analizado. En ella se explicará en detalle en un primer apartado qué caso se analiza y por qué. Se incluirá una tabla comparativa con los resultados de los algoritmos de clustering y tantas otras tablas para el análisis de los parámetros (una tabla por algoritmo). Cada sección contendrá las visualizaciones necesarias para analizar el problema. Se añadirá un apartado final titulado Interpretación de la segmentación que incluirá las conclusiones generales a las que haya

5 Entrega 4 llegado el alumno a la luz de los resultados en el correspondiente caso de estudio. En cada sección podrán incluirse extractos de los scripts que el alumno considere relevante para destacar el trabajo realizado. 3. Contenido adicional: opcionalmente, cualquier tarea adicional a las descritas en este guion puede presentarse en esta sección. 4. Bibliografía: referencias y material consultado para la realización de la práctica. No se aceptarán otras secciones distintas de estas. Además, la primera página de la documentación incluirá una portada con el nombre completo del alumno, grupo de prácticas y dirección email. También se incluirá una segunda página con el índice del documento donde las diferentes secciones y páginas estarán enlazadas en el pdf. 5. Entrega La fecha límite de entrega será el domingo 17 de diciembre de 2017 hasta las 23:59. La entrega se realizará a través de la web de la asignatura en https://decsai.ugr.es. En un único fichero zip se incluirá la documentación, los scripts de Python empleados y cualquier otro archivo que el alumno considere relevante. El nombre del archivo zip será el siguiente (sin espacios): P2-apellido1-apellido2-nombre.zip. La documentación tendrá el mismo nombre pero con extensión pdf. Es decir, la alumna María Teresa del Castillo Gómez subirá el archivo P2-delCastillo-Gómez-MaríaTeresa.zip que contendrá, entre otros, el archivo P2-delCastillo-Gómez-MaríaTeresa.pdf. Si, por alguna razón justificada, el archivo zip fuera demasiado grande para subirse en la plataforma, se podrá incluir en la documentación (visible en la primera página de portada) un enlace a http://consigna.ugr.es con el material adicional. En tal caso, la permanencia en consigna deberá ser de 1 mes y deberá comunicarse por email al profesor de prácticas. En ningún caso se aceptan otros tipos de enlaces como Dropbox, Google Drive o similares.