Inteligencia de Negocio



Documentos relacionados
Trabajo final de Ingeniería

Base de datos II Facultad de Ingeniería. Escuela de computación.

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

CRM. Customer Relationship Management Sistema de Gestión Inteligente de Mercadeo y Ventas. Sistema de Gestión Inteligente de Mercadeo y Ventas

Parte I: Introducción

CAPITULO III MARCO METODOLÓGICO. Desde la perspectiva de Hurtado de Barrera (2008), el tipo de

Portafolio de Servicios y Productos

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia.

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Tratamiento del Riesgo

CAPÍTULO 1 INTRODUCCIÓN

CENTRO UNIVERSITARIO EUSA CENTRO ADSCRITO A LA UNIVERSIDAD DE SEVILLA CURSO ACADÉMICO

Informática 4º ESO Tema 1: Sistemas Informáticos. Sistemas Operativos (Parte 2)

Técnicas de venta (nueva versión)

ADMINISTRACIÓN DE LA PRODUCCIÓN

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

Laboratorio 7 Motor de búsqueda web basado en el TAD Árbol Binario de Búsqueda GUIÓN DEL LABORATORIO

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

Instalación. Interfaz gráfico. Programación de Backups. Anexo I: Gestión de la seguridad. Manual de Usuario de Backup Online 1/21.

GUÍA BÁSICA USUARIO MOODLE 2.6

POSICIONAMIENTO EN LA WEB (SEM Y SEO)

CI Politécnico Estella

Base de datos en Excel

Guía breve para la. Versión abreviada del Manual para la. evaluación de desempeño y potencial

Estudios de Economía y Empresa Trabajo Final de Grado Investigación de mercado

CICLO DE GRADO MEDIO DE GESTION ADMINISTRATIVA COMUNICACIÓN EMPRESARIAL Y ATENCIÓN AL CLIENTE

Plataforma de formación Guía de navegación

ETAPA: ESO NIVEL: 4º ESO MATERIA: INTRODUCCION A LA GESTION COMERCIAL OBJETIVOS

Archivo de correo con Microsoft Outlook contra Exchange Server

La inteligencia de marketing que desarrolla el conocimiento

revista transparencia transparencia y UNIVERSIDADES

Código del programa: PEMDE. Programa Experto en MANEJO DE DATOS CON EXCEL. Modalidad: Virtual. Descripción del programa

Lo que miden los niveles de dominio

FICHA TÉCNICA DE LA ACCIÓN FORMATIVA:

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso

Capacidades y criterios de evaluación:

Capítulo I. Definición del problema y objetivos de la tesis. En la actualidad Internet se ha convertido en una herramienta necesaria para todas

Programa de Criminología UOC

Práctica 5. Curso

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

La mayor parte de las empresas en el mundo utilizan sistemas de información,

UNIVERSIDAD DE SALAMANCA

FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES NORMATIVA SOBRE EL TRABAJO FIN DE GRADO

Normativa para Trabajos Fin de Grado. Escuela Te cnica Superior de Ingenierı a Informa tica. Universidad de Sevilla

1. OBJETO 2. CARACTERÍSTICAS GENERALES DEL TRABAJO

Universidad de Tarapacá Investigación de Mercados Internacionales

EL MARKETING RELACIONAL Y NUEVAS TENDENCIAS DE MARKETING

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

INTRODUCCIÓN CAPITULO I 1.1 PLANTEAMIENTO DEL PROBLEMA.

MASTER EN DIRECCIÓN DE EMPRESAS (MBA)

Pliego de Prescripciones Técnicas para la contratación de un servicio para la ejecución del plan de comunicación 2014 de BILIB.

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

Cursos del Programa Académico de Administración de Empresas

<Generador de exámenes> Visión preliminar

Tabla Tabla de equivalencia entre asignaturas de Ingeniería Técnica en Informática de Gestión al Grado en Ingeniería Informática. Créd LRU.

Manual del Estudiante

Sistema Perfil VALIA. Manual del Usuario

Implementando un ERP La Gestión del Cambio

Online Intelligence Solutions. Ryanair. Ryanair usa la analítica web para incrementar el beneficio y el rendimiento de su página web.

INFORME Nº GTI INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE

ETAPA: (ESO-BACHILLERATO-FORMACIÓN PROFESIONAL) DEPARTAMENTO DE ECONOMÍA

Novedades en Q-flow 3.02

5.4. Manual de usuario

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Marco normativo del sistema de reconocimiento y transferencia de créditos

NOTAS TECNICAS Nº 5. Clasificación del Sistema Educacional Chileno para efectos de comparabilidad internacional

Data Mining Técnicas y herramientas

CASO 3-5 EUROPEAN ALCOHOL RESEARCH FOUNDATION

TEMA 2: Representación de la Información en las computadoras

FORMACIÓN E-LEARNING. Curso de Marketing Operativo

ESTUDIAR MATEMATICA EN CASA

Manual de operación Tausend Monitor

BANCO CENTRAL DE RESERVA DEL PERÚ

Manual de ayuda para crear y gestionar Tareas, como actividad evaluable

GESTIÓN Y PRÁCTICA COMERCIAL

PROCEDIMIENTO GESTIÓN TICS

GuÍa rápida de uso. westlaw chile

Capítulo IV. Manejo de Problemas

ARTÍCULO 1.- RECONOCIMIENTO DE CRÉDITOS POR ACTIVIDADES UNIVERSITARIAS

Oferta tecnológica: Vehículos autónomos para transporte de materiales en almacenes

MANUAL DE INICIACIÓN A JOVELLANOS VIRTUAL J. A. Espejo coordinador.tic@iesjovellanos.org 1

UNIVERSIDAD AUTONOMA DE GUADALAJARA ACP06 ALUMNO: JOSE ANGEL DEHESA JIMENEZ REGISTRO: C R M

Elementos requeridos para crearlos (ejemplo: el compilador)

Guía paso a paso para emprender en México!

CAPÍTULO 5 CONCLUSIONES Y RECOMENDACIONES

UNIVERSIDAD NACIONAL DE INGENIERÍA

Doble Equipos Sistema de Ingresos: Preguntas Más Frecuentes

XR Recepción de Facturas

Enfoque del Marco Lógico (EML)

Curso para Entrenadores Nivel Uno. Información, Enfoque Educativo y Contenido

El objetivo principal del presente curso es proporcionar a sus alumnos los conocimientos y las herramientas básicas para la gestión de proyectos.

Gestión de proyectos

Curso de Formación Complementaria 2015/16 Trabajo Fin de Grado /Diseño Gráfico

Gestión de Oportunidades

LMS: Manual de la familia

ÍNDICE 1. INTRODUCCIÓN PARTICIPANTES Participantes por sector Participantes por edad... 6

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Transcripción:

UNIVERSIDAD DE GRANADA E.T.S. de Ingenierías Informática y de Telecomunicación Departamento de Ciencias de la Computación e Inteligencia Artificial Inteligencia de Negocio Guión de Prácticas Práctica 1: Análisis Predictivo Empresarial Mediante Clasificación Curso 2015-2016 Cuarto Curso del Grado en Ingeniería Informática

Práctica 1 Análisis Predictivo Empresarial Mediante Clasificación 1. Objetivos y Evaluación En esta primera práctica de la asignatura Inteligencia de Negocio veremos el uso de algoritmos de aprendizaje supervisado de clasificación como herramienta para realizar análisis predictivo en la empresa. En ella el alumno adquirirá capacidades para abordar problemas reales donde la minería de datos puede aportar valor en forma de conocimiento para ayudar en la toma de decisiones para gestión empresarial. Concretamente, se trabajará con un conjunto de datos real sobre el que se emplearán diferentes algoritmos de clasificación (para su comparación) y a la luz del conocimiento descubierto se podrán concluir estrategias para resolver el problema. Para ello, se deberán crear informes de resultados y análisis lo suficientemente profundos para resultar de utilidad. La práctica se calificará hasta un máximo de 1,75 puntos, siendo posible obtener un punto resolviendo solo parte del ejercicio como se describe en la sección 3. Se valorará el acierto en los recursos de análisis gráficos empleados, la complejidad de los experimentos realizados, la interpretación del conocimiento extraído, la organización y redacción del informe, etc. 2. Descripción del Problema: Campaña de Marketing Directo por E-Mail Las campañas de venta de marketing constituyen una estrategia habitual para mejorar el negocio. Uno de los canales más habituales es el del correo electrónico, a través del cual la empresa ofrece información de sus productos a su cartera de clientes. Las empresas utilizan este modo de marketing directo para identificar segmentos de sus clientes y detectar patrones que hacen que estos clientes se interesen por la campaña. Trabajaremos con datos reales de marketing directo extraídos de la siguiente web: http://blog.minethatdata.com/2008/03/minethatdata-e-mail-analytics-and-data.html. 1

3 Tareas a Realizar 2 Los datos originales han sido procesados para facilitar las tareas a desarrollar en esta práctica. Esta nueva versión de los datos está disponible en la web de la asignatura. Se pretende obtener un modelo que prediga si un cliente visitará la página web de una tienda tras recibir una campaña publicitaria por email. Se dispone de las siguientes variables: Recency: meses desde la última vez que el cliente realizó una compra. History: cantidad gastada en el último año (en dólares USA). Mens: 1 si el cliente compró productos para hombre en el último año, 0 si no compró. Womens: 1 si el cliente compró productos para mujer en el último año, 0 si no compró. Zip Code: tipo de lugar de residencia del cliente (Urban, Suburban, o Rural). Newbie: 1 si el cliente es nuevo en los últimos 12 meses, 0 si no. Channel: canal de comprar usado por el cliente en el último año (Web, Phone o Multichannel). Segment: tipo de campaña publicitaria aplicada sobre el cliente según si recibió emails de productos para hombre, para mujer o no recibió ningún email. El objetivo no es solo obtener un modelo predictivo, sino detectar también estrategias que sirvan de apoyo a la toma de decisiones para enfocar mejor las campañas de marketing directo, por lo que interpretar el conocimiento extraído en los distintos modelos (cuando sea posible) es también relevante. 3. Tareas a Realizar La práctica consiste principalmente en que el alumno estudie el comportamiento de distintos algoritmos de clasificación mediante el diseño experimental apropiado y el análisis comparado de resultados. Además, también deberá extraer conclusiones a partir del conocimiento aprendido mediante estos algoritmos para comprender las relaciones entre las variables (también llamadas características o predictores) que favorecen que los clientes visiten la web tras la campaña publicitaria. El trabajo se realizará sobre la plataforma KNIME (http://www.knime.org), pudiéndose emplear nodos adicionales de extensiones tales como Weka, R o JFreeChart. Concretamente, se deberán resolver adecuadamente las siguientes tareas para obtener la máxima calificación de 1, 75 puntos: 1. Se considerarán dos representaciones del conocimiento distintas (por ejemplo, árboles y reglas) y dos algoritmos para cada representación, es decir, un total de cuatro algoritmos de clasificación. Se valorará la selección justificada de estos algoritmos en función de las características del conjunto de datos.

4 Entrega 3 2. Toda la experimentación se realizará con validación cruzada de 5 particiones. Para sustentar el análisis comparativo se emplearán tablas de errores, matrices de confusión y curvas ROC. 3. Todos los análisis de resultados serán comparativos, de forma que se estudien los pros y contras de cada representación o de cada algoritmo. El análisis no podrá reducirse a una simple lectura de los resultados obtenidos. El alumno deberá formular y argumentar hipótesis sobre las razones de cada resultado. En este problema, por qué el algoritmo X funciona mejor que el Y? Por qué la representación X presenta ciertas ventajas respecto a la Y? 4. Se probarán configuraciones alternativas de los parámetros de los algoritmos empleados justificando los resultados obtenidos. Por ejemplo, puedo evitar o paliar el sobreaprendizaje ajustando los parámetros? Puedo obtener modelos más fácilmente interpretables sin sacrificar excesiva precisión? 5. Se deberán analizar los datos con diferentes gráficas para comprender su naturaleza e influencia en el proceso de clasificación. 6. A la luz de este análisis, se deberá estudiar un procesado básico de los datos que mejore la predicción (por ejemplo, eliminar alguna característica por razón justificada, agrupar los valores posibles de una característica, convertir una característica categórica en varias binarias...). Deberán justificarse las acciones tomadas y analizar porqué determinado procesado funciona mejor en un determinado tipo de algoritmo. Si no se consigue mejorar la predicción, se podrán al menos describir los procesados que se han probado y los resultados obtenidos. 7. Basado en todo lo anterior, se deberán extraer conclusiones sobre los factores que determinan que un cliente visite la web tras una campaña publicitaria. Qué recomendaría al departamento de marketing para incrementar el éxito de la campaña? En función del conocimiento obtenido, qué estrategias de negocio cree que podría adoptar la empresa? Alternativamente, el alumno podrá optar por una calificación de hasta un punto, en cuyo caso solo necesitará emplear un algoritmo en cada tipo de representación (es decir, un total de dos) en la tarea 1 y no tendrá que realizar las tareas 4 y 6. 4. Entrega La fecha límite de entrega será el viernes 13 de noviembre de 2015 hasta las 9:00 de la mañana. La entrega se realizará a través de la web de la asignatura en https://decsai. ugr.es. En un único fichero zip se incluirá el árbol de directorios completo que contiene el proyecto de KNIME, la documentación de la práctica realizada en pdf y cualquier otro archivo que el alumno considere relevante. El nombre del archivo zip será el siguiente (sin

4 Entrega 4 espacios): P1-apellido1-apellido2-nombre.zip. La documentación tendrá el mismo nombre pero con extensión pdf. Es decir, la alumna María Teresa del Castillo Gómez subirá el archivo P1-delCastillo-Gómez-MaríaTeresa.zip. En el proyecto KNIME, todas las referencias a archivos de entrada o salida deberán referirse a direcciones dentro de esa carpeta, de forma que el proyecto sea autocontenido y resulte más cómodo de importar.