DIPLOMATURA: "Análisis de Datos para Negocios, Finanzas e Investigación de Mercados" Seminario: Introducción a Data Mining y Estadística Dictado: Sábado 13, 20,27 de Abril, 04 de Mayo en el horario de 9:30 a 12:30hs Que el alumno comprenda los conceptos fundamentales del Data Mining y la Estadística Computacional, sus aplicaciones y casos de éxito en diferentes negocios. Que el alumno adquiera importantes conceptos estadísticos que utilizará a lo largo de toda la Diplomatura Que el alumno pueda implementar los conocimientos teóricos adquiridos en el lenguaje de programación R. Conceptos de Data Mining y Estadística Computacional Conceptos de Modelos Matemáticos, Predictivos, de Segmentación, Supervisados, No Supervisados y Semi Supervisados. Estadística básica: frecuencias, variables, distribución normal, regresión y correlación. Implementación de las técnicas mencionadas en el punto anterior en scripts de R. Seminario: Taller de Programación en R Dictado: Sábado 11 y 18 de Mayo, 01 de Junio en el horario de 9:30 a 12:30hs Que el alumno se familiarice con el entorno de programación en la plataforma de Estadística Computacional y de Data Mining R. (www.r project.org) Que el alumno sea capaz de escribir programas básicos en R para solucionar problemas estadísticos sencillos. Que el alumno detecte la potencialidad que brinda esta plataforma y adquiera la experiencia suficiente para integrarlo a soluciones de problemas más complejos planteados en el transcurso de esta Diplomatura. Instalación y configuración de la plataforma R. Conexión a diversas bases de datos. Desarrollo de scripts básicos para solucionar problemas sencillos de estadística. Definición de Vectores, Matrices, Listas y Data Frames Estructuras de Control Gráficos en R.
Seminario: Modelos Predictivos 1: Redes Neuronales Dictado: Sábado 08,15 y 29 de Junio en el horario de 9:30 a 12:30hs Que el alumno comprenda en profundidad el concepto de Modelo Predictivo Que el alumno comprenda en profundidad el concepto de Redes Neuronales Artificiales y su comparación con las Redes Neuronales Humanas. Que el alumno reconozca las diferentes topologías de Redes Neuronales y sus diferentes aplicaciones de acuerdo el problema a resolver. Que el alumno pueda desarrollar con éxito un modelo predictivo aplicando Redes Neuronales Artificiales en un set de datos financiero. Comparación de Redes Neuronales Artificiales y Redes Neuronales Humanas Representación Matemática de una neurona artificial Descripción en detalle del algoritmo Perceptrón y Perceptrón Multicapa Descripción de diferentes topologías de Redes Neuronales Creación de Modelos predictivos aplicación Redes Neuronales, con la plataforma R y la plataforma RapidMiner. Seminario: Datawarehousing y ETL Dictado: Sábado 06, 13 y 20 de Julio en el horario de 9:30 a 12:30hs Que el alumno comprenda los conceptos básicos de un datawarehouse. Que el alumno comprenda los conceptos básicos de un proceso ETL. Que el alumno conozca los usos y aplicaciones de un sistema para toma de decisiones. Que el alumno reconozca las características del diseño de un modelo multidimensional y sus partes. Que el alumno entienda los usos de los sistemas OLAP, su aplicación y uso. Conceptos de datawarehousing y ETL Proceso ETL básico y sus partes Diseño de un datawarehouse: esquemas estrella y copo de nieve, jerarquías, medidas y medidas calculadas. Explotación de un datawarehouse. Características de los sistemas OLAP. Seminario: Algoritmos Genéticos y Pre procesamiento de Datos Dictado: Sábado 27 de Julio, 03 y 10 de Agosto en el horario de 9:30 a 12:30hs
Que el alumno reconozca la importancia de esta etapa en un proyecto de Data Mining para el éxito final del mismo. Que el alumno se familiarice con los algoritmos más utilizados para llevar a cabo la tarea de limpieza y pre procesamiento de los sets de datos que luego explorarán para generar modelos predictivos y de segmentación. Que el alumno pueda implementar las técnicas de Algoritmos Genéticos para mejorar la performance de sus modelos. Técnicas estadísticas para el pre procesamiento de datos Algoritmos Genéticos para la selección de variables Introducción a la Teoría de la Información Exploración de diversos sets de datos donde se aplicarán todas las técnicas aprendidas. Seminario: Modelos de Segmentación Dictado: Sábado 24 y 31 de Agosto, 07 de Septiembre en el horario de 9:30 a 12:30hs Que el alumno comprenda las diferencias entre modelos predictivos y descriptivos. Que el alumno reconozca los casos de aplicación en diferentes negocios de los modelos de segmentación. Que el alumno pueda comprender el funcionamiento de los algoritmos más utilizados para segmentaciones avanzadas. Que el alumno pueda interpretar resultados tanto analíticos como visuales de los modelos de segmentación. Que el alumno pueda desarrollar e implementar en R y Rapidminer diferentes modelos de segmentación. Que el alumno pueda generar reportes en base a los modelos desarrollados. Algoritmo K Means en R y Rapidminer Pre procesamiento de datos para modelos de segmentación Modelos de segmentación para Estudios de Mercado Modelos de segmentación para Detección de Anomalías y Fraudes Seminario: Modelos Predictivos 2: Árboles de Decisión Dictado: Sábado 14, 21 y 28 de Septiembre en el horario de 9:30 a 12:30hs Objetivo: Que el alumno reconozca los diferentes algoritmos de Árboles de Decisión como importantes modelos predictivos.
Que el alumno pueda utilizar los Árboles de Decisión como herramientas complementarias para detectar las variables más representativas dentro de un set de datos. Que el alumno pueda detectar en qué casos aplicar con éxito los Árboles de Decisión. Que el alumno pueda desarrollar e implementar Árboles de Decisión como modelos predictivos en diferentes problemas relacionados con Negocios y Estudios de Mercados a resolver. Que el alumno pueda interpretar y generar reportes a partir de resultados obtenidos tanto analíticos como gráficos. Presentación de los Árboles de Decisión como Modelos Predictivos. Árboles de Decisión con R y Rapidminer Estudio e implementación de los algoritmos: ID3, C4.5, Random Forest Exploración de set de datos reales. Seminario: Modelos Predictivos 3: Estadística y Análisis Bayesiano Dictado: Sábado 05, 19 y 26 de Octubre en el horario de 9:30 a 12:30hs Que el alumno pueda detectar las diferencias entre la Estadística Tradicional y la Estadística Bayesiana sin hacer hincapié en sus demostraciones matemáticas. Que el alumno comprenda la Estadística Condicional y sus aplicaciones. Que el alumno pueda utilizar la Estadística Bayesiana como una potente herramienta de modelos predictivos. Que el alumno reconozca los problemas cuando aplicar con éxito los Modelos Bayesianos. Que el alumno sea capaz de desarrollar, implementar e interpretar diferentes modelos bayesianos como herramientas predictivas. Presentación de la Estadística Condicional y Teorema de Bayes Estadística Bayesiana con R Inferencia Bayesiana Introducción a Redes Bayesianas Generación e Implementación de Modelos Predictivos con Estadística Bayesiana Seminario: Text Mining y Web Mining Dictado: Sábado 02, 09 y 16 de Noviembre en el horario de 9:30 a 12:30hs Que el alumno pueda utilizar los modelos predictivos y de segmentación aprendidos para explorar diferentes textos y páginas web.
Que el alumno reconozca las aplicaciones del Text Mining y Web Mining en diferentes negocios, como por ejemplo E Commerce y Marketing. Que el alumno tenga un importante panorama de las técnicas de Sentiment Analysis y Social Network Analysis. Que el alumno conozca diferentes plataformas de software para realizar estos estudios: R, Rapidminer, Gephi. Introducción a Text Mining y Web Mining Text Mining y Web Mining con R y Rapidminer Introducción a Sentiment Analysis con R Social Network Analysis con R y Gephi Exploración de diversos textos, sitios web, y redes sociales como Twitter para generar modelos predictivos y de segmentación. Seminario: Aplicación de Data Mining en Negocios Dictado: Sábado 23 y 30 de Noviembre, 07 y 14 de Diciembre en el horario de 9:30 a 12:30hs Que los alumnos reconozcan qué datos son aptos para utilizar en proyectos de Minería de Datos aplicada al área de negocios y cómo transformarlos en caso necesario. Que los alumnos identifiquen problemas potenciales de acuerdo a los datos disponibles. Que los alumnos desarrollen modelos a partir de datos crudos en base a una metodología estándar de Minería de Datos y sabiendo exactamente el porqué de cada paso. Que los alumnos evalúen los modelos desde un punto de vista estadístico y del negocio. Que los alumnos aprendan a trabajar con Powerhouse, una herramienta de DM diseñada para poner énfasis en la solución del problema más que en el tratamiento de los datos. La forma de los datos como modelo general de análisis Clusters Representatividad de los datos Relación entre variables Selección de variables Introducción a Powerhouse Desarrollo de proyectos