EXPERTO EN DATA SCIENCE

POSTgrado Ingeniería EXPERTO EN DATA SCIENCE

Machine Learning (Aprendizaje Automático) Data Analytics Data Science RStudio Caret Storm Spark Random Forest IPython NumPy Recall F-Measure A/B Testing Active Learning Bloom Filters Hashing SVM Naïve Bayes Clustering Árboles de Decisión Ensembles Visualización de Datos Experto en Data Science El programa de Experto en Data science está orientado a profesionales que quieran dirigir y orientar su carrera hacia el campo del análisis de datos (Data science) en los nuevos entornos de Big data e Inteligencia de Negocio. Cada vez son más las empresas que necesitan profesionales cualificados para obtener valor de los datos que almacenan. Este programa dota al alumno de una formación teórica y práctica actualizada con los últimos métodos y técnicas en el campo del análisis de datos tanto en entornos de Big data como en aquellos con un menor volumen de datos. Dirigido a Profesionales y/o titulados en Ingeniería, Matemáticas o Estadística que desean orientar su carrera profesional hacia el análisis de datos en organizaciones para la Inteligencia de negocio, Marketing e Investigación. Titulados superiores o medios con interés en el mundo TIC.

Dirección CLAUSTRO Federico Castanedo Head of Data Science en Wise Athena. Federico Castanedo trabaja analizando cantidades masivas de datos con técnicas de machine learning en Wise Athena donde lidera un equipo de Data Scientists. Ha sido Investigador y Profesor en la Universidad de Deusto (2011-2013) y en la Universidad Carlos III de Madrid (2006-2011) donde obtuvo su doctorado. Desde el año 2002 ha trabajado como Ingeniero de software en varias empresas nacionales e internacionales. Es autor y co-autor de varios artículos científicos sobre técnicas de fusión de datos, redes de sensores visuales y machine learning. Ha sido investigador visitante en la Universidad de Stanford, California y actualmente también imparte clase en el programa Experto en Big data de U-tad. Profesorado Iván de Prado: CEO & Co-founder en DataSalt. Cesár de Pablo: Senior Data Scientist en Daedalus. Antonio Matarranz: Director Comercial en Daedalus. Alberto Ochoa: Senior Data Scientist en Grupo Zed. Pablo Fernández: Profesor Análisis de Datos en UCM. Borja Bergua: Profesor colaborador en U-tad. Jaime Zaratiegui: Senior Data Scientist en WiseAthena. Jon Ander Beracoechea: Senior Data Scientist en Synergic Partners. Ignacio Julio Marrero: Responsable de soluciones Big data en Grupo Zed. Alvaro Nolla: Profesor Adjunto en la UNIR y en U-tad. Marta Rosa Soto: Investigadora en ICIMAF.

PLAN DE ESTUDIOS Introducción Data science Diferencias con análisis estadístico tradicional Modelos de negocio y aplicaciones del análisis de datos Aspectos legales y regulatorios en el análisis de datos PLATAFORMAS DE COMPUTACIÓN DISTRIBUIDAS Introducción a Apache Hadoop y Map-Reduce. Ventajas Otros modelos de computación distribuida (Storm, Spark) Introducción a R y paquetes relevantes Interfaz de comandos de R y RStudio Configuración e instalación de paquetes Comandos estadísticos básicos en R Paquetes de R relevantes Caret, e1071, Data.table, Rpart, RandomForest INTRODUCCIÓN A PYTHON Entorno de desarrollo IPython Librerías relevantes: NumPy, Scikit-learn, Pandas Metodologías de diseño de aplicaciones de análisis de datos Distribución de los datos Conjuntos de Test, Train y Validation Métricas de evaluación Matrices de confusión (FP, TP, FN, TN) Métricas de precisión, Recall, F-Measure. Cross-validation, Overfitting. Curvas ROC, AUC Problemas comunes A/B testing Unbalanced data sets, Skew distributions, Under-sampling, Over-SampliNG Unsupervised learning. A/B Testing ACTIVE learning TÉCNICAS DE ALMACENAMIENTO de DATOS Almacenamiento en HDFS Almacenamiento en BBDD NoSQL Ventajas. Cuando son útiles MongoDB, CouchDB, Apache Cassandra Redis, Tokyo Cabinet, Neo4J Ejemplos de almacenamiento en BBDD NoSQL (MongoDB, Cassandra Tokyo, Redis, Neo 4j) PREPARACIÓN DE DATOS Limpieza y transformación de datos Cambios de escala, NaN, observaciones inexistentes Combinación de fuentes diversas de datos Pandas. Ejemplos con la librería Pandas de PythoN R. Ejemplos de preparación de datos con R Pig/Hive. Ejemplos de transformación de datos con Pig/Hive. INTRODUCCIÓN AL ANÁLISIS DE DATOS Diferencias análisis estadístico tradicional y aprendizaje automático Análisis estadístico Análisis estadístico descriptivo. Probabilidad e inferencia. Ejemplos con R Regresión lineal simple y logística Ejemplos con R Introducción al aprendizaje automático Métodos de ensembles Técnicas de aprendizaje supervisado Naïve Bayes, SVM. Redes neuronales. Árboles de decisión (ID3, Cart) Random forests U-tad se reserva el derecho a realizar cambios en el Plan de Estudios y en el profesorado presentado en este folleto para conseguir la actualización y mejora constante de sus programas de postgrado.

Técnicas de aprendizaje no supervisado. Clustering Sistemas de recomendación Collaborative Filtering y Content-based recommenders Análisis semántico y procesamiento del lenguaje natural Algoritmos aproximados y Stream MinINg Técnicas de hashing, Min-Hash, LSH. Bloom filters VISUALIZACIÓN Y REPORTING DE DATOS Técnicas de reducción de dimensiones (PCA, ICA; SVD) Visualizando y comunicando datos ( D3.js. Gaphviz, Jung, ggplot2 en R) Titulación Experto en Data science. Título propio emitido por la Universidad Camilo José Cela. Colaboran Datos Generales Duración 300 horas Fechas De octubre 2014 a mayo 2015 Horario, Formato Executive Viernes: 16 h. a 21 h. - Sábados: 9 h. a 14 h.

Parque Europa Empresarial Calle Playa de Liencres, 2 dupdo. Edificio Madrid 28290 Las Rozas, Madrid www.u-tad.com 902 50 49 48