Programa Internacional Programa Certificado en Big Data A1
Introducción La revolución del Mundo Digital ha permitido que las personas encuentren un gran sinnúmero de información, en el cual el problema no radica en cómo obtener datos sino en qué hacer con ellos, por tal razón llega la ciencia de los datos o Big Data que se especializa en la manipulación, administración y análisis de gran información que no puede ser tratada con programas tradicionales. Gracias a esta nueva tecnología se busca interpretar datos de forma inteligente para la buena toma de decisiones a compañías que día a día trabajan con información para sus procesos internos y externos. Justificación Mediante este Programa Certificado el estudiante se le proporcionará los fundamentos de la analítica de datos, elementos predictivos, datos abiertos y el soporte de Big data, en el cual entenderán las técnicas y herramientas clave con mayor impacto que implementa grandes empresas en diferentes campos de acción: el periodismo de datos, ciudades inteligentes, internet de las cosas, salud, administración, etc. Objetivos Ofrecer al estudiante una aproximación global y práctica de Big Data, en el cual afiancen los conocimientos necesarios en el análisis y gestión de datos para su comprensión así como las herramientas y estrategias que le permitan entender y rentabilizar el uso de los Big Data. Conocer y Analizar las nuevas arquitecturas de Big Data (Hadoop/Spark/Map- Reduce) y sus modelos de Bases de Datos NO-SQL. Examinar grandes cantidades de datos de una variedad de tipos (big data) para descubrir patrones ocultos, correlaciones desconocidas y otra información útil.
Dirigido a Estudiantes o profesionales de ingeniería de sistemas o industrial, Marketing, Publicidad, administración, Estadísticas que desean adquirir las competencias para organizar información a partir del manejo de grandes volúmenes de datos en compañías. Metodología La metodología es eminentemente práctica, en el cual se cuanta con diferentes recursos herramientas para fomentar el proceso de aprendizaje: Clases Presenciales Virtuales: El docente explica ejercicios para desarrolla la temática y compartir con los estudiantes, asimismo interactúa en el ambiente de aprendizaje realizando preguntas y resolviendo las respuestas Recursos Educativos Digitales: Dentro del proceso formativo se presentan diversos materiales didácticos que contribuyen en la construcción del Conocimiento y aportan en actividades propuestas. Referencia en la Web: Se basa en el aprendizaje colaborativo a través de la gran información que se encuentra en la web que permiten afianzar y estructurar el conocimiento del participante. Talleres y Casos prácticos: Se proponen ejercicios y talleres para que el estudiante aplique lo analizado y comprendido en el Material y las Clases Presenciales Virtuales y profundice sobre los temas del Programa Internacional. Foros y Wikis: El estudiante cuenta con espacios de debate y retroalimentación, donde se genere y se construya una red de conocimiento en cada uno de las actividades que se proponen en el Proceso formativo. Tutor Virtual: Dentro del Proceso de Aprendizaje se presentan diversos expertos temáticos que estarán en el seguimiento continuo del estudiante para que realicen las actividades en cada unidad temática del Programa Internacional.
Plan de Estudios Módulo 1. Introducción a la Analítica Avanzada y Big Data Objetivo de aprendizaje: Familiarizar a los asistentes al curso con el concepto de analítica avanzada por medio de definiciones, estudios de caso y discusiones dirigidas y relacionadas con el desarrollo de productos basados en datos. Introducción al Big Data y a la minería de datos. Aplicaciones en el ámbito empresarial y científico Qué es Big Data? Los datos. Fuentes; Tratamiento. Aspectos legales del tratamiento del Big Data Las tecnologías Big Data El mercado del Big Data Las tres dimensiones de Big Data Volume, Velocity, Variety Introducción a Data science Fuentes y estructuras de datos Consideraciones para el almacenamiento Módulo 2. Programación en R Objetivo de Aprendizaje: Profundizar en los conceptos y aplicaciones para el desarrollo de habilidades de programación en R. Estructuras de Control en Programming with R Funciones Reglas de Alcance - Unión de símbolos Scoping Rules - Ejemplo de optimización Normas de Codificación Fechas y Horarios Actividad de Programación Práctica Reutilización del análisis
Módulo 3. Obtención de Datos Objetivo de Aprendizaje: Profundizar y ampliar los conocimientos de los asistentes en el proceso de obtención de información desde diferentes fuentes de información y enfocados a responder diferentes problemas de negocio. Obtención de la Motivación de Datos Datos Crudos y Procesados Componentes de Datos Ordenados Calidad de datos ETL (extract, transform, load) Monitoreo y revisión Descarga y Lecturas de Archivos (Excel, Xml, Json, MySQL) Almacenamiento de Datos (MySQL, HDF5, APIs,) Práctica con R Extracción desde MySQL Extracción desde HDF5 Extracción desde la Web Extracción desde APIs Extracción desde de otras fuentes Proyecto de obtención de datos Módulo 4. Limpieza y transformación de Datos Objetivo de Aprendizaje: Familiarizar a los asistentes con los procesos de limpieza y transformación de datos relevantes dentro de un proceso de desarrollo de productos basados en datos. Subconjunto y clasificación Resumen de datos Creación de nuevas variables Reajustar datos Gestión de marcos de datos Introducción
Gestión de marcos de datos Herramientas básicas Fusión de datos Practica para Limpieza y Elaboración de Datos Edición de variables de texto Expresiones Regulares Trabajando con fechas Obtención y limpieza de datos del proyecto del curso Módulo 5. Análisis Descriptivo y Exploratorio Objetivo de Aprendizaje: Presentar algunas técnicas de análisis descriptivo y exploratorio de datos relevantes dentro del proceso de entendimiento de la información y en el pre-procesamiento de ésta como insumo de un proceso analítico. Además Presenta algunas técnicas de visualización para la presentación de resultados de procesos de análisis de grandes conjuntos de datos. Introducción Libro: Análisis exploratorio de datos con R Libro: El arte de la ciencia de los datos Instalación y Configuración de R Principios de los gráficos analíticos Gráficos exploratorios Sistema de trazado en R Sistema de trazado Base Demostración Base Plotting Proyecto de Gráficos Analíticos y exploratorios Agrupación Jerárquica Agrupación K-Means Reducción de Dimensiones Trabajar con Color en R Plots Proyecto en Agrupación Jerárquica, Agrupación Dimensiones K-Means y Reducción de
Módulo 6. Análisis Interferencial de Datos (Machine Learning y Estadística) Objetivo de Aprendizaje: Profundizar en la presentación, tanto teórica como práctica, de técnicas de modelamiento derivadas de la estadística o de Machine Learning. Introducción al Análisis Interferencial de Datos (Probabilidad, funciones, condicionales, reglas, valores esperados, Modelos de Regresión) Actividad práctica con R Introducción al Practice Machine Learning Predicción Motivación Importancia relativa de los pasos Entrada y salida de errores de muestra Diseño del estudio de predicción Tipos de errores Característica de funcionamiento del receptor Validación cruzada Qué datos debe usar? Metodologías para predicción de datos (Careth Package, trees, Random Forests, Model Based Predictions and others) Módulo 7. Programación en Python Objetivo de Aprendizaje: Presentar los principales conceptos y aplicaciones en Python dentro del proceso de desarrollo de productos de datos. Estructura Python Funciones y Declaraciones condicionales en Python Bucles e interacción Listas y Diccionarios Entrada/ Salida En Archivos
Certificado El estudiante obtiene el Título de Certified Program in Big Data Data Science con la superación del 80% de cada uno los cursos/módulos que contiene el programa, en el cual se propone una serie actividades y ejercicios prácticos evaluativos. Información General Duración: 240 horas en Plataforma Académica certificando la Competencia laboral Titulación: Programa Internacional CERTIFIED PROGRAM BIG DATA DATA SCIENCE Formas de Pago y Financiación La Universidad de Catalunya te ofrece diferentes alternativas de pago, donde es más fácil estudiar, entre las opciones puedes: Tener la posibilidad de financiar el valor total o parcial de tu Diplomado sin necesidad de codeudor ni estudio crediticio. Tenemos convenios con Bancolombia y Pichincha para financiar hasta el 100% de tu matrícula. Pagos con Factura Correval, de contado, tarjeta de crédito, cesantías, pago por la empresa para agilizar tu proceso. Obtener descuentos por pronto pago y por cierre de inscripciones.