PROGRAMA FORMATIVO: DESARROLLADOR SPARK BIG DATA CLOUDERA

Documentos relacionados
PROGRAMA FORMATIVO: ANALISTA DE DATOS BIG DATA CLOUDERA

PROGRAMA FORMATIVO: ADMINISTRADOR BIG DATA CLOUDERA

PROGRAMA FORMATIVO: DESARROLLO PARA WINDOWS STORE APPLICATION CON VISUAL STUDIO (C#)

PROGRAMA FORMATIVO: VIRTUALIZACIÓN DEL DATA CENTER Y PLATAFORMAS DE RED CON VMWARE

PROGRAMA FORMATIVO: CONSULTOR OFICIAL SAP RECURSOS HUMANOS (HR)

PROGRAMA FORMATIVO: CMS Y E-COMMERCE

DATOS GENERALES DEL CURSO

PROGRAMA FORMATIVO: HERRAMIENTAS WEB 2.0

PROGRAMA FORMATIVO: RED HAT OPENSTACK

PROGRAMA FORMATIVO SAP ERP - CONSULTOR CONTABILIDAD ANALÍTICA

PROGRAMA FORMATIVO. MCSA Windows Server 2012

PROGRAMA FORMATIVO: GESTIÓN DE OFFICE 365 Y SOLUCIONES SHAREPOINT

PROGRAMA FORMATIVO: GESTIÓN DE OFFICE 365 Y SOLUCIONES SHAREPOINT

PROGRAMA FORMATIVO: SAP ERP - CONSULTOR COMPRAS

PROGRAMA FORMATIVO: USUARIO DE SOFTWARE OFIMÁTICO

PROGRAMA FORMATIVO: SAP ERP - CONSULTOR CONTABILIDAD FINANCIERA

PROGRAMA FORMATIVO: DESARROLLO DE APPS PARA IOS CON OBJETIVE C Y SWIFT

PROGRAMA FORMATIVO: SAP ERP - CONSULTOR VENTAS

PROGRAMA FORMATIVO Programación para dispositivos móviles Android

PROGRAMA FORMATIVO: ARQUITECTO DE SOLUCIONES AMAZON WEB SERVICES Y ADMINISTRADOR DE SYSOPS

IFCT0109_SEGURIDAD INFORMÁTICA (RD 686/2011, de 13 de mayo modificado por el RD 628/2013, de 2 de agosto)

PROGRAMA FORMATIVO ADMINISTRACIÓN DEL IBM WEBSPHERE PORTAL SERVER Y CREACIÓN DE PORTALES WEB.

PROGRAMA FORMATIVO. Transformación Logística en un entorno de Industria 4.0

Anexo I PROGRAMA FORMATIVO CERTIFICACION CCNA

ANEXO I PROGRAMA FORMATIVO FORMACIÓN TÉCNICA Y PEDAGÓGICA PARA TELEFORMADORES

ANEXO I PROGRAMA FORMATIVO

Developer Training for Spark and Hadoop

Anexo I PROGRAMA FORMATIVO CREACIÓN DE VIDEOJUEGOS CON UNITY 3D

PROGRAMA FORMATIVO ASESOR TÉCNICO DE AUTOMOCION: PASSTHRU

PROGRAMA FORMATIVO DINAMIZACIÓN SOCIAL A TRAVÉS DE LAS TICS (EN ENTORNOS URBANOS VULNERABLES 1 ) Anexo I. Ministerio de Fomento, 2011.

Anexo I PROGRAMA FORMATIVO OPERACIONES BASICAS DE ADMINISTRACIÓN ORIENTADO A LAS PERSONAS CON DISCAPACIDAD

ANEXO I PROGRAMA FORMATIVO

PROGRAMA FORMATIVO Diseño mecánico asistido por ordenador (CAD Paramétrico)

PROGRAMA FORMATIVO DISEÑO, FABRICACIÓN, MONTAJE Y MANTENIMIENTO DE EQUIPOS ELECTRÓNICOS DE CONTROL Y DE POTENCIA

ANEXO I PROGRAMA FORMATIVO

Anexo I. PROGRAMA FORMATIVO Amadeus Básico

ACOMPAÑAMIENTO DE PERSONAS Y EQUIPOS DESDE EL ENFOQUE DEL COACHING

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop

Anexo I PROGRAMA FORMATIVO EMBELLECIMIENTO Y PERSONALIZACIÓN DE CUADROS DE BICICLETA

Anexo I PROGRAMA FORMATIVO

PROGRAMA FORMATIVO DISEÑO, FABRICACIÓN Y MONTAJE DE PLACAS DE CIRCUITO IMPRESO

Anexo I PROGRAMA FORMATIVO CERTIFICACION CCNA

Toda nuestra Experiencia a tu alcance

ANEXO I ACCION FORMATIVA: COMPETENCIAS DIGITALES

PROGRAMA FORMATIVO Habilidades Personales y Sociales para la AUTONOMÍA de las personas con discapacidad

Anexo I PROGRAMA FORMATIVO DESARROLLO WEB ADAPTATIVO CON WORDPRESS

OPERACIONES BASICAS DE TELEMARKETING CON LAS PERSONAS CON DISCAPACIDAD (FORMACIÓN PRELABORAL)

PROGRAMA FORMATIVO Instalación de sistemas específicos de acondicionamiento y aislamiento, térmico y acústico, en edificios

PROGRAMA FORMATIVO: COMPETENCIAS DIGITALES AVANZADAS

PROGRAMA FORMATIVO MONTAJE Y PUESTA A PUNTO DE IMPRESORAS 3D

Toda nuestra Experiencia a tu alcance

PROGRAMA FORMATIVO SISTEMAS CAD/CAM PARA EL MODELADO 3D Y PROTOTIPADO APLICADOS A JOYERÍA

PROGRAMA FORMATIVO: COMPETENCIAS DIGITALES BÁSICAS

CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN.

PROGRAMA FORMATIVO Aplicaciones BIM (Building information modeling) para Obra Civil

PROGRAMA FORMATIVO: BIG DATA DEVELOPER CON CLOUDERA APACHE HADOOP

Anexo I PROGRAMA FORMATIVO

MÁster en Data Science y Arquitectura Big Data_ DURACIÓN: 248 HORAS

PROGRAMA FORMATIVO: INSTALACIÓN DE REDES DE TECNOLOGÍA FTTH

CURSO DE APACHE SPARK_

PROGRAMA FORMATIVO Herramientas Web 2.0 aplicadas a la gestión y comercialización de empresas

Anexo I PROGRAMA FORMATIVO OPERARIO DE MONTAJES DIVERSOS EN PROCESOS INDUSTRIALES

MÁSTER: MÁSTER BIG DATA ANALYTICS

PROGRAMA FORMATIVO Analista de Big Data y Científico de Datos

PROGRAMA FORMATIVO Revitalización Comercial y Asociativa a través de Entornos Multimedia

PROGRAMA FORMATIVO ESPECIALISTA EN ACCESIBILIDAD UNIVERSAL PARA FORMADORES DE LA CONSTRUCCIÓN

MÁSTER: MÁSTER EXPERTO EN BIG DATA

PROGRAMA FORMATIVO. Managers de automoción 4.0: estrategia y conocimiento de la transformación digital

PROGRAMA FORMATIVO. Básico de prevención de riesgos laborales

Anexo I PROGRAMA FORMATIVO OPERARIO DE MONTAJES ELECTRICOS Y ELECTRONICOS EN PROCESOS INDUSTRIALES

PROGRAMA FORMATIVO PREVENCIÓN DE RIESGOS LABORALES PARA PERSONAS CON DISCAPACIDAD

Anexo I PROGRAMA FORMATIVO LOCUCIÓN Y DOBLAJE DE PIEZAS AUDIOVISUALES

Anexo I PROGRAMA FORMATIVO AGROECOLOGÍA EMPRENDEDORA: HORTICULTURA Y PROCESAMIENTOS DE PRODUCTOS ECOLÓGICOS

PROGRAMA FORMATIVO. Software de diseño para la industria de carpintería y mueble

ANIMACION ESTIMULATIVA CON PERSONAS DEPENDIENTES

Anexo I PROGRAMA FORMATIVO TAREAS DE LIMPIEZA EN EDIFICIOS Y LOCALES

PROGRAMA FORMATIVO Inglés preparatorio para prueba de acreditación oficial de nivel A2

Anexo I PROGRAMA FORMATIVO OPERACIONES BASICAS DE HOSTELERÍA ORIENTADAS A LAS PERSONAS CON DISCAPACIDAD

PROGRAMA FORMATIVO BUQUES DE RO-RO Y DE PASAJE

PROGRAMA FORMATIVO INTEGRACIÓN Y USOS EDUCATIVOS DE LA WEB 2.0 EN TELEFORMACIÓN: E-LEARNING 2.0. Fecha:30/07/10

CURSO: CURSO APACHE SPARK

PROGRAMA FORMATIVO: DESARROLLO DE APLICACIONES SHAREPOINT CON VISUAL STUDIO

ANALISTA PROGRAMADOR COBOL PLANES DE FORMACIÓN DIRIGIDOS PRIORITARIAMENTE A TRABAJADORES OCUPADOS

Lanbide ANEXO I PROGRAMA FORMATIVO TÉCNICO DE MECANIZADO EN CAM. Euskal Enplegu Zerbitzua Servicio Vasco de Empleo

ACOMPAÑAMIENTO DE PERSONAS Y EQUIPOS DESDE EL ENFOQUE DEL COACHING

PROGRAMA FORMATIVO RUSO GESTIÓN COMERCIAL

CURSO ONLINE: ARQUITECTURAS BIG DATA

Anexo I. PROGRAMA FORMATIVO Formación de acceso a certificados de profesionalidad nivel 1: Tareas básicas en la atención domiciliaria

PROGRAMA FORMATIVO LA APLICACIÓN DE LAS TECNOLOGÍAS DE LA INFORMACIÓN Y DE LA COMUNICACIÓN EN EL SERVICIO DE AYUDA A DOMICILIO

PROGRAMA FORMATIVO. Formación para la obtención del certificado de marinero de puente

Objetivos y Temario CURSO MySQL 5

ANEXO III ACCION FORMATIVA: IDIOMAS - INGLES

ANEXO I PROGRAMA FORMATIVO

PROGRAMA FORMATIVO RESTAURACIÓN ENERGÉTICA DE FACHADAS

PROGRAMA FORMATIVO Desarrollo de aplicaciones Web con PHP y MySQL

PROGRAMA FORMATIVO Administrador Big Data Cloudera Apache Hadoop

PROGRAMA FORMATIVO PREVENCIÓN Y CONTROL DE LEGIONELOSIS

PROGRAMA FORMATIVO DE LA ESPECIALIDAD FORMATIVA

Transcripción:

PROGRAMA FORMATIVO: DESARROLLADOR SPARK BIG DATA CLOUDERA Julio 2017

DATOS GENERALES DEL CURSO 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES Área Profesional: DESARROLLO 2. DESARROLLADOR SPARK BIG DATA CLOUDERA 3. Código: IFCD25 4. Nivel de cualificación: 3 5. Objetivo general: Introducir y procesar datos en un clúster Hadoop utilizando las herramientas y técnicas más actuales tales como Spark (incluyendo Spark Streaming y Spark SQL), Flume, Kafka y Sqoop. 6. Prescripción de los formadores: 6.1. Titulación requerida: Titulación universitaria u otros títulos equivalentes, o capacitación profesional equivalente acreditada por el fabricante. El formador deberá estar homologado como instructor en la correspondiente tecnología especifica del fabricante y contar con todas las certificaciones de la especialidad a impartir vigentes y actualizadas. 6.2. Experiencia profesional requerida: Experiencia Profesional de al menos 12 meses en la ocupación relacionada con la especialidad a impartir, excluyendo la experiencia docente. 6.3. Competencia docente: Será necesario tener experiencia metodológica o experiencia docente contrastada de 500 horas de formación en especialidades relacionadas con la especialidad a impartir. 7. Criterios de acceso del alumnado: 7.1. Nivel académico o de conocimientos generales: Título de FP Grado superior, bachillerato. Cuando el aspirante al curso no posea el nivel académico indicado, demostrará conocimientos suficientes a través de una prueba de acceso. Se requiere inglés a nivel de lectura, conocimientos de programación, sistemas operativos e informática. 8. Número de alumnos: Máximo 25 participantes para cursos presenciales. 9. Relación secuencial de módulos: Módulo 1: Introducción a SQL 2

Módulo 2: Programación Python Módulo 3: Programación Scala Módulo 4: Cloudera Desarrollador Spark & Hadoop. 10. Duración: Horas totales: 175 Distribución horas: Presencial: 175 11. Requisitos mínimos de espacios, instalaciones y equipamiento. 11.1. Espacio formativo: Aula de Informática: Superficie: 45 m 2 para grupos de 15 alumnos (3 m 2 por alumno). Cada espacio estará equipado con mobiliario docente adecuado al número de alumnos, así mismo constará de las instalaciones y equipos de trabajo suficientes para el desarrollo del curso. 11.2. Equipamiento: Los equipos tendrán unas características equivalentes a las enumeradas a continuación, consideradas siempre como mínimas: Un ordenador por alumno y uno para el profesor con las siguientes características mínimas: - CPU: procesador Intel Core i5 de 6 generación o similar. - 16 GB de RAM - Disco duro de 500 GB - Lector-grabador DVD - Tarjeta de red 10/100/1000 Mbps - Teclado multimedia USB - Ratón sensor óptico USB de 2 botones y rueda de desplazamiento. - Monitor color de 17 TFT - Licencia de sistema operativo WINDOWS 7 o similar. - Licencia de software antivirus. - Licencias del software del fabricante necesario para la impartición del curso. Conectividad a Internet. Impresora láser con conexión a red. Pantalla y cañón de proyección. A los alumnos se le proporcionará la documentación oficial de CLOUDERA necesaria para el seguimiento del curso. Las instalaciones y equipamientos deberán cumplir con la normativa industrial e higiénico-sanitaria correspondiente y responderán a medidas de accesibilidad universal y seguridad de los participantes. En el caso de que la formación se dirija a personas con discapacidad se realizarán las adaptaciones y los ajustes razonables para asegurar su participación en condiciones de igualdad. 3

12. Requisitos oficiales de los centros Para la impartición de esta especialidad formativa el Centro ha de estar homologado como: Centro de formación oficial del fabricante bajo la figura de Cloudera Authorized Training Center de Cloudera. 13. Evaluación del aprendizaje Se llevará a cabo una evaluación continua y sistemática durante el proceso de aprendizaje y al final del mismo para comprobar si los alumnos han alcanzado los objetivos establecidos en cada módulo y, por consiguiente, han realizado el curso con el aprovechamiento requerido. 14. Certificación oficial del fabricante La ejecución y financiación del programa formativo incluye la presentación de los alumnos que han realizado el curso con aprovechamiento a los exámenes para obtener la certificación oficial del fabricante, que gestionará el centro y que en ningún caso supondrá coste alguno para el alumno. En concreto, para esta acción formativa está incluido el siguiente examen de certificación oficial o el que lo sustituya actualizado al momento de su impartición: CCA Spark and Hadoop Developer MÓDULOS FORMATIVOS Módulo 1 INTRODUCCIÓN A SQL Adquirir los conocimientos necesarios para entender las características y beneficios de las bases de datos relacionales, el lenguaje, los datos y tipos de columna, aprender a crear un diseño de base de datos con una estructura eficiente y ser capaz de extraer información de bases de datos de base con el comando SELECT, solucionar problemas de sintaxis y entender las advertencias y los errores típicos. Ser capaz de agrupar datos de consulta con la agregación, conectar datos de múltiples filas de la tabla con JOIN, realizar anidados de subconsultas y utilizar funciones simples. Duración: 50 horas Contenidos teórico prácticos: - Introducción - Base de datos básica - Estructura de base de datos - El uso de SQL - Creación de una base de datos - Las consultas básicas - Mantenimiento de la Base de datos 4

- Copia de tablas y modificaciones de columnas - Índices y restricciones - Eliminar o modificar filas de la tabla de datos - Funciones: uso y tipos - Funciones específicas - Joins - Exportación de datos, consultas y utilidades - Importación de datos y de archivos de datos - Importación con sentencias y utilidades - Subconsultas generales y básicas - Subconsulta no correlacionada y correlacionada - Tipos de subconsultas - Modificación de la tabla con subconsultas - Motores de almacenamiento - Creación de Vistas - Transacciones - Recuperación de Metadatos - Conclusiones Módulo 2 PROGRAMACIÓN PYTHON Aprender a definir, asignar y acceder a variables, conocer los tipos de colecciones más usadas, diferencias y cómo utilizarlas. Aprender a controlar el programa de flujo utilizando las sentencias condicionales, bucles, iteración y manejo de excepciones y definir y usar funciones tanto nombradas como anónimas (Lambda). También se aprenderá cómo organizar el código en módulos separados y cómo utilizar las funciones importantes de las bibliotecas estándar de Python, incluyendo soporte de expresiones matemáticas y expresiones regulares. Duración: 30 horas Contenidos teórico-prácticos: - Introducción a Python - Variables en Python - Colecciones en Python - Flow Control en Python - Estructura de Programación en Python - Trabajo con librerías en Python - Conclusión Módulo 3 PROGRAMACIÓN SCALA Aprender cómo utilizar las funciones del lenguaje, tales como tipos de datos, colecciones y control de flujo; cómo implementar soluciones de programación funcionales en Scala y cómo trabajar con las clases 5

Scala, paquetes y librerías Duración: 30 horas Contenidos teórico prácticos: - Introducción - Scala Overview - Introducción a Scala - Scala s Role in Distributed - Procesamiento de Datos - La motivación de Scala - Básicos Scala - Trabajo con tipos de datos - Agrupación de datos - Flow Control en Scala - Uso y creación de librerías - Conclusión Módulo 4 CLOUDERA DESARROLLADOR PARA SPARK & HADOOP Utilizar Sqoop y carga real-time de datos con Flume. Procesar los datos en cluster con Apache Spark, presentar datos estructurados como tablas en Impala y Hive, elegir el mejor formato de almacenamiento para diferentes patrones de uso de datos.. Duración: 65 horas Contenidos teórico-prácticos: - Introducción - Introducción a Apache Hadoop y el ecosistema Hadoop - Archivos de almacenamiento de Apache Hadoop - Proceso de datos en un cluster de Apache Hadoop - Relación de datos importados con Apache Sqoop - Fundamentos de Apache Spark - Trabajar con RDDs - Agregación de datos en pares RDDs - Escritura y ejecución de aplicaciones de Apache Spark - Configuración de aplicaciones de Apache Spark - Procesos pararlelos en Apache Spark - Persistencia de RDD - Patrones comunes de proceso de datos en Apache Spark - DataFrames y Spark SQL - Procesamiento de mensajes con Apache Kafka - Captura de datos con Apache Flume - Integración de Apache Flume y Apache Kafka - Apache Spark Streaming: Introducción a DStreams - Apache Spark Streaming: Procesado de múltiples Batches - Apache Spark Streaming: Data Sources - Conclusión 6