Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source

Documentos relacionados

Alessandro Chacón Ernesto Level Ricardo Santana

OpenNebula y Hadoop: Cloud Computing con herramientas Open Source. [Memoria del proyecto]

JORNADAS TÉCNICAS REDIRIS Gestión del parque de máquinas virtuales Xen con herramientas de software libre

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

ING. YURI RODRIGUEZ ALVA

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

toda la potencia de un Dedicado con la flexibilidad del Cloud

System Center. la plataforma para una gestión ágil de los entornos de TI IDG COMMUNICATIONS, S.A.

Estrategia de Cómputo en la Nube. Servicios en la Nube

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK.

Figura 1. Fuente: elaborada en el MSLab

Cloud Computing: Soluciones y Seguridad

Análisis de aplicación: Cortafuegos de la distribución clearos

BIG DATA. Jorge Mercado. Software Quality Engineer

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Alumno: Jorge Sordo Balbín Profesor: Luis Joyanes Aguilar Nº Expediente: Correo Electrónico:

Cloud Computing: Cloud híbrida y la solución de AWS

Instalación de sistemas operativos Ubuntu.

IV. Implantación del sistema.

Seminario. Cloud Computing. Granada, 20 al 22 de febrero de 2013

Informática en la nube. Susi Rodríguez

Experiencias Cloud en el CESGA Virtualización en entornos Cloud

Andrés Borrego Socio de OBICE

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft

Hadoop. Cómo vender un cluster Hadoop?

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO

El papel del Cloud Computing en BD & DS. Javier Cacheiro López jlopez@cesga.es

VIRTUALIZACIÓN DE SERVIDORES

Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service)

VDI Xen Server. Estés donde estés... preocúpate de encontrar una buena silla. Las tenemos todas conectadas a la nube.

CONFIGURACIONES DE ALTA DISPONIBILIDAD

Alternativas de un ISV para migrar sus productos a un entorno CLOUD Virtualización en entornos cloud

Preguntas y Respuestas.

Conectores Pentaho Big Data Community VS Enterprise

La virtualización de servidores, consiste en almacenar en un único servidor o clúster de servidores varios equipos virtuales de forma simultánea.

Análisis de aplicación: TightVNC

Dirección General de Educación Superior Tecnológica

SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP. Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano

Windows Server Hyper-V

Medellín, martes 27 de octubre del 2015

Instalación Hadoop. Guía para Debian y derivados

UT04 01 Máquinas virtuales (introducción)

Plataforma de expediente

UNIVERSIDAD PONTIFICIA DE SALAMANCA. Faculta de Informática

WINDOWS : COPIAS DE SEGURIDAD

Cloud Computing. Rodrigo Moreno Rosales DN-11

México, D.F., a 13 de Septiembre de 2012

Análisis de despliegue de una IaaS utilizando Openstack

CAS- CHILE S.A. DE I.

Cloud computing: El servicio de almacenamiento en la nube

III. INTRODUCCIÓN AL CLOUD COMPUTING

Instalación de XEN Información de XEN Qué es XEN? Componentes de XEN:... 2

Pruebas y Resultados PRUEBAS Y RESULTADOS AGNI GERMÁN ANDRACA GUTIERREZ

Documentación Información técnica de Servidores Cloud Infinity+

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

MODERNIZANDO PCN Y RECUPERACION DE DESASTRES UTILIZANDO VIRTUALIZACION Y LA NUBE

Almacenamiento virtual de sitios web HOSTS VIRTUALES

Cloud Computing Tendencias. Modelos. Posibilidades. Germán Cortés Lasso

Nuevas tendencias: Virtualización de computadores / servidores

Maquinas virtuales Conceptos Básicos

Global File System (GFS)...

Guía de uso del Cloud Datacenter de acens

Implantación de Cloud Computing en el Gobierno de Castilla-La Mancha

Renovación del Subsistema de Backup de Sistemas Distribuidos. Configuración y Políticas de Backup Actual

NEGOCIO. Industria de TI

Deduplicación. Tu negocio no puede quedarse en blanco. Céntrate en tu negocio. Déjanos la tecnología.

UNIVERSIDAD DE SAN MARTÍN DE PORRES Escuela Profesional de Ingeniería de Computación y Sistemas LABORATORIO DE BASE DE DATOS E BUSINESS INTELLIGENCE

Facultad Politécnica UNA Ing. Julio Paciello

ADMINISTRE CON EFICIENCIA SUS RECURSOS José Flavio Guerra Colorado MBA,PMP,ITIL.

Soluciones Wonderware en Cloud

GUÍA DOCENTE DE LA ASIGNATURA

Ventajas del almacenamiento de datos de nube

RAID. Redundant Array of Independent Disks. Rafael Jurado Moreno Fuente: Wikipedia

rutas e información relacionada con puntos de interés en la UDLAP. como los requerimientos de hardware y software establecidos.

Curso Universitario de Especialización en Cloud Computing (Titulación Universitaria + 8 ECTS) Titulación certificada por EUROINNOVA BUSINESS SCHOOL

Trabajo TP6 Sistemas Legados

Bechtle Solutions Servicios Profesionales

Making Business Flow. Presentación Cloud Computing. Especialistas en Innovación, Socios en Crear Cambio

GlusterFS. Una visión rápida a uno de los más innovadores sistema de archivos distribuido

Soluciones de virtualización en sistemas Linux:

CAPITULO 4. ANALISIS COMPARATIVO Y SELECCION DE LA PLATAFORMA EDUCATIVA.

Luis Caballero Cruz. Ingeniería Técnica Informática de Sistemas. Universidad de Sevilla

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

IES Abyla. Departamento de Informática. Sistemas Operativos

Windows Server 2012: Infraestructura de Escritorio Virtual

IaaS en los estudios de informática

VDI In a Box. Estés donde estés... preocúpate de encontrar una buena silla. Las tenemos todas conectadas a la nube.

Descripción. Este Software cumple los siguientes hitos:

Producto. Información técnica y funcional. Versión 2.8

El camino hacia Cloud Computing en UTE. Ing. Gabriel Laborda División Sistemas de Información - UTE

Mi primer servidor. Fernando Fernández Consultor Preventa HP ISS

CURSO: DESARROLLADOR PARA APACHE HADOOP

Suite Open Source de CRM y GroupWare Características Funcionales

Volumen. Jun HELPPEOPLE SCAN CLOUD Manual de Usuario de la Versión v s23. Elaborado por: Investigación y Desarrollo Helppeople Software

Modelo de Gobierno de Datos con SPARK

Cloud Computing. Lic. Guillermo Montenegro VicePresidente CPCIPC Octubre 2011

Transcripción:

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Francisco Magaz Villaverde Consultor: Víctor Carceler Hontoria Junio 2012

Contenido Introducción Qué es Cloud Compu5ng? IaaS: OpenNebula PaaS: Hadoop Aplicación Prác5ca 2

Cloud Computing 3

Cloud Computing Definición Paradigma computacional que pretende el uso compar5do de recursos (procesamiento, almacenamiento, servicios) a través de Internet (también redes privadas) de la forma más transparente posible para el usuario. 4

Cloud Computing Caracterís5cas principales Servicio bajo demanda Elas5cidad Pool de recursos Acceso por red Recursos compar5dos 5

Cloud Computing Ventajas Inconvenientes Escalabilidad Dependencia del proveedor Coste Localización de los datos Confiabilidad Protección de la información Integración Fiabilidad Rapidez de despliegue Cues5ones legales Simplicidad 6

Modelos de despliegue Público: Todos los recursos proporcionados por el proveedor del servicio. Híbrido: Unión de una nube pública y privada. Privado: Toda la infraestructura pertenece al usuario. 7

Modelos de servicio SaaS: SoVware como servicio Proporciona aplicaciones que serán u5lizadas directamente por el usuario. PaaS: Producto como servicio Proporciona Sistemas Opera5vos, herramientas específicas (ej.: SGBD) y de desarrollo. IaaS: Infraestructura como servicio Proporciona una infraestructura de computación. 8

Modelos de servicio 9

IaaS: OpenNebula 10

OpenNebula Solución Open Source (bajo licencia Apache v2) que permite implementar fácilmente infraestructuras Cloud Compu5ng privadas (también híbridas) según el modelo IaaS. Proyecto iniciado por la por la Universidad Complutense de Madrid en 2008. 11

OpenNebula Plataforma de Cloud Compu5ng escalable, segura y rápida de desplegar. Consiste en un sovware que permite desplegar máquinas virtuales sobre un pool de máquinas _sicas u hipervisores. Hipervisores soportados: Xen KVM VMWare 12

OpenNebula Pilares básicos Almacenamiento Repositorio de plan5llas Redes virtuales Manejo de máquinas virtuales Clústeres Usuarios y grupos API 13

OpenNebula Pilares básicos 14

OpenNebula Hoy en día Soporte comercial a través de la empresa C12G. Disponible en los repositorios oficiales de Debian, Ubuntu y OpenSuse. Uitlizado por Telefonica, FermiLab o el CERN. 15

PaaS: Hadoop 16

Hadoop Es un framework que permite el tratamiento distribuido de grandes can5dades de datos (del orden de peta bytes) y trabajar con miles de máquinas de forma distribuida. Inspirado en la documentación sobre MapReduce y Google File System publicada por Google. 17

Hadoop - Características Económico Escalable Eficiente Confiable 18

Hadoop - Aspecto clave Hadoop, en lugar de mover los datos hacia donde se hace el procesamiento, Hadoop mueve el procesamiento (Tasks) a donde están los datos. Esto reduce el tráfico de información a través de las redes. 19

Hadoop - Capas M a p R e d u c e : P r o c e s a m i e n t o d e l a información de forma distribuida. Hadoop Distributed File System (HDFS): Almacenamiento de todos los datos repar5éndolos entre cada nodo de la red Hadoop. 20

Hadoop - Capas 21

Hadoop Tipos de nodos NameNode: Almacena los metadatos del sistema de ficheros HDFS y donde se almacenan los bloques de datos. DataNode: Almacena los bloques de datos de HDFS. JobTracker: Ges5ona las tareas MapReduce eligiendo que nodo ejecuta cada una. TaskTracker: Ejecuta las tareas Map o Reduce siguiendo instrucciones del JobTracker. 22

Hadoop - MapReduce Map and Reduce es un algoritmo de la categoría divide y vencerás. Se basa en la programación funcional, en las funciones Map y Reduce de los lenguajes funcionales. Map(k1,v1) list(k2,v2) Reduce(k2, list (v2)) list(v3) 23

Hadoop - MapReduce MapReduce transforma una lista de clave/ valor en una lista de valores. Un ejemplo de aplicación: Contar palabras en un documento de entrada (ú5l para la indexación de ficheros) 24

Hadoop - MapReduce 25

Hadoop - HDFS Principal sistema de almacenamiento u5lizado por Hadoop. Crea múl5ples replicas de los bloques de datos y los distribuye entre los nodos de un clúster. Desde la perspec5va del usuario, HFS se muestra como un sistema de ficheros tradicional pudiendo llevar a cabo operaciones CRUD. 26

Hadoop - HDFS Recuperación antes fallos de hardware Acceso en streaming Grandes volúmenes de datos Coherencia simple Portabilidad 27

Hadoop - HDFS 28

Aplicación Práctica Despliegue de un Clúster Hadoop u5lizando OpenNebula con hipervisor Xen 29

Aplicación Práctica - Material Ordenador Barebone. Se ejecuta el hipervisor Xen controlado por OpenNebula. Hardware: Procesador Intel Core i3 con VT- x a 3,10 GHz. 8GB de memoria RAM. 1 TB de disco duro. Un Interfaz de red. SoVware: Debian Wheezy Xen 4.1 Mac- Mini: Una máquina virtual Debian corriendo en VMWare Fusion hará el rol de front- end de OpenNebula. Procesador Intel Core 2 Duo. (1 procesador para la máquina virtual) 2 GB de memoria RAM (512 MB para la máquina virtual) 350 GB de disco duro (15 GB para la máquina virtual) Un Interfaz de red. 30

Aplicación Práctica 31

Aplicación Práctica Principal hándicap: Limitaciones de una maqueta de laboratorio Aún así se ha podido desplegar las máquinas virtuales en OpenNebula. Sobre estas máquina virtuales (nodos del clúster Hadoop) se han ejecutado ejemplos de demo de tareas MapReduce. 32

Aspectos a destacar en el despliegue El inicio es di_cil ya que hay que integrar varios sistemas: Virtualización con OpenNebula Hadoop con OpenNebula Debido a la naturaleza Open Source de las tecnologías elegidas la documentación disponible es abundante y ú5l. Una vez desplegados y configurados los primeros nodos, los siguientes son más sencillos, siendo posible automa5zar dicho proceso. 33

En el mundo real Esta infraestructura implantada en un entorno real puede u5lizarse para: Indexación masiva de archivos. Almacenamiento de grandes volúmenes de datos con tolerancia a fallos. Minería de datos. 34

Posibles mejoras U5lización de redes virtuales. Uso de la contextualización. 35

Conclusiones Cloud Compu5ng no es solo una tendencia, es una realidad. Cuenta con el apoyo de grandes empresas (Amazon, Google, etc.) Las nubes privadas son las preferidas por las grandes empresas actualmente. Es posible desplegar y dar servicio a terceros mediante una infraestructura Cloud Compu5ng u5lizando herramientas Open Source. Existen mercados por explotar dentro de esta tecnología. 36

Gracias por su atención