Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!!

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!!"

Transcripción

1 Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!! Autor: Dr. Gabriel Guerrero Ref: Descripción: Una breve introducción al concepto de Conjuntos Distribuidos Resilientes como una abstracción para ofrecer mecanismos tolerantes a fallas (fault-tolerant abstraction) para el cómputo en memoria en una red (in-memory cluster computing), basada en las enseñanzas y sistemas desarrollados en la Universidad de California Berkeley en el laboratorio AMPLab (Algorithms Machines and People). Introducción En los años 2000 al 2006 se acelera la generación de contenido en Internet y se promueve ampliamente el uso de buscadores que ofrecen de forma casi instantánea una respuesta. Los grandes competidores de este mecanismo promueven la investigación, innovación y desarrollo de nuevos paradigmas para: 1) la extracción de contenido en los diferentes sitios de Internet, 2) el almacenamiento del contenido en varias máquinas conectadas en red, o "cluster", es decir el almacenamiento distribuido

2 3) el ordenamiento del contenido de forma óptima para la búsqueda, utilizando mecanismos de llave,valor "key-value", con Arboles Binarios Balanceados (BTree) 4) el procesamiento en varias máquinas conectadas en red, "cluster", con mecanismos distribuidos, es decir el cómputo distribuido 5) el estudio de mecanismos de utilización de los miles de millones de registros de contenido heterogéneo. Es decir, la minería de datos y análisis predictivo. Esto siguiendo los pasos clásicos de la investigación: Observar, Describir, Operar, Predecir Así surgen conceptos y sistemas como BerkeleyDB para la instrumentación de Arboles Binarios Balanceados (BTree), Google File System (GFS) para el almacenamiento distribuido, el marco de referencia Mapeo/Reducción (Map/Reduce Framework) de Google, el sistema Apache Hadoop y muchos más que hoy se denomina el ecosistema Hadoop. Así a partir del 2006, el mecanismo de procesamiento distribuido MapReduce se populariza como un mecanismo para simplificar enormemente el análisis en grandes volúmenes de datos almacenados en máquinas conectadas en red ("BigData analysis on large clusters"). Así surge el nuevo "Paradigma del Manejo de Grandes Volúmenes de Datos" ("BigData Paradigm") y con ello el surgimiento de desarrolladores y compañías que ofrecen "Soluciones maravillosas con Grandes Volúmenes de Datos que resuelven CASI TODO LO INIMAGINABLE, gracias al nuevo paradigma".

3 Sin embargo, dada la gran ebullición del mundo de Grandes Volúmenes de Datos y las promesas que casi todo lo podía hacer, los corporativos empezaron a solicitar cada día más soluciones a problemas complejos. Así se inicia una era de aplicaciones más complejas con varias etapas que requieren algoritmos más elaborados enfocadas al USO y en particular al aspecto PREDICTIVO con grandes volúmenes de datos. Por ejemplo, algoritmos de Aprendizaje automatizado (Machine Learning, ML) con varias etapas que requieren algoritmos iterativos. Es decir, que se realice un cálculo y que éste sea el dato inicial de otro cálculo y así sucesivamente. También se requieren aplicaciones que estudien las relaciones de datos, por ejemplo en las aplicaciones que surgen de redes sociales como LinkedIn un sitio web fundado en 2002, Twitter en 2006, Facebook en 2006 y otras. En este contexto se cuenta con la Teoría de Grafos y los sistemas de procesamiento de grafos (Graph processing) que requieren manejar miles de millones de datos y relaciones entre estos. Así mismo, las búsquedas iniciales se elaboran con más detalle y se necesitan mecanismos de Elaboración de Solicitudes (Queries) más complejos e iterativos, por lo que se requiere un lenguaje "SQL en los Grandes Volúmenes de Datos" (BigData SQL).

4 Estas características de los procesos de Grandes Volúmenes NO SE OFRECIAN en los desarrollos de los años , por lo que surgen grupos de investigadores de universidades que enfocan desde otro punto de vista la problemática BigData, alejados de los intereses de grandes grupos del BigData comercial como Google, Yahoo, Twitter, IBM, SAS, SAP, Cloudera, y todas las compañías que han surgido alrededor del BigData. Así surgen en febrero 2011, en particular en la Universidad de California en Berkeley un grupo de profesores y tesistas de doctorado que enfocan el problema del Almacenamiento y Computo Distribuido de Grandes Volúmenes desde una perspectiva diferente y se funda el Laboratorio AMPLab, ("Algorithms, Machines, and People") que tiene como objetivo convertir los datos en información ("turning data into information"). Entre los principales patrocinadores comerciales de inicio en 2011, se cuenta con: Google, SAP, Amazon.com, EBAY, HUAWEI, IBM, Intel, Microsoft, NetApp, NEC, VMware y Cloudera. En su sitio (" podemos leer: "For years, research in fields such as machine learning (ML), data mining, databases, information retrieval, natural language processing, and speech recognition have steadily improved their techniques for revealing the information lying within otherwise opaque datasets."

5 Durante varios años, la investigación en campos como el Aprendizaje Automático (ML), minería de datos, bases de datos, recuperación de información, procesamiento del lenguaje natural y reconocimiento de voz han mejorado constantemente sus técnicas para revelar la información que se encuentra inmersa en los conjuntos de datos, que de otra manera permanecería opaca. En el AMPLab se dan cita ciencias de la computación y dominios de aplicaciones con gran volúmenes de datos para abordar el problema del estudio analítico de Grandes Volúmenes de Datos ("Big Data analytics"). Sin embargo, tiempo atrás en ámbito de tesis doctorales ya se tenía un gran avance y así desde 2009 se tienen contribuciones por ejemplo en el aspecto de Administración de Recursos Compartidos de una red de computadoras o "cluster" y un sistema operativo que los administre, que se denomina MESOS. Por lo que en 2009 nace el proyecto de investigación SPARK en la Universidad de California en Berkeley, y que se declara como código abierto en 2010 y en junio de 2013 se integra como un proyecto de la organización Apache

6 Algunos datos de MESOS Leemos en su página "Mesos is a cluster management platform that manages distributed hardware resources into a single pool of resources that can be used by application frameworks to efficiently manage workload distribution for both batch jobs and long-running services" Mesos es una plataforma de gestión de clúster que gestiona distribuye los recursos de hardware en un único conjunto (pool) de recursos que pueden ser utilizados por los entornos de aplicaciones(frameworks) para gestionar de manera eficiente la distribución de la carga de trabajo tanto para los trabajos por lotes y como para los servicios de larga duración. Mesos permite el desarrollo y ejecución de sistema distribuidos con administración eficiente de recursos ("Develop and run resource-efficient distributed systems"). Características (Features) 1) Permite tener un nodo Maestro (master) duplicado con tolerancia a fallos utilizando ZooKeeper ("Fault-tolerant replicated master using ZooKeeper")

7 2) Escalabilidad a más de 10,000 nodos ("Scalability to 10,000s of nodes") 3) Aislamiento entre tareas con utilizando el mecanismo Linux Containers ("Isolation between tasks with Linux Containers") 4) Planificación de multi-recursos, teniendo en cuenta la memoria y el CPU ("Multi-resource scheduling, memory and CPU aware") 5) Interfaces de programación (APIs) en Java, Python y C ++ para el desarrollo de nuevas aplicaciones paralelas ("Java, Python and C++ APIs for developing new parallel applications") 6) Interfaz de Usuario basada en Web, que permite monitorear el estado del clúster ("Web UI for viewing cluster state")

8 Hoy existe un gran número de instituciones que utilizan Mesos, entre las más famosas tenemos a Twitter y otras: 1) Conviva: ( Conviva s real-time big data processing platform enables the delivery of a TV-quality experience over the Internet. Any network. Any device. Any time. 2) ebay. ( ebay es un sitio destinado a la subasta de productos a través de Internet. 3) Netflix. Netflix, Inc. es una empresa comercial americana de entretenimiento que proporciona mediante tarifa plana mensual streaming (flujo) multimedia (principalmente, películas y series de televisión) bajo demanda por Internet y de DVD-por-correo, donde los DVD se envían mediante Permit Reply Mail. 4) PayPal. PayPal es una empresa estadounidense cofundada por entre otros Peter Thiel y Elon Musk, independiente y perteneciente al sector del comercio electrónico por Internet que permite la transferencia de dinero entre usuarios que tengan correo electrónico, una alternativa al tradicional método en papel como los cheques o giros postales. PayPal también procesa peticiones de pago en comercio electrónico y otros servicios web, por los que cobra un porcentaje al vendedor. La mayor parte de su clientela proviene del sitio de subastas en línea ebay. 5) Vimeo. Vimeo es una red social de Internet basada en videos, lanzada en noviembre de 2004 por la compañía InterActiveCorp (IAC). El sitio permite compartir y almacenar videos digitales para que los usuarios comenten en la página de cada uno de ellos. Los usuarios deben estar registrados para subir videos, crear su perfil, cargar avatares, comentar y armar listas de favoritos.

9 En los sistemas de administración de Grandes Volúmenes (BigData) tenemos entre otros: 1) Cassandra es una base de datos distribuida de alta disponibilidad y desempeño con tolerancia a fallos. 2) Hypertable un sistema de distribuido de almacenamiento y procesamiento de datos estructurados y no estructurados de alto rendimiento y escalable Es un sistema de código abierto basado en el sistema propietario de Google BigTable.

10 El modelo de datos RDD y su instrumentación en un ambiente MESOS Desde el surgimiento del marco de referencia MapReduce se tiene un conjunto de aplicaciones de Grandes Volúmenes de Datos que requieren compartir datos en varias iteraciones entre cada una de éstas. En este modelo, la única forma es crear un archivo en disco. Este mecanismo no permite la construcción sencilla ni eficiente de algoritmos iterativos. En MapReduce, la única forma de compartir datos entre trabajos es el uso de memoria estable por lo que esto es muy lento. En este contexto y dado que hoy la memoria RAM (In-memory) es más accesible y se tienen equipos con gran capacidad de memoria RAM, se analiza utilizar la memoria RAM como un mecanismo para compartir datos. La RAM es de 10 a 100 veces más rápida que la red o el disco duro. Sin embargo, los conceptos de datos en Hadoop Distributed File Systems (HDFS) no la utilizan por lo que una área de innovación es la utilización de la memoria RAM para la construcción de sistemas distribuidos tolerantes a fallas que sean muy eficientes. Este es un reto donde se tienen experiencias pasadas como RAMCloud, Piccolo y otros modelos basados en actualización a nivel del registro (fine-grained). Estos modelos para lograr la tolerancia a fallas utilizan la técnica de replicación de datos en disco.

11 Reto: Cómo diseñar un concepto de memoria RAM distribuida que sea tolerante a fallas? Se define un concepto denominado Conjuntos Resilientes de Datos Distribuidos, (en inglés Resilient Distributed Datasets, RDD), que tiene limitaciones como: 1) NO PUEDE CAMBIARSE, es decir es inmutables 2) Es una colección particionada de registros 3) Solo se puede construir con transformaciones predefinidas que actúan sobre TODO el conjunto (coarse-grained), como un mapeo (map), un filtrado (filter) una unión (join), y otras transformaciones predefinidas dentro del modelo. 4) NO EXISTE replicación para ofrecer la tolerancia a fallas, sino se define un mecanismo de LINAJE (lineage) en donde se genera una bitácora (log) de las transformaciones que permitieron su creación. Se almacena el grafo de las transformaciones que se utilizaron para construir la partición del RDD que se perdió. Si fallara una partición del conjunto, entonces se re-ejecuta el cómputo cuando sea necesario para regenerar la partición perdida. Este es un modelo de almacenamiento distribuido con tolerancia a fallas que es general y que permite expresar otros modelos actualmente en uso de algoritmos paralelos. Por ejemplo, es posible unificar con el modelo RDD, los conceptos de BigData como los modelos de flujo de datos (Data flow models) MapReduce, Dryad, Pregel de Google, y otros más.

12 El sistema SPARK Para instrumentar el concepto de RDD, se genera un sistema denominado SPARK que tiene varias capas y en particular una biblioteca de programación API, con la filosofía del DryadLINQ con el lenguaje de programación SCALA. Recordemos que DryadLINQ es un ambiente de programación propuesto por Microsoft (ref: para escribir aplicaciones en paralelo con datos de gran volumen que se ejecutan en una red de PC. ("large-scale data parallel applications running on large PC clusters"). El ambiente consta de un motor de ejecución distribuida llamado Dryad ("distributed execution engine") y el lenguaje de solicitudes integrado (LINQ) ("Language Integrated Query"). El proyecto Dryad fue abandonado por Microsoft en 2011, para enfocar su estrategia de BigData en el proyecto Apache Hadoop. Una aplicación en el ambiente Dryad se modela como un grafo acíclico dirigido ("directed acyclic graph DAG"). El grafo DAG define el flujo de datos de la aplicación ("dataflow of the application"), en donde los vértices del grafo definen las operaciones que se llevan a cabo en los datos.

13 En SPARK se tiene un intérprete interactivo construido en base al intérprete de SCALA. Para realizar la operación o uso de un RDD se tienen dos conceptos: 1) el concepto de transformación que construye un nuevo RDD ("build new RDDs") 2) el concepto de acción en donde a partir de un RDD se realizan cálculos y se ofrecen resultados ("compute and output results") Un concepto fundamental en SPARK es el particionamiento de un RDD ("RDD's partitioning"), es decir el control de cómo se particiona a lo largo de los nodos ("layout across nodes") Otro concepto estratégico es su persistencia ("persistence"), es decir en donde se almacena si en la RAM, o en el disco, o en otro lado. Otros modelos de cómputo distribuido que pueden instrumentarse con SPARK

14 Por medio del concepto RDD es posible expresar modelos como 1) MapReduce, DryadLINQ. Para el procesamiento distribuido en HDFS 2) PREGEL. Para el procesamiento de grafos, el modelo de Google PREGEL 3) Iterative MapReduce. En el procesamiento iterativo Iterative MapReduce 4) Hive SQL. Para la instrumentación de un lenguaje SQL en BigData La gran ventaja de SPARK, es que estos modelos de cómputo distribuido de unifican y es posible MEZCLARLOS eficientemente para compartir los datos entre todos éstos de forma transparente. El trabajo de SPARK está inspirado en técnicas como: 1) RAMCloud, Piccolo, GraphLab, parallel DBs. Inconvenientes: Requieren escrituras al registro ("fine-grained"), por lo que se necesita la replicación de datos 2) Pregel, iterative MapReduce. Inconvenientes: Son modelos especializados que no facilitan la ejecución de queries arbitrarios o particulares 3) DryadLINQ, FlumeJava. Inconvenientes: Es un API que no permite compartir conjuntos de datos de forma eficiente entre varios queries iterativos 4) Nectar. Manejo automático de Datos y Computo en Centros de Datos ("Automatic Management of Data and Computation in Datacenters"). Inconvenientes: Se ofrece el cache de expresiones, pero solo en un sistema de archivos distribuido y no en HDFS.

15 En Nectar, los datos y su cómputo se tratan de manera indistinta. Los conjuntos de datos construidos por cómputos, se identifica de forma inequívoca por los programas que los generan. Estos conjuntos pueden regenerarse fácilmente a partir de los programas que los identifican. (ref: 5) PACMan. Parallel All-or-nothing Cache MANager, un sistema de cache en RAM para trabajos en paralelo ("an in-memory caching system for parallel jobs") desarrollado en AMPLab en la Universidad de Berkeley con la participación de Ion Stoica. Inconvenientes: Se tiene un manejo de memoria cache en HDFS, pero se escribe a disco duro (ref:

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

MÁSTER: MÁSTER EXPERTO BIG DATA

MÁSTER: MÁSTER EXPERTO BIG DATA MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster

Más detalles

Hadoop. Cómo vender un cluster Hadoop?

Hadoop. Cómo vender un cluster Hadoop? Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las

Más detalles

MÁSTER: MÁSTER DESARROLLADOR BIG DATA

MÁSTER: MÁSTER DESARROLLADOR BIG DATA MÁSTER: MÁSTER DESARROLLADOR BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los desarrolladores que quieran aprender a construir potentes aplicaciones

Más detalles

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 1: INTRODUCCIÓN www.formacionhadoop.com Índice 1 Por qué realizar el curso de desarrollador para Apache Hadoop? 2 Requisitos previos del curso 3 Bloques

Más detalles

Big Data con nombres propios

Big Data con nombres propios Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica Fundamentos Título de de Big la Data presentación utilizando MATLAB Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica 1 Agenda Qué es Big Data? Buenas prácticas en el manejo de memoria.

Más detalles

Capítulo 5. Cliente-Servidor.

Capítulo 5. Cliente-Servidor. Capítulo 5. Cliente-Servidor. 5.1 Introducción En este capítulo hablaremos acerca de la arquitectura Cliente-Servidor, ya que para nuestra aplicación utilizamos ésta arquitectura al convertir en un servidor

Más detalles

PINOT. La ingestión near real time desde Kafka complementado por la ingestión batch desde herramientas como Hadoop.

PINOT. La ingestión near real time desde Kafka complementado por la ingestión batch desde herramientas como Hadoop. PINOT Stratebi Paper (2015 info@stratebi.com www.stratebi.com) Pinot es la herramienta de análisis en tiempo real desarrollada por LinkedIn que la compañía ha liberado su código bajo licencia Apache 2.0,

Más detalles

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Francisco Magaz Villaverde Consultor: Víctor Carceler Hontoria Junio 2012 Contenido Introducción Qué es Cloud Compu5ng?

Más detalles

Microsoft SQL Server Conceptos.

Microsoft SQL Server Conceptos. Microsoft Conceptos. Microsoft 2005 es una plataforma de base de datos a gran escala de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP). La siguiente tabla muestra

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

FUENTES SECUNDARIAS INTERNAS

FUENTES SECUNDARIAS INTERNAS FUENTES SECUNDARIAS INTERNAS Las fuentes secundarias son informaciones que se encuentran ya recogidas en la empresa, aunque no necesariamente con la forma y finalidad que necesita un departamento de marketing.

Más detalles

Conectores Pentaho Big Data Community VS Enterprise

Conectores Pentaho Big Data Community VS Enterprise Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com info@stratebi.com Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community

Más detalles

Novedades en Q-flow 3.02

Novedades en Q-flow 3.02 Novedades en Q-flow 3.02 Introducción Uno de los objetivos principales de Q-flow 3.02 es adecuarse a las necesidades de grandes organizaciones. Por eso Q-flow 3.02 tiene una versión Enterprise que incluye

Más detalles

Mi Negocio en Línea. DESCRIPCIÓN y CONCEPTO DEL PRODUCTO

Mi Negocio en Línea. DESCRIPCIÓN y CONCEPTO DEL PRODUCTO DESCRIPCIÓN y CONCEPTO DEL PRODUCTO INTRODUCCIÓN A LA HERRAMIENTA MI NEGOCIO EN LINEA es una revolucionaria herramienta online para crear y administrar sitios Web. Está orientado a Pequeñas y Medianas

Más detalles

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl 1 Colección de Tesis Digitales Universidad de las Américas Puebla Morales Salcedo, Raúl En este último capitulo se hace un recuento de los logros alcanzados durante la elaboración de este proyecto de tesis,

Más detalles

CAPITULO 9. Diseño de una Base de Datos Relacional Distribuida

CAPITULO 9. Diseño de una Base de Datos Relacional Distribuida 9.1 Operaciones CAPITULO 9 Diseño de una Base de Datos Relacional Distribuida Las consultas distribuidas obtienen acceso a datos de varios orígenes de datos homogéneos o heterogéneos. Estos orígenes de

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

Global File System (GFS)...

Global File System (GFS)... Global File System (GFS)... Diferente a los sistemas de ficheros en red que hemos visto, ya que permite que todos los nodos tengan acceso concurrente a los bloques de almacenamiento compartido (a través

Más detalles

SAS Data Scientist. Plan de Formación

SAS Data Scientist. Plan de Formación SAS Data Scientist Plan de Formación www.sas.com/spain/formacion Juan Lorenzo, Director del Plan de Formación juan.lorenzo@sas.com formacion@sas.com Tel: +34 91 200 73 00 BIG DATA EL NUEVO RETO EN LAS

Más detalles

Informática 4º ESO Tema 1: Sistemas Informáticos. Sistemas Operativos (Parte 2)

Informática 4º ESO Tema 1: Sistemas Informáticos. Sistemas Operativos (Parte 2) 1. Qué es un sistema operativo?...2 2. Funciones de los sistemas operativos...2 3. Windows...2 3.1. La interfaz gráfica...2 3.2. La administración y los usuarios...3 3.3. El sistema de archivos...3 3.4.

Más detalles

Capitulo V Administración de memoria

Capitulo V Administración de memoria Capitulo V Administración de memoria Introducción. Una de las tareas más importantes y complejas de un sistema operativo es la gestión de memoria. La gestión de memoria implica tratar la memoria principal

Más detalles

Windows Server 2012: Infraestructura de Escritorio Virtual

Windows Server 2012: Infraestructura de Escritorio Virtual Windows Server 2012: Infraestructura de Escritorio Virtual Módulo 1: Application Virtualization Módulo del Manual Autores: James Hamilton-Adams, Content Master Publicado: 5 de Octubre 2012 La información

Más detalles

Asignación de Procesadores

Asignación de Procesadores INTEGRANTES: Asignación de Procesadores Un sistema distribuido consta de varios procesadores. Estos se pueden organizar como colección de estaciones de trabajo personales, una pila pública de procesadores

Más detalles

Presentación. 29/06/2005 Monografía de Adscripción 1

Presentación. 29/06/2005 Monografía de Adscripción 1 Presentación Alumno: Uribe, Valeria Emilce Profesor Director: Mgter. David Luis La Red Martínez. Asignatura: Diseño y Administración de Datos. Corrientes 2005. 29/06/2005 Monografía de Adscripción 1 MONOGRAFIA

Más detalles

Capítulo 1 Introducción a la Computación

Capítulo 1 Introducción a la Computación Capítulo 1 Introducción a la Computación 1 MEMORIA PRINCIPAL (RAM) DISPOSITIVOS DE ENTRADA (Teclado, Ratón, etc) C P U DISPOSITIVOS DE SALIDA (Monitor, Impresora, etc.) ALMACENAMIENTO (Memoria Secundaria:

Más detalles

acenswhitepapers Bases de datos NoSQL. Qué son y tipos que nos podemos encontrar

acenswhitepapers Bases de datos NoSQL. Qué son y tipos que nos podemos encontrar s Bases de datos NoSQL. Qué son y tipos que nos podemos encontrar Introducción Son muchas las aplicaciones web que utilizan algún tipo de bases de datos para funcionar. Hasta ahora estábamos acostumbrados

Más detalles

Introducción a las redes de computadores

Introducción a las redes de computadores Introducción a las redes de computadores Contenido Descripción general 1 Beneficios de las redes 2 Papel de los equipos en una red 3 Tipos de redes 5 Sistemas operativos de red 7 Introducción a las redes

Más detalles

1 GLOSARIO. Actor: Es un consumidor (usa) del servicio (persona, sistema o servicio).

1 GLOSARIO. Actor: Es un consumidor (usa) del servicio (persona, sistema o servicio). 1 GLOSARIO A continuación se definen, en orden alfabético, los conceptos básicos que se han abordado a lo largo del desarrollo de la metodología para la gestión de requisitos bajo la Arquitectura Orientada

Más detalles

Arquitectura de sistema de alta disponibilidad

Arquitectura de sistema de alta disponibilidad Mysql Introducción MySQL Cluster esta diseñado para tener una arquitectura distribuida de nodos sin punto único de fallo. MySQL Cluster consiste en 3 tipos de nodos: 1. Nodos de almacenamiento, son los

Más detalles

Big Data y BAM con WSO2

Big Data y BAM con WSO2 Mayo 2014 Big Data y BAM con Leonardo Torres Centro Experto en SOA/BPM en atsistemas ofrece una completa suite de productos Open Source SOA y son contribuidores de muchos de los productos de Apache, como

Más detalles

El ABC de Big Data: Analytics, Bandwidth and Content

El ABC de Big Data: Analytics, Bandwidth and Content Documento técnico El ABC de Big Data: Analytics, Bandwidth and Content Richard Treadway e Ingo Fuchs, NetApp, Noviembre de 2011 WP-7147 RESUMEN EJECUTIVO Las empresas entran en una nueva era en la que

Más detalles

SISTEMAS DE INFORMACIÓN I TEORÍA

SISTEMAS DE INFORMACIÓN I TEORÍA CONTENIDO: TIPOS DE SI: SISTEMAS DE AUTOMATIZACIÓN DE OFICINAS, GROUPWARE, SISTEMA DE WORKFLOW Material diseñado y elaborado por: Prof. Anna Cecilia Grimán SISTEMAS DE AUTOMATIZACIÓN DE OFICINAS Los Sistemas

Más detalles

CAPITULO IV. HERRAMIENTAS DE CÓDIGO ABIERTO

CAPITULO IV. HERRAMIENTAS DE CÓDIGO ABIERTO CAPITULO IV. HERRAMIENTAS DE CÓDIGO ABIERTO En la actualidad la mayoría de las grandes empresas cuentan con un sin número de servicios que ofrecen a sus trabajadores y clientes. Muchos de estos servicios

Más detalles

Descripción. Este Software cumple los siguientes hitos:

Descripción. Este Software cumple los siguientes hitos: WWWMONITORDBACOM Descripción Este Software cumple los siguientes hitos: a- Consola de Monitoreo b- Envío de Alertas (correo, SMS) c- Gestión de Eventos desatendidos (sea capaz ejecutar script de solución

Más detalles

Windows Server 2012: Identidad y Acceso. Módulo 2: Descripción General de Windows Server 2012 Remote Desktop Services.

Windows Server 2012: Identidad y Acceso. Módulo 2: Descripción General de Windows Server 2012 Remote Desktop Services. Windows Server 2012: Identidad y Acceso Módulo 2: Descripción General de Windows Server 2012 Remote Desktop Services. Manual del Módulo Autor: Andrew J Warren, Content Master Publicado: Septiembre 10 de

Más detalles

Semana de la Informática y la Tecnología. Laureate International Universities

Semana de la Informática y la Tecnología. Laureate International Universities Semana de la Informática y la Tecnología Laureate International Universities Herramientas Tecnológicas de Uso Libre en la Educación Superior Ing. Henry Llanos Carranza Propósito del Webinar Al finalizar

Más detalles

El presente documento describe la importancia que está tomando el cómputo distribuido en

El presente documento describe la importancia que está tomando el cómputo distribuido en INTRODUCCIÓN El presente documento describe la importancia que está tomando el cómputo distribuido en los sistemas de administración integral o empresarial. Con un prototipo particular, mostraremos como

Más detalles

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos. RAIDS MODO LINEAL Es un tipo de raid que muestra lógicamente un disco pero se compone de 2 o más discos. Solamente llena el disco 0 y cuando este está lleno sigue con el disco 1 y así sucesivamente. Este

Más detalles

Un primer acercamiento a la CMDB.

Un primer acercamiento a la CMDB. Un Versión primer 1.2 acercamiento a la CMDB. 20/07/2005 Un primer acercamiento a la CMDB. Versión 1.1 1.2 18/02/05 20/02/05 Fecha Jose Autores Carlos Manuel García Viejo García Lobato http://ars.viejolobato.com

Más detalles

http://www.statum.biz http://www.statum.info http://www.statum.org

http://www.statum.biz http://www.statum.info http://www.statum.org ApiaMonitor Monitor de Infraestructura BPMS Por: Ing. Manuel Cabanelas Product Manager de Apia Manuel.Cabanelas@statum.biz http://www.statum.biz http://www.statum.info http://www.statum.org Abstract A

Más detalles

BIGDATA EN LA EMPRESA

BIGDATA EN LA EMPRESA ITAM México D.F., 21 agosto 2015 BigData? No sólo es un cambio tecnológico, es una evolución empresarial y de los negocios. No cambia los procesos productivos de una empresa pero sí los complementa. BigData?

Más detalles

Web. Web Diapositiva 1

Web. Web Diapositiva 1 Web Servicio WorldWideWeb Historia de la Web URL Dominios Dominio de alto nivel Cómo funciona? Hipertexto e Hipervínculos Sitios Web y Páginas de Inicio Cómo identificar los hipervínculos? Navegador Web

Más detalles

Management del nuevo siglo. James W. Cortada

Management del nuevo siglo. James W. Cortada Management del nuevo siglo James W. Cortada Objetivos de la exposición Parte 1 (cap. 2) Después de estudiar la 1ª parte se debe estar en posibilidad de: 1. Saber qué son las olas de aprendizaje. 2. Cómo

Más detalles

Mineria de Grafos en Redes Sociales usando MapReduce

Mineria de Grafos en Redes Sociales usando MapReduce Mineria de Grafos en Redes Sociales usando MapReduce Jose Gamez 1 and Jorge Pilozo 1 Carrera de Ingeniería en Sistemas Computacionales Universidad de Guayaquil 1. Introduccion a la Problematica Recordemos

Más detalles

Estándares para el Uso de Herramientas de Desarrollo y Plataformas de Aplicaciones Web

Estándares para el Uso de Herramientas de Desarrollo y Plataformas de Aplicaciones Web Secretaría de Planificación Estratégica Oficina de Informática Estándares para el Uso de Herramientas de Desarrollo y Plataformas de Aplicaciones Web VERSIÓN 4 Julio 2009 Índice 1. Generalidades... 3 1.1

Más detalles

PLATAFORMA SPARK: CATAPULTA MACHINE LEARNING

PLATAFORMA SPARK: CATAPULTA MACHINE LEARNING PLATAFORMA SPARK: CATAPULTA MACHINE LEARNING Dr. Gabriel Guerrero www.saxsa.com.mx 29 de julio de 2015 Introducción La catapulta de Leonardo, una herramienta genial. Permite con poco esfuerzo enviar un

Más detalles

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo. GLOSARIO Actor: Un actor es un usuario del sistema. Esto incluye usuarios humanos y otros sistemas computacionales. Un actor usa un Caso de Uso para ejecutar una porción de trabajo de valor para el negocio.

Más detalles

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES agcastro@pragsis.com antoniogonzalezcastro.es @agonzaca linkedin.com/in/agonzaca

Más detalles

GUÍA DE APRENDIZAJE N 1 Herramientas de trabajo colaborativo

GUÍA DE APRENDIZAJE N 1 Herramientas de trabajo colaborativo SISTEMA INTEGRADO DE GESTIÓN GUÍA DE APRENDIZAJE Código: F004-P006-GFPI versión: 01 Proceso Gestión de la Formación Profesional Integral Procedimiento Ejecución de la Formación Profesional Integral GUÍA

Más detalles

Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014

Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014 Libere el conocimiento que vive en cualquier dato Mario Ochoa 10/09/2014 En qué se diferencian las empresas exitosas de la actualidad? Datos. Valor La innovación de tecnología acelera el valor Machine

Más detalles

System Center. la plataforma para una gestión ágil de los entornos de TI IDG COMMUNICATIONS, S.A.

System Center. la plataforma para una gestión ágil de los entornos de TI IDG COMMUNICATIONS, S.A. la plataforma para una gestión ágil de los entornos de TI System Center la plataforma para una gestión ágil de los entornos de TI Introducción En la actualidad son ya muchas las empresas que están experimentando

Más detalles

Cocinando con Big Data

Cocinando con Big Data Cocinando con Big Data Javier Sánchez BDM Big Data jsanchez@flytech.es 91.300.51.09 21/11/2013 Javier Sánchez 1 Agenda Qué es Big Data? Receta Punto de Partida Para qué Big Data? Conclusiones 21/11/2013

Más detalles

Qué es una página web?, qué conoces al respecto?, sabes crear una página

Qué es una página web?, qué conoces al respecto?, sabes crear una página Semana 13 13 Empecemos! Bienvenidos a una nueva sesión, llena de aprendizajes! En semanas anteriores estudiamos lo que son bases de datos, estructuras de datos y métodos de ordenamientos, todo lo cual

Más detalles

CURSO GESTIÓN DE REDES SOCIALES

CURSO GESTIÓN DE REDES SOCIALES CURSO GESTIÓN DE REDES SOCIALES CURSO GESTIÓN DE REDES SOCIALES Escuela de Comunicación El desarrollo de las redes sociales ha impactado no solamente en el comportamiento de las personas que se manifiesta

Más detalles

Software Computacional y su clasificación

Software Computacional y su clasificación Software Computacional y su clasificación Capítulo 5 El software En modo sencillo el software permite que las personas puedan contarle a la computadora cierto tipo de problemas y que ésta a su vez le ofrezca

Más detalles

CURSO: CURSO DESARROLLADOR HADOOP

CURSO: CURSO DESARROLLADOR HADOOP CURSO: CURSO DESARROLLADOR HADOOP Información detallada del curso www.formacionhadoop.com Este curso online está enfocado a los desarrolladores que quieran aprender a construir potentes aplicaciones de

Más detalles

El reto de las nuevas fuentes de información

El reto de las nuevas fuentes de información APENDICE No 6 El reto de las nuevas fuentes de información Natalia Paredes Suárez. Tesista en Publicidad. Universidad de Palermo. Buenos Aires-Argentina El ser humano es un ser social, tiene la necesidad

Más detalles

CAPÍTULO 3 VISUAL BASIC

CAPÍTULO 3 VISUAL BASIC CAPÍTULO 3 VISUAL BASIC 3.1 Visual Basic Microsoft Visual Basic es la actual y mejor representación del viejo lenguaje BASIC, le proporciona un sistema completo para el desarrollo de aplicaciones para

Más detalles

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN Tabla de Contenidos LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN... 1 Tabla de Contenidos... 1 General... 2 Uso de los Lineamientos Estándares...

Más detalles

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Clusters Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Introducción Aplicaciones que requieren: Grandes capacidades de cómputo: Física de partículas, aerodinámica, genómica, etc. Tradicionalmente

Más detalles

Infraestructura Tecnológica. Sesión 8: Configurar y administrar almacenamiento virtual

Infraestructura Tecnológica. Sesión 8: Configurar y administrar almacenamiento virtual Infraestructura Tecnológica Sesión 8: Configurar y administrar almacenamiento virtual Contextualización Como sabemos, actualmente los servicios y medios de almacenamiento de información son muy variados,

Más detalles

Características del software

Características del software Características del software Descripción general de Fierro Fierro resuelve la operatoria diaria y la problemática de librerías y editoriales. Fierro fue gestado por gente que conoce el mercado del libro,

Más detalles

Fundamentos de la Mercadotecnia

Fundamentos de la Mercadotecnia Fundamentos de la Mercadotecnia 1 Sesión No. 12 Nombre: La mercadotecnia virtual Objetivo de la sesión: Al concluir la sesión el alumno conocerá el uso y valor de la mercadotecnia virtual. Contextualización

Más detalles

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R índice Módulo A Unidad didáctica 1: Introducción a las Bases de Datos Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos 3 19 Módulo B Unidad didáctica 1: Fase de análisis de requisitos Modelo

Más detalles

CAPITULO IV CONCLUSIONES Y RECOMENDACIONES

CAPITULO IV CONCLUSIONES Y RECOMENDACIONES CAPITULO IV CONCLUSIONES Y RECOMENDACIONES VERIFICACIÓN DE OBJETIVOS El objetivo general del proyecto ha sido cumplido satisfactoriamente en la Unidad de Sistemas de PETROECUADOR, realizando el análisis

Más detalles

Análisis de sentimientos de tweets.

Análisis de sentimientos de tweets. Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

PRIMAVERA RISK ANALYSIS

PRIMAVERA RISK ANALYSIS PRIMAVERA RISK ANALYSIS CARACTERÍSTICAS PRINCIPALES Guía de análisis de riesgo Revisión del programa Plantilla de riesgo instantáneo Asistente para registro de riesgo Registro de riesgo Análisis de riesgo

Más detalles

BASE DE DATOS RELACIONALES

BASE DE DATOS RELACIONALES BASE DE DATOS RELACIONALES Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para implementar bases de datos ya

Más detalles

Estructura de Bases de datos. Leonardo Víquez Acuña

Estructura de Bases de datos. Leonardo Víquez Acuña Estructura de Bases de datos Leonardo Víquez Acuña Lenguajes de Bases de Datos Un sistema de bases de datos proporciona Un lenguaje de definición de datos para especificar el esquema de la base de datos

Más detalles

Visión General de GXportal. Última actualización: 2009

Visión General de GXportal. Última actualización: 2009 Última actualización: 2009 Copyright Artech Consultores S. R. L. 1988-2009. Todos los derechos reservados. Este documento no puede ser reproducido en cualquier medio sin el consentimiento explícito de

Más detalles

Estrategia de Backup para los Sistemas SAP R/3 GOBERNACIÓN DE CUNDINAMARCA

Estrategia de Backup para los Sistemas SAP R/3 GOBERNACIÓN DE CUNDINAMARCA Estrategia de Backup para los Sistemas SAP R/3 GOBERNACIÓN DE CUNDINAMARCA Versión del Documento: 1.0 Autor: Soporte Basis SYNAPSIS Bogotá D.C., Enero 25 del 2010 Estratégia de Backup Gobernación de Cundinamarca

Más detalles

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS 4 ARQUITECTURA DE DISTRIBUCIÓN DE DATOS Contenido: Arquitectura de Distribución de Datos 4.1. Transparencia 4.1.1 Transparencia de Localización 4.1.2 Transparencia de Fragmentación 4.1.3 Transparencia

Más detalles

MODERNIZANDO PCN Y RECUPERACION DE DESASTRES UTILIZANDO VIRTUALIZACION Y LA NUBE

MODERNIZANDO PCN Y RECUPERACION DE DESASTRES UTILIZANDO VIRTUALIZACION Y LA NUBE MODERNIZANDO PCN Y RECUPERACION DE DESASTRES UTILIZANDO VIRTUALIZACION Y LA NUBE Este material y todos y cada uno de los contenidos en él incorporados constituyen una adaptación de las conferencias de

Más detalles

Análisis de aplicación: Moon Secure AV

Análisis de aplicación: Moon Secure AV Análisis de aplicación: Moon Secure AV Este documento ha sido elaborado por el Centro de excelencia de software libre de Castilla La Mancha (Ceslcam, http://ceslcam.com). Copyright 2010, Junta de Comunidades

Más detalles

Beneficios estratégicos para su organización. Beneficios. Características V.2.0907

Beneficios estratégicos para su organización. Beneficios. Características V.2.0907 Herramienta de inventario que automatiza el registro de activos informáticos en detalle y reporta cualquier cambio de hardware o software mediante la generación de alarmas. Beneficios Información actualizada

Más detalles

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas: SISTEMAS DISTRIBUIDOS DE REDES 1. SISTEMAS DISTRIBUIDOS Introducción y generalidades La computación desde sus inicios ha sufrido muchos cambios, desde los grandes equipos que permitían realizar tareas

Más detalles

Software Libre para Aplicaciones de Big Data

Software Libre para Aplicaciones de Big Data Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! hope@aceptus.com Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 3: HADOOP CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Hadoop 1.1 Proyecto Hadoop 1.2 Conceptos de Hadoop 2 Cluster Hadoop 2.1 Demonios

Más detalles

PORTAL DE INTEGRACIÓN DE BANCOS DE INFORMACIÓN DISPERSOS A TRAVÉS DE WEB SERVICES Autor: Ing. Walther Antonioli Ravetto

PORTAL DE INTEGRACIÓN DE BANCOS DE INFORMACIÓN DISPERSOS A TRAVÉS DE WEB SERVICES Autor: Ing. Walther Antonioli Ravetto PORTAL DE INTEGRACIÓN DE BANCOS DE INFORMACIÓN DISPERSOS A TRAVÉS DE WEB SERVICES Autor: Ing. Walther Antonioli Ravetto Introducción: Sobre casi cualquier tema del quehacer humano que se aborde, existen

Más detalles

DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADÍSTICA. Oficina de Sistemas

DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADÍSTICA. Oficina de Sistemas DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADÍSTICA Oficina de Sistemas INFRAESTRUCTURA BASE DE DATOS Mayo de 2011 TABLA DE CONTENIDO 1. TIPO DE BASE DE DATOS... 3 2. BALANCEO DE CARGA PARA SERVIDORES

Más detalles

Análisis de aplicación: Virtual Machine Manager

Análisis de aplicación: Virtual Machine Manager Análisis de aplicación: Virtual Machine Manager Este documento ha sido elaborado por el Centro de Apoyo Tecnológico a Emprendedores bilib, www.bilib.es Copyright 2011, Junta de Comunidades de Castilla

Más detalles

CURSO PRESENCIAL: Apache Spark

CURSO PRESENCIAL: Apache Spark CURSO PRESENCIAL: Apache Spark Información detallada del curso www.formacionhadoop.com El curso se desarrolla en 2 semanas seguidas. Se trata de un curso formato ejecutivo que permite compaginar la formación

Más detalles

PROCEDIMIENTO PARA LA REALIZACION DE COPIAS DE SEGURIDAD (BACKUP)

PROCEDIMIENTO PARA LA REALIZACION DE COPIAS DE SEGURIDAD (BACKUP) Aprobado: 29/09/2014 Página: 1 de 6 1. OBJETIVO Garantizar el resguardo en forma segura de toda la información digital, que dentro del desarrollo de las funciones se considere documental e importante y

Más detalles

Qué ventajas presenta Google Drive para catedráticos y alumnos?

Qué ventajas presenta Google Drive para catedráticos y alumnos? Qué ventajas presenta Google Drive para catedráticos y alumnos? El almacenamiento en la nube es un recurso cada vez más útil e imprescindible; con esta herramienta podremos almacenar y compartir fotos,

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios

Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios Herramienta para Indicadores de Gestión Se ha dado cuenta de lo difícil que es conseguir que todos los miembros de su organización vean "la gran foto" y trabajen juntos para lograr los objetivos estratégicos

Más detalles

Ministerio de Educación Base de datos en la Enseñanza. Glosario

Ministerio de Educación Base de datos en la Enseñanza. Glosario Ministerio de Educación Base de datos en la Enseñanza. Glosario Instituto de Tecnologías Educativas 2011 Glosario Glosario GLOSARIO Archivo Un archivo es un elemento que contiene información y que a su

Más detalles

Windows Server 2012 Manejabilidad y automatización. Module 3: Adaptación del Administrador de servidores a sus necesidades

Windows Server 2012 Manejabilidad y automatización. Module 3: Adaptación del Administrador de servidores a sus necesidades Windows Server 2012 Manejabilidad y automatización Module 3: Adaptación del Administrador de servidores a sus necesidades Fecha de publicación: 4 de septiembre de 2012 La información contenida en este

Más detalles

Plataforma desarrollo Java Formación elearning tutorizada en castellano. Fabricante: Java Grupo: Desarrollo Subgrupo: Master Java

Plataforma desarrollo Java Formación elearning tutorizada en castellano. Fabricante: Java Grupo: Desarrollo Subgrupo: Master Java C/Comandante Zorita 4 28020 Madrid/ info@ceticsa.es 902 425 524 / 91 700 01 17 Plataforma desarrollo Java Formación elearning tutorizada en castellano JAVA00d Ciclo de formación en plataforma Java Curso

Más detalles

Nombre de producto. Dexon Workflow Manager

Nombre de producto. Dexon Workflow Manager Nombre de producto Dexon Workflow Manager EL PRODUCTO ADECUADO PARA LA AUTOMATIZACIÓN DE LAS ACTIVIDADES DE TRABAJO QUE SUSTENTAN LA ACTIVIDAD DE NEGOCIO DE SU ORGANIZACIÓN Y EL SEGUIMIENTO DE SUS PROCESOS

Más detalles

Big Data y Manejo de Datos Maestros

Big Data y Manejo de Datos Maestros Objetivos 1.- El alumno identificará el contexto, la problemática y utilizará diversas herramientas de Manejo de Datos Maestros. Esto permitirá formarse un criterio sobre cómo implementar un proyecto de

Más detalles

Por más insignificante que sea lo que debes hacer, esmérate en hacerlo lo mejor que puedas, como si fuera la cosa más importante

Por más insignificante que sea lo que debes hacer, esmérate en hacerlo lo mejor que puedas, como si fuera la cosa más importante Empecemos! En este tema puedes seguir aprendiendo y conociendo todo lo relacionado a la clasificación del software, sus funciones en el control de los dispositivos de la computadora y las diferentes aplicaciones

Más detalles