Bases de Datos NoSql en Cloud Computing
|
|
|
- Pedro Flores Vidal
- hace 10 años
- Vistas:
Transcripción
1 Bases de Datos NoSql en Cloud Computing Adriana Martín1 Susana Chávez2, Nelson Rodríguez3, Adriana Valenzuela4, María Murazzo5 Departamento e Instituto de Informática - F.C.E.F. y N. - U.N.S.J. Complejo Islas Malvinas. Cereceto y Meglioli Rivadavia. San Juan [email protected] [email protected] [email protected] [email protected] [email protected] Resumen Las bases de datos NoSQL son sistemas de almacenamiento de información que no cumplen con el esquema entidad-relación. Mientras que las tradicionales bases de datos relacionales basan su funcionamiento en tablas, joins y transacciones. Las bases de datos NoSQL no imponen una estructura de datos en forma de tablas y relaciones entre ellas sino que proveen un esquema mucho más flexible. Las bases NoSQL son adecuadas para una escalabilidad realmente enorme, y tienden a utilizar modelos de consistencia relajados, no garantizando la consistencia de los datos, con el fin de lograr una mayor performance y disponibilidad. A esto se agrega el inconveniente de que no tienen un lenguaje de consulta declarativo, por lo que requiere de mayor programación para la manipulación de los datos. En general se pueden mencionar Sistemas NoSQL clasificados en cuatro categorías: Framework Map-Reduce (usado por aplicaciones que hacen procesamiento analítico online - OLAP), Por ejemplo Hadoop. Almacenamiento Clave-Valor (sistemas que tienden al procesamiento de transacciones online - OLTP), Por ejemplo: Google BigTable, Amazon Dynamo, Cassandra, Voldemort, HBase. Almacenamiento de Documentos Por ejemplo: CouchDB, MongoDDB, SimpleDB Sistemas de base de datos Gráficas.Por ejemplo: Neo4j, FlockDB, Pregel. Con respecto al almacenamiento en Columnas que en general son tratados como Sistemas NoSQL, no son más que una forma de organización de un sistema de base de datos relacional. Sin embargo por la alta performance para cierto tipo de aplicaciones son considerados como del tipo almacenamiento Clave-Valor. En resumen, para manipular enormes cantidades de información de manera muy rápida los Sistemas NoSQL trabajan mejor que los sistemas de base de datos tradicionales, sin embargo para muchísimas aplicaciones la solución está en las bases de datos tradicionales. Palabras clave: NoSql, Map- Reduce, Cloud Computing. Contexto El presente trabajo se encuadra dentro del área de Bases de Datos y Minería de Datos, y se enmarca dentro del proyecto de investigación Implantación de un ambiente de Cloud Computing para integración de recursos, el cual tiene como unidades ejecutoras al Departamento e Instituto de Informática PAGINA
2 de la FCEFyN de la UNSJ. Los trabajos iniciados en el citado proyecto tienden al desarrollo de aplicaciones sobre Cloud Computing, y almacenamiento de grandes cantidades de información y rápido acceso sobre el mismo Introducción Las bases de datos NoSQL surgen como una solución a los constantes requerimientos de procesamiento y análisis a gran escala de enormes cantidades de datos, y para los cuales los sistemas tradicionales de base de datos son insuficientes. El termino NoSQL ha evolucionado no para significar no lenguaje sql, sino para referirse a sistemas que no son DMBS (database management system) tradicionales. El framework MapReduce es una gran alternativa a los sistemas tradicionales. En base a este framework Google ha desarrollado Hadoop, un sistema open source usado ampliamente. Se caracteriza por: No existe un modelo de datos, los datos se almacenan en archivos HDFS (Hadoop Distributed File System). Los usuarios proveen las funciones específicas los datos usando el Framework MapReduce. Las funciones disponibles son: map(), reduce(), reader(), writer() y combine(). El sistema provee procesamiento de datos "glue" escalable y con tolerancia a fallos (Glue procesa los datos a través de las funciones garantizando la tolerancia a fallos). El almacenamiento Clave-Valor, está diseñado para el procesamiento de transacciones online (OLTP). Este tipo de aplicaciones son operaciones pequeñas sobre algunos datos de una base de datos masiva. Por esto, son mas simples Para ello suelen almacenar toda la información que puedan en memoria y están preparadas para escalar horizontalmente sin perder rendimiento. Si pretendemos desarrollar una aplicación que requiera la lectura/escritura de cantidades de datos y pueda dar servicio a millones de usuarios sin perder rendimiento, entonces debemos plantearnos el uso de una base de datos NoSQL. Las grandes redes sociales como facebook y twitter o el propio Google las utilizan como medio fundamental de almacenamiento de información. Se puede utilizar una base de datos NoSQL para almacenar toda la información de una aplicación para aquellas funcionalidades que requieren millones de consultas en tiempo real. Existe una gran variedad de bases de datos basadas en documentos NoSQL para clasificar la información en un formato estructurado, mientras afrontamos la estructura flexible de los puntos de datos individuales. Muchos entornos NoSQL también brindan apoyo para consultas Map-Reduce exhaustivas y para el procesamiento, lo que las hace ideales para el procesamiento de una gran cantidad de datos en un formato resumido. Líneas de investigación y desarrollo Afortunadamente existen varias bases de datos NoSql conocidas. Mientras todas ellas comparten muchas características, también hay algunas diferencias significativas Base de Datos Mongo DB Características Aplicabilidad C++Algunas características SQL (Query, index) binario maestro-esclavo Para queries dinámicasno para Map/Reduce Cuando necesitas CouchDB con muchos cambios Para muchas PAGINA
3 Riak CouchD B Redis Sharding Permite ejecutar script Rendimiento sobre características En 32bits sólo 2.5 Gb GridFS para almacenar BigData Indexing geoespacial Erlang y CTolerancia a fallos binario o HTTP/REST Pre y postcommits en JS y Erlang Map/Reduce en JS o Erlang Soporte objetos grandes Versión opensource y Enterprise Búsqueda Full text, indexing, con Riak Search Server Multireplicación ErlangProtocolo HTTP/REST bidireccional con detección de conflictos MVCC Versiones previas de documentos disponibles Necesita compactación de vez en cuando Soporta attachment Incluye librería JQuery C++Muy rápida estilo Telnet Bases de datos cosas que ahora se hacen con MySQL Estilo Cassandra pero sin su complejidad Escalabilidad, disponibilidad y tolerancia a fallos Para acumular datos que sólo cambian ocasionalmente con queries predefinidaspara sistemas que necesitan versionado Sistemas CRM Sistemas con replicación Para datos cambiantes almacenados en memoria (no de gran HBase Neo4J en memoria con backup en disco Sin disk-swap maestro-esclavo Clave-Valor, pero valores pueden ser List, Hashes, Sets, Transacciones tamaño)bases de datos de tiempo real Analíticas Stock prices Comunicación en tiempo real Billones de filas x millones de columnas HTTP/REST y Thrift Basada en Google Big Table Map/Reduce con Hadoop Mejor opción Optimizaciones para para queries en Map/ReduceAlm tiempo real acenamiento y Gateway Thrift análisis ficheros de alto de log rendimiento HTTP soporta XML, protobuf y binario Módulos para Cascading, Hive y Pig Shell basada en JRuby Rendimiento random-acces como MySQL Base de datos de grafos HTTP/REST o Funcionamiento standalone o embebido en Full ACID Lenguaje de queries patternmaching Web de administración incluida Path-finding algoritmos Para datos ricos interconectados estilo grafospara redes sociales, topologías de red PAGINA
4 Cassan dra Memba se Indexado de claves y relaciones Optimizado para lecturas Transacciones en API Scripts en Groovy Backup online, monitorización y alta disponibilidad en versión comercial AGPL Lo mejor de BigTable y Dinamo binario (Thrift) Tuneable para distribución o replicación Búsqueda por columnas o rango de claves Características BigTable Indices secundarios Escrituras más rápidas que lecturas Map/Reduce con Hadoop Erlang y CCompatible Memcached pero con persistencia y clustering memcached Acceso muy rápido por clave Persistencia en disco GUI para gestión del cluster Actualizaciones de SW sin parar la BD Mas escritura que lectura (logging) Cuando todos los componentes son Análisis tiempo real Aplicaciones con acceso de muy baja latenciaaplicacio nes con alta concurrencia y alta disponibilidad Online gaming (Zinga) En general, en el área de la computación distribuida Map se utiliza para fraccionar una operación compleja entre varios nodos y Fold/Reduce para recoger los resultados y unificarlos. Por su parte, los frameworks MapReduce toman la base de las operaciones mencionadas anteriormente para crear una operación genérica y más compleja, cuyo funcionamiento es realmente útil para las bases de datos NoSQL: en vez de usarse sobre listas de valores unidimensionales, ésta toma como parámetros entrantes una lista de tuplas de tipo (clave, valor) y devuelve una lista de valores. Entre las operaciones map (distribuida) y reduce (normalmente localizada) se genera una lista de tuplas (clave, valor) con valores temporales, de las que reduce filtra solamente las que tengan una determinada clave. En definitiva, MapReduce es fundamental en las bases de datos NoSQL para permitir la utilización de funciones de agregación de datos, ya que al carecer de esquema son mucho más complicadas que en las bases de datos relacionales clásicas RDBMS (Relational Database Management System ). RESULTADOS Y OBJETIVOS Resultados Obtenidos Se han publicado siete (7) trabajos de investigación en diferentes Congresos y Jornadas, y tres (3) trabajos de divulgación: un trabajo en el Symposium Internacional. La computadora contra el estigma de la discapacidad. Montevideo. 2009[26], otro trabajo en el Workshop de Investigadores en Ciencias de la Computación 2010 [1], otro en el WICC 2011 [8], dos (2) trabajos en el Congreso Argentino de Ciencias de la Computación 2010 [2] [3], otro en Perú [4] otro en V Seminario Internacional De legados y Horizontes para el Siglo XXI, 2010, organizado por RUEDA [4], y otro en el 1º Seminario Argentina Brasil de Tecnologías de la Información y la Computación [7]. El trabajo de divulgación es citado en [6]. También se ha desarrollado una tesina en Windows Azure, otra con Google AppEngine, otra PAGINA
5 sobre Eye OS, y tres basadas en aplicaciones para lengua de señas. Resultados Esperados El objetivo del grupo de investigación en esta línea, es la comparación en varios aspectos de las distintas Bases de Datos NoSql, y la integración de distintas tecnologías Open Source como las que propone Google. FORMACION DE RECURSOS HUMANOS El proyecto marco sobre el que se realizan las investigaciones comenzó 2010, las publicaciones y trabajos de divulgación se han desarrollado en colaboración con becarios y alumnos avanzados, como [1] [2] [3] [4] [5] [6] [7] [8]. Se desarrolló una beca de investigación de alumno avanzado sobre Mobile Cloud Computing y se está desarrollando otra sobre orquestación en servicios Web. Se aprobaron tres (3) tesinas de tecnicatura sobre el tema de lengua de señas, dos de ellas sobre plataforma móvil y la otra implementando servicios Web. Por otro lado también se han aprobado 3 (tres) tesinas de licenciatura sobre Cloud Computing, sobre distintas tecnologías como Windows Azure y Google App Engine, una de las cuales se integra con una plataforma móvil con el OS Android. Además se encuentra en desarrollo y se proyectan dos de licenciatura y otra de tecnicatura, y se espera realizar alguna tesis de maestría y aumentar el número de publicaciones. Por otro lado también se prevé la divulgación de varios temas investigados por medio de cursos de postgrado y actualización o publicaciones de divulgación. REFERENCIAS [1] Murazzo, Rodríguez. "Mobile Cloud Computing". WICC Calafate. Mayo [2] Murazzo, Millán, Rodríguez, Segura, Villafañe. Desarrollo de aplicaciones para Cloud Computing. CACIC Morón. Oct [3] Murazzo, Rodríguez, Millán, Segura y Villafañe."Plataformas Educativas Implementadas Con Cloud Computing". XVI Congreso Argentino de Ciencias de la Computación CACIC 2010, Workshop de Tecnologías Informáticas Aplicadas a la Educación. Morón. Oct [4]Murazzo, Rodríguez. "Una propuesta para el desarrollo de aplicaciones para Mobile Cloud Computing". Congreso Internacional de Computación y Telecomunicaciones COMTEL 2010, Lima, Perú. Oct [5] Millán, Murazzo, Rodríguez." Plataformas Educativas Implementadas Con Mobile Cloud Computing". V Seminario Internacional De legados y Horizontes para el Siglo XXI, organizado por RUEDA. Tandil. Sep [6] Rodríguez, Murazzo, Ene. "Cloud Computing". X Workshop de investigadores en Ciencias de la Computación y Sistemas de Información. San Juan. Mayo [7] Nelson R. Rodríguez, María A. Murazzo, Cecilia di Sciacio. "Integración de Computación móvil con Cloud Computing". 1º Seminario Argentina Brasil de Tecnologías de la Información y la Computación; bajo el lema "Las TIC como oportunidad de integración". Rosario Nov [8] Rodríguez, Chavez, Martin, Murazzo, Valenzuela. "Interoperabilidad en Cloud Computing". XII Workshop de investigadores en Ciencias de la Computación y Sistemas de Información. Rosario. Mayo [9]Rodríguez, Villafañe, Murazzo, Gallardo, Tarrachano. "GAE, una estrategia para complementar SaaS y PaaS a traves de la Web". 2do SABTIC. Tres de Maio, Brasil. Agosto BIBLIOGRAFIA CONSULTADA Antonopoulos- Gillan Cloud Computing Principles, Systems and Applications Springer LINK DE INTERES tml PAGINA
Metodología AGIL para el desarrollo SaaS
WICC 2012 577 Metodología AGIL para el desarrollo SaaS Susana Chavez1, Adriana Martín2, Nelson Rodríguez3, María Murazzo4, Adriana Valenzuela5 Departamento e Instituto de Informática - F.C.E.F. y N. -
Software Libre para Aplicaciones de Big Data
Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! [email protected] Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs
Conectores Pentaho Big Data Community VS Enterprise
Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com [email protected] Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community
BIG DATA. Jorge Mercado. Software Quality Engineer
BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino
Hadoop. Cómo vender un cluster Hadoop?
Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las
CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com
CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido
Integración de Computación Heterogénea con Hadoop para Cloud Computing
Integración de Computación Heterogénea con Hadoop para Cloud Computing Nelson Rodríguez 1, María Murazzo 2, Daniela Villafañe 3, Maximiliano Alves 4, Diego Medel 5 Departamento e Instituto de Informática
APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López
APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop
Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) [email protected]
Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) [email protected] Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento
Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica
Fundamentos Título de de Big la Data presentación utilizando MATLAB Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica 1 Agenda Qué es Big Data? Buenas prácticas en el manejo de memoria.
CLOUD & BIG DATA. Trabajando el CLOUD, explotando BIG DATA. Cómo pueden ayudarnos estas tecnologías?. Convivimos con ellas?.
CLOUD & BIG DATA Trabajando el CLOUD, explotando BIG DATA. Cómo pueden ayudarnos estas tecnologías?. Convivimos con ellas?. Índice. (I) Introducción. Qué es CLOUD. Tipos de CLOUD. Pública. Privada. Comunitaria.
Big Data. Rodolfo Campos http://www.smartcamp.es/~camposer/tecnocom/bigdata
Big Data Rodolfo Campos http://www.smartcamp.es/~camposer/tecnocom/bigdata Madrid, Mayo de 2013 Agenda 1. Introducción a Big Data. 1.1. Definición / Justificación 1.2. Casos de Uso 2. NoSQL 1.1. Orientadas
Microsoft SQL Server Conceptos.
Microsoft Conceptos. Microsoft 2005 es una plataforma de base de datos a gran escala de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP). La siguiente tabla muestra
Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source
Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Francisco Magaz Villaverde Consultor: Víctor Carceler Hontoria Junio 2012 Contenido Introducción Qué es Cloud Compu5ng?
PINOT. La ingestión near real time desde Kafka complementado por la ingestión batch desde herramientas como Hadoop.
PINOT Stratebi Paper (2015 [email protected] www.stratebi.com) Pinot es la herramienta de análisis en tiempo real desarrollada por LinkedIn que la compañía ha liberado su código bajo licencia Apache 2.0,
XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código
Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Ana María Bisbé York Servicios Profesionales [email protected] 916 638683 www.danysoft.com Abril 2015 Sala 1 SQL Server
Arquitectura de sistema de alta disponibilidad
Mysql Introducción MySQL Cluster esta diseñado para tener una arquitectura distribuida de nodos sin punto único de fallo. MySQL Cluster consiste en 3 tipos de nodos: 1. Nodos de almacenamiento, son los
Big Data y BAM con WSO2
Mayo 2014 Big Data y BAM con Leonardo Torres Centro Experto en SOA/BPM en atsistemas ofrece una completa suite de productos Open Source SOA y son contribuidores de muchos de los productos de Apache, como
acenswhitepapers Bases de datos NoSQL. Qué son y tipos que nos podemos encontrar
s Bases de datos NoSQL. Qué son y tipos que nos podemos encontrar Introducción Son muchas las aplicaciones web que utilizan algún tipo de bases de datos para funcionar. Hasta ahora estábamos acostumbrados
Guía de Laboratorio Base de Datos I.
Guía de Laboratorio Base de Datos I. UNIVERSIDAD DON BOSCO FACULTAD DE INGENIERIA 1- Gestión del SQL Server Management Studio y creación de bases de datos. Objetivos: Identificar el entorno de trabajo
App para realizar consultas al Sistema de Información Estadística de Castilla y León
App para realizar consultas al Sistema de Información Estadística de Castilla y León Jesús M. Rodríguez Rodríguez [email protected] Dirección General de Presupuestos y Estadística Consejería de Hacienda
Cloud Computing con herramientas libres para evaluación de modelos de despliegue híbrido
Cloud Computing con herramientas libres para evaluación de modelos de despliegue híbrido Nelson Rodríguez 1, Adriana Valenzuela 2, María Murazzo 3, Susana Chávez 4, Adriana Martín 5, Daniela Villafañe
Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema
Capítulo2 Planteamientodelproblema 38 2.1Antecedentesycontextodelproyecto En lo que respecta a los antecedentes del proyecto, se describe inicialmente el contexto donde se utiliza el producto de software.
Big Data con nombres propios
Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán
Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre.
Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Tema: Sistemas Subtema: Base de Datos. Materia: Manejo de aplicaciones
CURSOS DE VERANO 2014
CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET LA PLATAFORMA GOOGLE CLOUD PLATFORM. GOOGLE APP ENGINE Pedro A. Castillo Valdivieso Universidad de Granada http://bit.ly/unia2014
Capítulo 5. Cliente-Servidor.
Capítulo 5. Cliente-Servidor. 5.1 Introducción En este capítulo hablaremos acerca de la arquitectura Cliente-Servidor, ya que para nuestra aplicación utilizamos ésta arquitectura al convertir en un servidor
CAPITULO 8. Planeamiento, Arquitectura e Implementación
CAPITULO 8 Planeamiento, Arquitectura e Implementación 8.1 Replicación en SQL Server La replicación es un conjunto de tecnologías destinadas a la copia y distribución de datos y objetos de base de datos
Status Enterprise Guía de Usuario. Parte 7 Servidor Status
Guía de Usuario Parte 7 Contenidos 1 RESUMEN 1.1 Acerca de OPC UA... 3 1.2 Uso de Status... 3 1.3 Status como Plataforma... 4 1.4 Puertos de Comunicación... 4 2 SUBSISTEMAS... 5 2.1 Modelo de Datos...
SQL Diagnostic Manager Nueva versión 6.0
Página 1 de 6 SQL Diagnostic Manager Nueva versión 6.0 Página 2 de 6 Índice 1. ACCIONES DISPARADAS DESDE LAS ALERTAS...3 1.1. QUE GANA EL DBA CON TODO ESTO...4 2. NUEVA INTERFASE DE REPORTES....4 2.1.
LABORATORIO 10. COPIAS DE SEGURIDAD, RESTAURACIÓN Y RECUPERACIÓN DE UNA BD
LABORATORIO 10. COPIAS DE SEGURIDAD, RESTAURACIÓN Y RECUPERACIÓN DE UNA BD GUÍA DE LABORATORIO Nº 1O Actividad de Proyecto No. 12: ESTABLECER PLANES DE RESGUARDO, RESTAURACION Y CONTINGENCIA. Copias de
Bases de datos NoSQL. Hugo González Noviembre 17, 2011
Bases de datos NoSQL Hugo González Noviembre 17, 2011 http://geekandpoke.typepad.com/.a/6a00d8341d3df553ef0148c80ac6ef970c-800wi Qué es una Base de Datos? Una base de datos o banco de datos es un conjunto
The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO [email protected] @antoniosql
The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO [email protected] @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en
Base de datos relacional
Base de datos relacional Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para modelar problemas reales y administrar
Habilitando la empresa ágil a través de datos unificados La travesía hacia la plataforma de datos analítico-transaccionales
Habilitando la empresa ágil a través de datos unificados Agosto de 2015 Cómo se utilizan los datos hoy Los datos analíticos se derivan y separan a partir de datos transaccionales. Requieren bases de datos
CAPÍTULO 3: Resultados
CAPÍTULO 3: CAPÍTULO 3: RESULTADOS La meta de un proyecto de consolidación de servidores físicos o de virtualización, es la creación de las máquinas virtuales que sean capaces de ejecutar las aplicaciones
MÁSTER: MÁSTER EXPERTO BIG DATA
MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster
Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928
Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International
Curriculum Vitae: María A. Murazzo
Curriculum Vitae: María A. Murazzo 1. Datos Personales 1.1. E MAIL: marite@unsj cuim.edu.ar o [email protected] 2. Estudios Realizados 2.1. De Grado 2.1.1. Egresada de la Facultad de Ciencias Exactas,
Novedades en Q-flow 3.02
Novedades en Q-flow 3.02 Introducción Uno de los objetivos principales de Q-flow 3.02 es adecuarse a las necesidades de grandes organizaciones. Por eso Q-flow 3.02 tiene una versión Enterprise que incluye
Sistemas Escalables. Club de Investigación Tecnológica San José, Costa Rica. Theodore Hope
Sistemas Escalables Club de Investigación Tecnológica San José, Costa Rica Theodore Hope 22 de septiembre de 2009 Qué es? Escalabilidad La capacidad de dar servicio, con la misma calidad y con más recursos,
Diplomado en Big Data
160 horas Diplomado en Big Data BROCHURE, 2015 Contenido Quienes somos?... 3 Presentación del Programa... 4 Perfíl del Facilitador. 5 Objetivos.. 6 Información General.. 7 Plan de Estudio... 8-9 Plan de
ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1
ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones
FUENTES SECUNDARIAS INTERNAS
FUENTES SECUNDARIAS INTERNAS Las fuentes secundarias son informaciones que se encuentran ya recogidas en la empresa, aunque no necesariamente con la forma y finalidad que necesita un departamento de marketing.
LABORATORIO 10. ADMINISTRACIÓN DE COPIAS DE SEGURIDAD EN SQL SERVER
LABORATORIO 10. ADMINISTRACIÓN DE COPIAS DE SEGURIDAD EN SQL SERVER GUÍA DE LABORATORIO Nº 1O Actividad de Proyecto No. 12: ESTABLECER PLANES DE RESGUARDO, RESTAURACION Y CONTINGENCIA. Estructura de contenidos.
WEB APP VS APP NATIVA
WEB APP VS APP NATIVA Agosto 2013 Por Jesús Demetrio Velázquez 1 Ya decidió hacer su aplicación en Web App o App Nativa? Debido a que surgieron varias preguntas relacionadas con nuestro artículo Yo Mobile,
IBM Power Systems con Saytel. El motor para obtener información de valor de la forma más rápida
IBM Power Systems con Saytel El motor para obtener información de valor de la forma más rápida El motor para obtener información de valor de la forma más rápida Los nuevos requerimientos cloud, analítica,
BASE DE DATOS RELACIONALES
BASE DE DATOS RELACIONALES Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para implementar bases de datos ya
ING. YURI RODRIGUEZ ALVA
Historia y evolución de las Aplicaciones. Acerca de Cloud Computing o Computación para la Nube. Tipos de Aplicaciones para la Nube. Ventajas y desventajas de Cloud Computing Uso y Aplicaciones de Cloud
CATÁLOGO DE CURSOS. Centro de Prácticas y Capacitación Profesional
CATÁLOGO DE CURSOS Centro de Prácticas y Capacitación Profesional Actual Solutions Actual Solutions, con el objeto de brindar un mejor servicio y complementar el esfuerzo en la integración de soluciones
Presentación. 29/06/2005 Monografía de Adscripción 1
Presentación Alumno: Uribe, Valeria Emilce Profesor Director: Mgter. David Luis La Red Martínez. Asignatura: Diseño y Administración de Datos. Corrientes 2005. 29/06/2005 Monografía de Adscripción 1 MONOGRAFIA
ARQUITECTURA DE DISTRIBUCIÓN DE DATOS
4 ARQUITECTURA DE DISTRIBUCIÓN DE DATOS Contenido: Arquitectura de Distribución de Datos 4.1. Transparencia 4.1.1 Transparencia de Localización 4.1.2 Transparencia de Fragmentación 4.1.3 Transparencia
TEMA 3 PROFESOR: M.C. ALEJANDRO GUTIÉRREZ DÍAZ 2 3. PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS
1 1 BASES DE DATOS DISTRIBUIDAS TEMA 3 PROFESOR: M.C. ALEJANDRO GUTIÉRREZ DÍAZ 2 3. PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS 3.1 Metodología del procesamiento de consultas distribuidas 3.2 Estrategias de
La interoperabilidad se consigue mediante la adopción de estándares abiertos. Las organizaciones OASIS y W3C son los comités responsables de la
Servicios web Introducción Un servicio web es un conjunto de protocolos y estándares que sirven para intercambiar datos entre aplicaciones. Distintas aplicaciones de software desarrolladas en lenguajes
CAPÍTULO 5 IMPLEMENTACIÓN DEL SISTEMA
CAPÍTULO 5 IMPLEMENTACIÓN DEL SISTEMA Capítulo 7: Resultados y Trabajo a Futuro 5.1 Servidor Web Jakarta-Tomcat Para el desarrollo de un Sistema de Comercio Electrónico (SCE) se uso un servidor Web compatible
Seminario de Informática. Modulo V: Bases de Datos Elementos Conceptuales
Seminario de Informática Modulo V: Bases de Datos Elementos Conceptuales 1 Bases de Datos: Concepto Conjunto exhaustivo no redundante de datos estructurados, organizados independientemente de su utilización
UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA
UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA Estudio de las herramientas TOAD y DBArtisan para la administración e integración de bases de datos relacionales. PREVIA OPCION AL TÍTULO DE: INGENIERO
PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE
PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,
INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer
INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,
INTELIGENTE Y VERSÁTIL
INTELIGENTE Y VERSÁTIL ADMINISTRACIÓN DE ACTIVOS DE TI Cada día nos vemos más inmersos en la necesidad de acceder a nuestras aplicaciones de trabajo, como correo, CRM, ERP entre otras. Hoy la movilidad
Sistemas de Información II Tema 1. El enfoque de bases de datos
Sistemas de Información II Tema 1. El enfoque de bases de datos Bibliografía: Elmasri y Navathe: Fundamentos de Sistemas de Bases de Datos 3ª edición, 2002 (Capítulo 1). Carlos Castillo UPF 2008 1 De qué
Asignación de Procesadores
INTEGRANTES: Asignación de Procesadores Un sistema distribuido consta de varios procesadores. Estos se pueden organizar como colección de estaciones de trabajo personales, una pila pública de procesadores
PERFIL TÉCNICO CONSULTOR SHAREPOINT PARA LA WEB
PLIEGO DE PRESCRIPCIONES TÉCNICAS PARA LA CONTRATACIÓN DE LA CONSULTORÍA Y ASISTENCIA PARA LOS PROYECTOS WEB EN EL TRIBUNAL CONSTITUCIONAL PERFIL TÉCNICO CONSULTOR SHAREPOINT PARA LA WEB 1 Índice Antecedentes...
Estrategia de Cómputo en la Nube. Servicios en la Nube
Estrategia de Cómputo en la Nube Servicios en la Nube Computación para la Nube? Tecnología informática por la que se proporcionan software y servicios a través de la Internet. El nombre Cloud Computing
SQL Server Business Intelligence parte 1
SQL Server Business Intelligence parte 1 Business Intelligence es una de las tecnologías de base de datos más llamativas de los últimos años y un campo donde Microsoft ha formado su camino a través de
Cocinando con Big Data
Cocinando con Big Data Javier Sánchez BDM Big Data [email protected] 91.300.51.09 21/11/2013 Javier Sánchez 1 Agenda Qué es Big Data? Receta Punto de Partida Para qué Big Data? Conclusiones 21/11/2013
Entendiendo y Optimizando MySQL
Grupo de Usuarios de Linux Universidad Carlos III de Madrid. 10 de Noviembre de 2010 Indice Arquitectura 1 Arquitectura 2 3 4 5 Arquitectura Sistema de Gestión de Bases de Datos. GPL. Escrito en C y C++.
1º CFGS ASIR IMPLANTACIÓN DE SISTEMAS OPERATIVOS
1º CFGS ASIR IMPLANTACIÓN DE SISTEMAS OPERATIVOS OBJETIVOS La formación del módulo contribuye a alcanzar los objetivos generales de este ciclo formativo que se relacionan a continuación: a. Analizar la
Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones
UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración
1. Introducción: Qué es la Gestión Documental-TI o Gestor Documental?
1. Introducción: Qué es la Gestión Documental-TI o Gestor Documental? Es un tipo de Software o portal para la gestión de conocimiento en una Organización u empresa que se basa principalmente en la administración
Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas. Un ejemplo práctico: Plataforma de Archivo electrónico
Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas Un ejemplo práctico: Plataforma de Archivo electrónico Índice 1. Presentación del proyecto 2. Objetivos del proyecto 3.
Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida
Resumen de la conferencia Día 5-6-2012 17:00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida Ponente: Luis Muñiz Socio Director de Sisconges & Estrategia y experto en Sistemas
SISTEMAS DE INFORMACIÓN II TEORÍA
CONTENIDO: EL PROCESO DE DISEÑO DE SISTEMAS DISTRIBUIDOS MANEJANDO LOS DATOS EN LOS SISTEMAS DISTRIBUIDOS DISEÑANDO SISTEMAS PARA REDES DE ÁREA LOCAL DISEÑANDO SISTEMAS PARA ARQUITECTURAS CLIENTE/SERVIDOR
Conceptos básicos Oracle 10g Introducción - Administración de Oracle - Orasite.com
1. Objetivos El objetivo de este artículo es describir brevemente los siguientes conceptos básicos a modo de familiarización con las bases de datos ORACLE. - Describir brevemente en qué consiste el modelo
Popularidad comparada de PHP vs ASP, y posibles causas
Popularidad comparada de PHP vs ASP, y posibles causas PHP y ASP Quienes son? PHP significa Hypertext Preprocessor. PHP se originó como una herramienta de scripting que se ha dado de forma rápida a través
Curso de HTML5 y CSS3
Todos los Derechos Reservados Global Mentoring Experiencia y Conocimiento para tu Vida 1 1 Todos los Derechos Reservados Global Mentoring Experiencia y Conocimiento para tu Vida 2 2 Uno de los principales
Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM
Soluciones innovadoras para optimizar su infraestructura TI Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM Características principales Tenga éxito en su negocio simplemente con
MASTER CLASS. Curso de Introducción MongoDB. Juan Manuel Parrilla. Consultor de Amaris en Telefónica I+D. Release Engineer * FUENTE DE DOCUMENTACIÓN :
MASTER CLASS Curso de Introducción MongoDB Juan Manuel Parrilla Consultor de Amaris en Telefónica I+D Release Engineer * FUENTE DE DOCUMENTACIÓN : 2 ÍNDICE Qué es MongoDB? Porqué usar MongoDB? Ventajas
2.1 Multibase. Información mas detallada sobre este sistema se encuentra en [Ceri y Pelagatti 1985].
1 Colección de Tesis Digitales Universidad de las Américas Puebla Alvarez Carrión, Guillermo La necesidad de llevar a cabo la integración de BDC s, con problemas de heterogeneidad, ha llevado a diversos
Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva
de la solución SAP SAP Technology SAP Afaria Gestión de la movilidad empresarial para mayor ventaja competitiva Simplificar la gestión de dispositivos y aplicaciones Simplificar la gestión de dispositivos
UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA
UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA Historia del Arte: El Big Data o Datos Masivos se refieren a sistemas informáticos basados en la acumulación a gran escala de datos y
INTRODUCCIÓN. El propósito de esta investigación es analizar la importancia que ha surgido en
INTRODUCCIÓN El propósito de esta investigación es analizar la importancia que ha surgido en los sistemas de costos ABC para las empresas de Servicios Mexicanas, ya que este sector forma una parte muy
Facultad Politécnica UNA Ing. Julio Paciello [email protected]
Facultad Politécnica UNA Ing. Julio Paciello [email protected] Contenidos Clúster de Investigación Aplicada Proyectos HPC Clúster Hadoop para tecnologías de BI Una nube privada para la Administración
ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC
ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC RESUMEN EJECUTIVO Es un método ideal para que cualquier departamento de TI logre realizar respaldos y restauraciones más rápidas
Anexo 4 Documento de Arquitectura
Anexo 4 Documento de Arquitectura 1. Introducción El anexo se describe el propósito y alcance referentes al proyecto correspondiente al documento de arquitectura. 2. Propósito El propósito del anexo de
Cloud Computing. Huibert Aalbers Senior Certified Executive IT Architect
Cloud Computing Huibert Aalbers Senior Certified Executive IT Architect Cloud Computing Orígenes y Visión Soluciones actuales Grid interno Soluciones de infraestructura App engines Utility Computing Este
TEMA 2: CAPACIDAD: Diseño del Servicio TI Anexo II: Amazon EC2
CIMSI Configuración, Implementación y Mantenimiento de Sistemas Informáticos TEMA 2: CAPACIDAD: Diseño del Servicio TI Anexo II: Amazon EC2 Daniel Cascado Caballero Rosa Yáñez Gómez Mª José Morón Fernández
Maxpho Commerce 11. Gestión CSV. Fecha: 20 Septiembre 2011 Versión : 1.1 Autor: Maxpho Ltd
Maxpho Commerce 11 Gestión CSV Fecha: 20 Septiembre 2011 Versión : 1.1 Autor: Maxpho Ltd Índice general 1 - Introducción... 3 1.1 - El archivo CSV... 3 1.2 - Módulo CSV en Maxpho... 3 1.3 - Módulo CSV
FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto
Modulo VI - Base de datos en Microsoft SQL Server Unidad -1
Unidad 1 MODULO VI Microsoft SQL Server Es un sistema para la gestión de bases de datos creado por Microsoft, el mismo se basa en el modelo relacional. Sel Server utiliza como lenguajes de consulta T-SQL
ArquitecturaTécnica de TRAVEL OPEN APPS. Breve definición técnica de la plataforma Travel Open Apps
ArquitecturaTécnica de TRAVEL OPEN APPS Breve definición técnica de la plataforma Travel Open Apps Contenido 1. CONTENIDO GLOBAL DEL PROYECTO... 1 a. CRS + CHANNEL MANAGER... 1 b. MANAGEMENT SYSTEM...
ACTIVIDAD No. 2 REPASO DE REDES INFORMATICAS
ACTIVIDAD No. 2 REPASO DE REDES INFORMATICAS GRADO 11 Nombre(s) y Apellidos: Angie Karolinne Pinilla Castro Documento: 97032416270 FICHA NÚMERO : 2 COLEGIO : Instituto Madre del Buen Consejo FECHA: 23/04/2014
POR QUÉ NUESTRO FRAMEWORK DE DESARROLLO DWPORTAL/APP?
POR QUÉ NUESTRO FRAMEWORK DE DESARROLLO DWPORTAL/APP? En los proyectos de desarrollo de software se busca la forma de mejorar la calidad en el análisis de requerimientos y obtener tiempos efectivos de
Suite Open Source de CRM y GroupWare Características Funcionales
hipergate Suite Open Source de CRM y GroupWare Características Funcionales hipergate Introducción hipergate es una suite de aplicaciones basadas en web. La misión del producto es cubrir las necesidades
UNICLASS ACTIVOS FIJOS LA SOLUCIÓN ANALÍTICA BASADA EN UN MODELO DE BUSINESS INTELLIGENCE
UNICLASS ACTIVOS FIJOS LA SOLUCIÓN ANALÍTICA BASADA EN UN MODELO DE BUSINESS INTELLIGENCE UN PRODUCTO DE DISTRIBUIDO POR T&G LA SOLUCIÓN QUE ANALIZA LOS PROCESOS DE SU NEGOCIO MÁS DIMENSIONALIDAD EN LOS
ESPECIALISTA EN BASE DE DATOS
ESPECIALISTA EN BASE DE DATOS EXPERTO ANALISIS Y DISEÑO DE BASE DE DATOS EN MANEJAR BASES DE ACCESS COMPLETO DATOS MYSQL Requisito: Manejo Windows POSTGRESQL DURACION: 3 MESES DE L-V SQL SERVER Cliente-Administración
